Дипломная работа: Разработка программного обеспечения для голосового управления трехмерными моделями функционирования промышленных роботов
Преобразование вида и моделирование сложно связаны в OpenGL и в действительности
объединены в одну матрицу видового преобразования (modelview matrix). Существуют три
подпрограммы OpenGL для
преобразований модели: glTranslate(),
glRotate(), glScale(). Эти
подпрограммы выполняют преобразование объекта (или системы координат) с помощью
его параллельного переноса (moving),
поворота (rotating),
растягивания (stretching), сжатия (shrinking) или зеркального отражения
(reflecting). Все
три команды эквивалентны созданию соответствующей матрицы параллельного
переноса (translation), поворота
(rotation) или
масштабирования {scaling),
а затем вызову команды glMultMatrixQ с этой матрицей в
качестве аргумента. Однако использование этих трех подпрограмм должно быть
быстрее использования команды glMultMatrixQ.
OpenGL автоматически вычисляет эти матрицы для
пользователя [17].
Все преобразования в программе
осуществлены с помощью указанных подпрограмм.
Ниже приведена функция, обеспечивающая моделирование
функционирования промышленного робота.
void
CMain::OnOpenGLFirst()
{glPushMatrixQ;
glTranslatef(k*per,-3.0,0.0);
glRotatef(360.0*
vspos/100,0,1,0);
glRotatef(l 80,0,0,1);
glLineWidth(2.0);
glPushMatrix();
glRotatef(90.0,1.0,0.0,0.0);
glColor3f(0.0,0.0,1.0);
auxWireCone(1.5,1.0);
glPopMatrix();
glTranslatef(0.0,-l.0,0.0);
glColor3f(0.0,0.5,0.5);
auxWireCylinder(0.6,4.0);
glPushMatrix();
glTranslatef(0.0,-3.0,0.0);
glRotatef(90.0,1.0,0.0,0.0);
glColor3f(l.0,0.0,0.0);
auxWireCylinder(0.6,2.0);
glRotatef(180.0*hspos/100,0.0,1.0,0.0);
glTranslatef(l.0,0.5,0.0); (3.3)
Прежде всего, перемещаем
сцену. Далее
задаём вращение вокруг оси ъ. Задаём
переменную, которая будет обеспечивать перемещение робота согласно голосовым
командам. Запоминаем положение основы робота. Строим его основу – конус,
поднимаемся к его вершине. Строим колонну робота и перемещаемся к её вершине,
поворачиваемся на 90 градусов относительно оси х. Строим цилиндр –
крепление плеча. Задаём движение
плеча горизонтальной прокруткой. Перемещаемся в конец крепления
плеча и создаём плечо –- строим призму. Перемещаемся к её концу, поворачиваемся
на 90 градусов и создаём цилиндр – локоть. Далее после перемещения к концу
этого цилиндра строим призму – основание схвата, поворачиваемся на 90 градусов
и строим первый и второй пальцы.
Результат моделирования робота приведен на рис. 3.1

Рисунок 3.1 Результат моделирования функционирования промышленного
робота
Выводы
Организация управления промышленными роботами (ПР) продолжает
оставаться актуальной задачей робототехники. Управление роботами реализуется
различными способами. К ним относятся: управление при помощи пультов ручного
управления, командное управление от управляющих компьютеров, дистанционное
управление при помощи внешних вычислительных систем. С точки зрения повышения
эффективности обучения ПР одним из наиболее перспективных способов является
голосовое управление.
Во время написания магистерской аттестационной работы были
проанализированы методы цифровой обработки звуковых сигналов и их использование
в системах распознавания речи, выполнен анализ цифровой фильтрации и
особенностей акустической фонетики и её учёт при обработке цифровых сигналов.
В работе рассмотрены гомоморфная обработка речи, кодирование речи
на основе линейного предсказания и цифровая её обработка в системах речевого
общения человека с машиной, особенности различных систем распознавания речи.
Первоначальной задачей являлось создание интерфейса записи и
воспроизведения звукового сигнала. Это было выполнено с использованием
встроенной библиотеки mmsystem операционной системы Windows. Далее были
добавлены функции, обеспечивающие обработку записанного сигнала: выделение
вокализованных участков речи, взвешивание коэффициентов дискретного сигнала с
помощью окна Хэмминга, преобразование Фурье, фильтрация, обратное
преобразование Фурье, а также клиппирование и вычисление кепстра.
На основании проведенного анализа сигнала создана функция
распознавания слова-команды. При помощи графической библиотеки OpenGL была
обеспечена визуализация выполнения трёхмерной моделью ПР
распознанной голосовой команды. Применение библиотеки OpenGL
позволяет моделировать любой из как уже существующих, так и разрабатываемых видов
ПР.
Сложность решаемой задачи обуславливалась тем, что даже один и тот
же человек не может два раза произнести одно и то же слово абсолютно одинаково
и возникает разница в скорости произнесения слова и амплитуде звукового
смгнала. При этом возникает необходимость выделения зависимости фонем
(сочетания элементарных звуков), присущих одному слову, а потом описания этих
зависимостей в виде, понятном для распознавания. Выделение этих зависимостей -
является достаточно сложно реализуемой задачей.
Основным достоинством программы является её независимость от
оператора: при условиях достаточно чёткого произношения команды, пол и возраст
диктора не имеет влияния на распознавание слова. Её применение целесообразно
для адаптации промышленного робота к условиям производственной среды, а также
для создания информационного потока управления роботом. Возможными
перспективами улучшения программы являются увеличение словаря, добавление
возможности обучения и улучшение гибкости цифрового представления звукового
сигнала.
Перечень ссылок
1.
Рабинер Л. Р., Шафер Р. В. Цифровая обработка
речевых сигналов: Пер. с англ./Под ред. М. В. Назарова и Ю. Н. Прохорова. - М.:
Радио и связь, 1981.-496 с.
2.
Рабинер Л. Р., Гоулд Б. Теория и применение
цифровой обработки сигналов: Пер. с англ./Под ред. Александрова Ю. Н. - М.:
Мир, 1978. -848 с.
3.
А. V. Oppenhehn
and R. W. Schafer, Digital Signal Processing,, Prentice-Hall, Inc., Englewood
Cliffs, N.J., 1975. - 436 p.
4.
A. Peled and B. Liu,
Digital Signal Processing. Theory, Design and Implementation, John Wiley and
Sons.New York, 1976. - 675 p.
5.
J. W. Cooley and J. W.
Tukey, "An Algorithm for the Machine Computation of Complex
Fourier.Series," Math Computation, Vol. 19, 1965. - 452 p.
6.
Бондарев В. H., Трёстер Г., Чернега В. С.
Цифровая обработка сигналов: методы и средства. Учеб. Пособие для вузов. 2-е
изд. - X.: Конус, 2001. -398 с.
7.
Марпл С. Л. Цифровой спектральный анализ и его
приложения. - М.: Мир, 1990.-584 с.
8.
Бендат Дж., Пирсол А. Применения корреляционного
и спектрального анализа. -М.: Мир, 1983. -312 с.
9.
Гольденберг Л. М., Матюшкин Б. Д., Поляк М. Н.
Цифровая обработка сигналов: Справочник. -М.: Радио и связь, 1985. - 312 с.
10. Гутников
В. С. Фильтрация измерительных сигналов. - Л.: Энергоатомиздат, Ленингр.
отд-ние, 1990. - 192 с.
11. J. Н. McClellan, Т. W. Parks, and L. R. Rabiner, "A Computer Program for
Designing Optimum FIR Linear Phase Digital Filters," IEEE Trans. Audio
and Electro acoustics, Vol. AU-21, 1973. - 347 p.
12. Цифровые
фильтры в электросвязи и радиотехнике/ А. В. Брунченко, Ю.Г. Бутыльский, Л. М.
Гольденберг и др.: под ред. Л. М. Гольденберга.
-
M.: радио и связь, 1982. - 224 с.
13. J. L. Ftanagan, С. H. Coker, L. R. Rabiner, R. W. Schafer, and N. Umeda,
"Synthetic Voices for Computers," IEEE Spectrum, Vol. 7, No. 10,
October 1970.-536 p.
14. MFC
и Visual С++. Энциклопедия программиста: Пер. с англ./ Юджин Олафсен, Кенн
Скрайбнер, К. Дэвид Уайт и др. - СПб.: ООО «ДиаСофтЮП», 2004. - 992с.
15. Шилдт
Герберт. MFC: основы программирования. - К.: Издательская группа BHV, 1997. -
560 с.
16. Тихомиров
Ю.В. OpenGL. Программирование трехмерной графики. -СПб.: БХВ-Петербург,
2002.-304 с.
17. OpenGL.
Официальное руководство программиста: Пер. с англ. / Мейсон By, Джеки Нейдер,
Том Девис, Дейв Шрайнер. - СПб: ООО «ДиаСофтЮП», 2002. - 592 с.
Приложение А. Элементы текстов программного кода
// recorddlh: header file
class CRecordDlg;
class CRecDlgNotifyObj:
public CWaveNotifyObj {public:
CRecDlgNotifyObjO;
-CRecDlgNotifyObjO; void Attach(CRecordDlg* pDlg) {m_pDlg = pDlg;}
virtual void
NewData(CWave *pWave, CWaveBIock* pBlock);
virtual void
EndPlayback(CWave *pWave);
CRecordDlg* m_pDlg;};
class CFilterDlg. public
CDialog
{public. CWaveOutDevice*
m_pOutDev;
CFilterDlg(CWnd* pParent
= NULL);
enum { IDD =
IDD_FILTERDLG };
protected:
virtual void
DoDataExchange(CDataExchange* pDX); protected:
afxmsg void OnFilter();
DECLAREMESSAGEMAPOJ; class CRecordDlg: public CDialog {public:
CRecordDlg(CWnd* pParent
= NULL); ~CRecordDlg();
void NewData(CWave
*pWave, CWaveBIock* pBlock);
void EndPlayback(CWave
*pWave);
enum { IDD =
IDD_RECORDDLG };
CButtonmbtnOpenData;
CComboBox mcbSource;
CComboBox mcbFormat;
CStatic mwndFrame;
CButton mbtnPause;
CButton mbtnPlay;
CButton mbtnRecord;
CButton mbtnOK;
CButton mbtnStop;
CString mstrFormat;
CString m_strSource;
public:
void UDdatdTJClientDC
*curDC>:
CFilterDIg* m_pFUter;
CWave* m_pWave; private:
enum MODE {IDLE,
SAMPLING,PLAYTNG,RECORDING,OPEN };
CVUMeter m_VU;
int mJNumDevs;
WAVEINCAPS* m_pDevCaps;
CWavelnDevice mlnDev;
CWave mSampleWave;
CRecDlgNotifyObj
m_NotifyObj;
int mJMode;
void FillDeviceList();
void FillFormatListQ;
void SetMode(MODE m);
Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 |