Обучение системы с одним эффектором
Входные данные: | Система анализа речи со следующими параметрами:
+Конфигурация нейросети Число входов: 10 Нейронов во входном слое: 10 Нейронов в символьном слое: 6 Эффекторов: 1 +Эффекторы +EF0 Тип: Частота форманты Индекс: 0 Min: 100.0000 Max: 5000.0000 +Скорости обучения alpha0: 0.0500 alpha1: 1.6000 alpha2: 0.1000 alpha3: 0.5010 +Модель синтеза Частота основного тона: 115 Частота шума: 5000.0000 Четкость шума: 0.0500 Число формант: 1 +Форманты +F0 Частота: 4048.8281 Четкость: 1.0000 Воздействие: 1.0000 +Алфавит S0='а' S1='б' S2='в' S3='г' S4='д' S5='?' Обучающая выборка: звуковой файл tones.wav с записанными чистыми тонами 100, 500, 1000, 2000, 4000 Гц и текстовый файл, в котором каждому тону соответствует буквы алфавита а,б,в,г,д. (cистема сохранена как /Exp/Exp1/один эффектор.sas) |
Цель эксперимента: | Проверить способность обучения системы синтезу в простейшем случае - с одним эффектором. Эффектор управляет частотой единственной форманты. |
Ход эксперимента: | Сначала проводилось обучение на примерах – только звук. При этом в слое Кохонена сформировались нейронные ансамбли для каждого звука. Наблюдался хорошая упорядоченность полученной одномерной карты признаков.
Затем проводилось обучение на примерах – звук и текст. При этом установились правильные связи между нейронами слоя Кохонена и нейронами символьного слоя. Затем проводилось обучение синтезу. В результате в эффекторном слое установились правильные связи с символьным слоем. |
Результат: | Система успешно обучилась синтезу – синтезируемые звуки в точности соответствуют тонам из обучающей выборки (рис. 18):
Результат обучения синтезу чистых тонов Обучающая выборка Результат синтеза Рис. 18 |
Выводы: | Используемый алгоритм стохастического обучения синтезу хорошо работает в случае малого числа эффекторов. Введение обратной связи в систему позволяет обучаться синтезу при отсутствии обучающей выборки. |