Использование нейросетей для анализа звуковой информации


Обучение системы с одним эффектором


Входные данные:

Система анализа речи со следующими параметрами:

+Конфигурация нейросети

    Число входов: 10

    Нейронов во входном слое: 10

    Нейронов в символьном слое: 6

    Эффекторов: 1

    +Эффекторы

        +EF0

            Тип: Частота форманты



            Индекс: 0

            Min: 100.0000

            Max: 5000.0000

    +Скорости обучения

        alpha0: 0.0500

        alpha1: 1.6000

        alpha2: 0.1000

        alpha3: 0.5010

+Модель синтеза

    Частота основного тона: 115

    Частота шума: 5000.0000

    Четкость шума: 0.0500

    Число формант: 1

    +Форманты

        +F0

            Частота: 4048.8281

            Четкость: 1.0000

            Воздействие: 1.0000

+Алфавит

    S0='а'

    S1='б'

    S2='в'

    S3='г'

    S4='д'

    S5='?'

Обучающая выборка: звуковой файл tones.wav с записанными чистыми тонами 100, 500, 1000, 2000, 4000 Гц и текстовый файл, в котором каждому тону соответствует буквы алфавита а,б,в,г,д.

(cистема сохранена как /Exp/Exp1/один эффектор.sas)

Цель эксперимента:

Проверить способность обучения системы синтезу в простейшем случае  - с одним эффектором. Эффектор управляет частотой единственной форманты.

Ход эксперимента:

Сначала проводилось обучение на примерах – только звук. При этом в слое Кохонена сформировались нейронные ансамбли для каждого звука. Наблюдался хорошая упорядоченность полученной одномерной карты признаков.

Затем проводилось обучение на примерах – звук и текст. При этом установились правильные связи между нейронами слоя Кохонена и нейронами символьного слоя.

Затем проводилось обучение синтезу. В результате в эффекторном слое  установились правильные связи с символьным слоем.

Результат:

Система успешно обучилась синтезу – синтезируемые звуки в точности соответствуют  тонам из обучающей выборки (рис. 18):

Результат обучения синтезу чистых тонов

Обучающая выборка

Результат синтеза

Рис. 18

Выводы:

Используемый алгоритм стохастического обучения синтезу хорошо работает в случае малого числа эффекторов. Введение обратной связи  в систему позволяет обучаться синтезу при отсутствии обучающей выборки.



Содержание раздела