دورية أكاديمية
КЛАСТЕРИЗАЦИЯ ПОЛЬЗОВАТЕЛЕЙ ПО ГОЛОСУ С ПОМОЩЬЮ УЛУЧШЕННЫХ САМООРГАНИЗУЮЩИХСЯ РАСТУЩИХ НЕЙРОННЫХ СЕТЕЙ
العنوان: | КЛАСТЕРИЗАЦИЯ ПОЛЬЗОВАТЕЛЕЙ ПО ГОЛОСУ С ПОМОЩЬЮ УЛУЧШЕННЫХ САМООРГАНИЗУЮЩИХСЯ РАСТУЩИХ НЕЙРОННЫХ СЕТЕЙ |
---|---|
المؤلفون: | В.Н. Вагин, В.А. Ганишев |
بيانات النشر: | Закрытое акционерное общество Научно-исследовательский институт "Центрпрограммсистем" |
سنة النشر: | 2015 |
المجموعة: | CyberLeninka (Scientific Electronic Library) / Научная электронная библиотека «Киберленинка» |
مصطلحات موضوعية: | адаптация, временные ряды, выделение признаков, кластеризация, мел-частотные кепстраль-ные коэффициенты, обучение без учителя, обучение на этапе функционирования нейронной сети, растущие нейрон-ные сети, adaptation, feature extraction, feature matching, incremental neural network, lifetime learning, mel frequency cepstral coefficients (MFCC), speaker clustering, speaker diarization, time series, unsupervised learning |
الوصف: | В данной работе рассматривается применение метода обучения без учителя на основе самоорганизующихся рас-тущих нейронных сетей для задачи кластеризации пользователей по голосу. В качестве модели пользователя в статье используется набор мел-частотных кепстральных коэффициентов. Данный набор получается путем применения фильтра специального вида к частоте звукового сигнала, переведенной в мел-частотную шкалу. Основным отличием данной работы является учет динамики изменения мел-частотных кепстральных коэффициентов, которая также со-держит информацию о пользователе. Возможность появления новых уникальных пользователей в процессе функционирования системы делает невоз-можным использование многих классов нейронных сетей, так как обучение сети на новом наборе данных приведет к нарушению функционирования, «забыванию» результатов предыдущего обучения. Нейронные сети для интерактив-ного обучения накладывают ограничение на максимальное количество кластеров, которое неизвестно для данной за-дачи, и в общем случае требуют некоторого априорного знания входных данных (для установления пороговых зна-чений и т.д.), которое сложно обеспечить на практике. Самоорганизующиеся растущие нейронные сети позволяют производить обучение на этапе всего функционирования системы, не требуют априорных знаний ни о пользовате-лях, ни об их количестве. Динамическая структура нейронной сети позволяет создавать неограниченное число новых кластеров при появлении новых уникальных пользователей. Таким образом, данный метод позволяет построить гиб-кую систему кластеризации пользователей по голосу, адаптирующуюся под изменяющиеся входные данные. ; The paper describes the use of an unsupervised learning method based on self-organizing incremental neural networks for the problem of speaker clustering. I uses a set of mel-frequency cepstral coefficients as a user model. This set is obtained by applying a special filter to the sound signal frequency, which was transferred into the mel-frequency scale ("mel is an abbreviation of “melody”). The main difference ... |
نوع الوثيقة: | text |
وصف الملف: | text/html |
اللغة: | unknown |
الإتاحة: | http://cyberleninka.ru/article/n/klasterizatsiya-polzovateley-po-golosu-s-pomoschyu-uluchshennyh-samoorganizuyuschihsya-rastuschih-neyronnyh-seteyTest http://cyberleninka.ru/article_covers/15936278.pngTest |
رقم الانضمام: | edsbas.7072E59C |
قاعدة البيانات: | BASE |
الوصف غير متاح. |