دورية أكاديمية

КЛАСТЕРИЗАЦИЯ ПОЛЬЗОВАТЕЛЕЙ ПО ГОЛОСУ С ПОМОЩЬЮ УЛУЧШЕННЫХ САМООРГАНИЗУЮЩИХСЯ РАСТУЩИХ НЕЙРОННЫХ СЕТЕЙ

التفاصيل البيبلوغرافية
العنوان: КЛАСТЕРИЗАЦИЯ ПОЛЬЗОВАТЕЛЕЙ ПО ГОЛОСУ С ПОМОЩЬЮ УЛУЧШЕННЫХ САМООРГАНИЗУЮЩИХСЯ РАСТУЩИХ НЕЙРОННЫХ СЕТЕЙ
المؤلفون: В.Н. Вагин, В.А. Ганишев
بيانات النشر: Закрытое акционерное общество Научно-исследовательский институт "Центрпрограммсистем"
سنة النشر: 2015
المجموعة: CyberLeninka (Scientific Electronic Library) / Научная электронная библиотека «Киберленинка»
مصطلحات موضوعية: адаптация, временные ряды, выделение признаков, кластеризация, мел-частотные кепстраль-ные коэффициенты, обучение без учителя, обучение на этапе функционирования нейронной сети, растущие нейрон-ные сети, adaptation, feature extraction, feature matching, incremental neural network, lifetime learning, mel frequency cepstral coefficients (MFCC), speaker clustering, speaker diarization, time series, unsupervised learning
الوصف: В данной работе рассматривается применение метода обучения без учителя на основе самоорганизующихся рас-тущих нейронных сетей для задачи кластеризации пользователей по голосу. В качестве модели пользователя в статье используется набор мел-частотных кепстральных коэффициентов. Данный набор получается путем применения фильтра специального вида к частоте звукового сигнала, переведенной в мел-частотную шкалу. Основным отличием данной работы является учет динамики изменения мел-частотных кепстральных коэффициентов, которая также со-держит информацию о пользователе. Возможность появления новых уникальных пользователей в процессе функционирования системы делает невоз-можным использование многих классов нейронных сетей, так как обучение сети на новом наборе данных приведет к нарушению функционирования, «забыванию» результатов предыдущего обучения. Нейронные сети для интерактив-ного обучения накладывают ограничение на максимальное количество кластеров, которое неизвестно для данной за-дачи, и в общем случае требуют некоторого априорного знания входных данных (для установления пороговых зна-чений и т.д.), которое сложно обеспечить на практике. Самоорганизующиеся растущие нейронные сети позволяют производить обучение на этапе всего функционирования системы, не требуют априорных знаний ни о пользовате-лях, ни об их количестве. Динамическая структура нейронной сети позволяет создавать неограниченное число новых кластеров при появлении новых уникальных пользователей. Таким образом, данный метод позволяет построить гиб-кую систему кластеризации пользователей по голосу, адаптирующуюся под изменяющиеся входные данные. ; The paper describes the use of an unsupervised learning method based on self-organizing incremental neural networks for the problem of speaker clustering. I uses a set of mel-frequency cepstral coefficients as a user model. This set is obtained by applying a special filter to the sound signal frequency, which was transferred into the mel-frequency scale ("mel is an abbreviation of “melody”). The main difference ...
نوع الوثيقة: text
وصف الملف: text/html
اللغة: unknown
الإتاحة: http://cyberleninka.ru/article/n/klasterizatsiya-polzovateley-po-golosu-s-pomoschyu-uluchshennyh-samoorganizuyuschihsya-rastuschih-neyronnyh-seteyTest
http://cyberleninka.ru/article_covers/15936278.pngTest
رقم الانضمام: edsbas.7072E59C
قاعدة البيانات: BASE