Систему определения эмоций по голосу создали в ВШЭ

Систему определения эмоций по голосу создали в ВШЭ

Автоматическую систему определения эмоций по звуку голоса, которая в 70% случаев распознает восемь различных интонаций, создали специалисты нижегородского филиала Высшей школы экономики.
Сперва ученые с помощью спектрограмм преобразовали звук в изображение, в результате чего компьютер смог применять к цифровым аудиоданным те же методы обработки, что и для распознавания изображений. Анализ спектрографических данных проводила сверточная нейронная сеть глубокого обучения с архитектурой VGG-16.

В результате, система научилась определять по звуку голоса злость, грусть, спокойствие, нейтральность, счастье, испуг, удивление или отвращение. С больше точностью система распознавала нейтральные и спокойные интонации, а, например, счастье в некоторых случаях путала со страхом или печалью, а удивление — с отвращением, говорится в сообщении на сайте Национального исследовательского университета ВШЭ.

Исследователи считают, что эмоциональная составляющая высказывания упускается компьютером из виду, тогда как, меняя интонацию, человек придает одним и тем е словам разное и даже противоположное значение.