- Исследователи разработали «словарь нового поколения» для обучения нейросетей распознаванию человеческих эмоций.
- Датасет включает 909 видеофрагментов с оценками по шести эмоциям в четырех форматах.
- Интонация не является главным фактором для понимания эмоций, люди лучше распознают эмоции при чтении текста и просмотре видео.
- Датасет уже применяется в реальных проектах, например, для анализа отзывов и создания чат-бота для Эрмитажа.
- Разработанный инструмент позволяет оценить качество существующих систем автоматического распознавания эмоций.
- Текстовые модели показали лучшую точность, аудиальные - среднюю, а анализ мимики - самую низкую.
- Словарь для нейросетей доступен исследовательскому сообществу, и команда планирует расширять коллекцию и изучать работу со смешанными эмоциями.
«Раньше для такого анализа нужны были огромные размеченные выборки и мощные вычислительные ресурсы. Сейчас достаточно показать нейросети несколько десятков качественных образцов из нашего датасета», — отмечает Анастасия Колмогорова.