- Ученые МТУСИ применили многомерный статистический анализ и NLP для классификации научных публикаций на основе аннотаций.
- Результаты могут использоваться для разработки автоматизированных систем обработки научной информации.
- Обработка естественного языка (NLP) является ключевым разделом науки о данных.
- Классификация и выявление тематик в научных публикациях важны для нормализации цитирований и построения журнальных метрик.
- Современные методы выявления тематик основаны на анализе ключевых слов, фраз и цитирований.
- Методы NLP автоматизированы и способны обрабатывать большие объемы данных, но имеют проблему с объективностью результатов.
- Применение универсальных методик с использованием современных алгоритмов кластеризации может улучшить понимание и интерпретацию научной литературы.
В МТУСИ классифицировали научные статьи с помощью многомерного статистического анализа
25 окт 2024
Краткий пересказ
от нейросети YandexGPT
Обложка: Изображение с сайта freepik.com