- Ученые из Сколтеха, МФТИ, AIRI и других научных центров разработали метод для определения сгенерированных текстов.
- Метод основан на использовании разреженных автокодировщиков (Sparse Autoencoders, SAE) для анализа внутренних состояний языковой модели.
- SAE позволяет выделить численные признаки, отвечающие за стилистику, сложность и «степень уверенности» текста.
- Результаты исследования могут быть использованы для разработки более интерпретируемых детекторов сгенерированных текстов.
- Работа является важным шагом к демистификации искусственного интеллекта и пониманию его работы.
- Дальнейшие исследования будут направлены на изучение более сложных и трудноуловимых признаков для предотвращения недобросовестного использования ИИ.
Искусственный разум под микроскопом: ученые разобрали отличительные признаки сгенерированных текстов
24 ноя 2025
Краткий пересказ
от нейросети YandexGPT