Искусственный разум под микроскопом: ученые разобрали отличительные признаки сгенерированных текстов

Ученые из Сколтеха, МФТИ, AIRI и других научных центров разработали метод для определения сгенерированных текстов.
Метод основан на использовании разреженных автокодировщиков (Sparse Autoencoders, SAE) для анализа внутренних состояний языковой модели.
SAE позволяет выделить численные признаки, отвечающие за стилистику, сложность и «степень уверенности» текста.
Результаты исследования могут быть использованы для разработки более интерпретируемых детекторов сгенерированных текстов.
Работа является важным шагом к демистификации искусственного интеллекта и пониманию его работы.
Дальнейшие исследования будут направлены на изучение более сложных и трудноуловимых признаков для предотвращения недобросовестного использования ИИ.