- Ученые из MIT установили, что большие языковые модели (LLM) используют механизмы обработки информации, похожие на те, что наблюдаются в человеческом мозге.
- LLM, подобно человеческому мозгу, используют «семантический центр» для обработки различных типов данных.
- В человеческом мозге такой центр находится в передней височной доле и соединен специфическими связями, направляющими информацию из разных источников.
- Аналогичным образом, LLM обрабатывают через централизованный механизм данные из разных источников: текст на разных языках, математические задачи или компьютерный код.
- Результаты экспериментов показали, что предложения с похожим смыслом получали схожие представления внутри модели независимо от языка.
- Ученые полагают, что LLM используют эту стратегию как экономичный способ обработки данных, поскольку многие сведения являются общими независимо от языка или типа данных.
- Понимание принципов работы моделей поможет разработать более эффективный ИИ, способный лучше обрабатывать разнообразные данные.
ИИ использует единый центр обработки разных типов данных, как мозг человека
19 фев 2025

Краткий пересказ
от нейросети YandexGPT
Обложка: Изображение с сайта freepik.com