Результатов найдено: 527
ИИ для «чайников»
23 июл 2025
0
0
…каждый из которых имеет несколько входов и один выход.
- Обучение LLM - это процесс обучения нейросети на больших объемах данных.
- Дообучение LLM - это процесс изменения весов входов нейронов нейросети.
- Вычисления и…
Новая китайская ИИ-модель Kimi K2 от Moonshot ушла в глубокий отрыв от GPT-4
14 июл 2025
0
0
…подчеркивает важность открытого подхода и доступности модели для исследовательского сообщества и бизнеса.
- Запуск Kimi K2 является важным моментом в истории развития больших языковых моделей и может задать новую планку для…
Как машины учат мир по-человечески: Разбираем крутое исследование про выпуклость
9 июл 2025
0
0
…нейронных сетях: Евклидова выпуклость и Графовая выпуклость.
- Выпуклость есть почти во всех изученных нейронных сетях.
- Выпуклость растёт с глубиной и усиливается после дообучения модели.
- Выпуклость предсказывает успех модели после дообучения…
Ученые выяснили, сколько данных нужно для искусственного интеллекта
13 мая 2025
0
0
…достаточности (стабильность результатов при использовании разных подмножеств данных одного размера) и критерии M-достаточности (перестала ли модель существенно улучшаться при добавлении еще одного объекта данных).
- Оба подхода используют бутстрэп для…
Отчет: рост рассуждающих ИИ-моделей близок к пределу
13 мая 2025
0
0
…растущих вычислительных затрат.
- Модели рассуждений отлично справляются с задачами по математике и программированию, но работают медленнее.
- Разработка ИИ происходит в два этапа: обучение на большом объеме данных и обучение с…
DeepSeek усилила «мышление» ИИ с помощью нового подхода
7 апр 2025
0
0
…представила новый метод обучения больших языковых моделей для улучшения их способности к рассуждению.
- Метод сочетает генеративное моделирование вознаграждений (GRM) и самообучающуюся систему критической настройки.
- GRM-модели показали конкурентоспособные результаты в…
Китай обновил виртуальную ИИ-личность до уровня развития 5-летнего ребенка
1 апр 2025
0
0
…версия обладала интеллектом трехлетнего ребенка, новая - дошкольника 5-6 лет.
- TongTong 2.0 взаимодействует с персонажами в виртуальных средах, формируя индивидуальные поведенческие модели.
- Новая версия лучше в языке, мышлении, движении…
Ученые уверены: современные БЯМ — тупик на пути к ИИ «человеческого» уровня
29 мар 2025
0
0
- 76% опрошенных специалистов считают, что увеличение размеров языковых моделей не приведет к созданию общего ИИ.
- Индустрия ИИ зашла в тупик, и дополнительные инвестиции вряд ли изменят ситуацию.
- Прогресс БЯМ связан…
Нейросети научились точнее предсказывать поведение случайных систем
27 мар 2025
0
0
…не могли точно предсказывать поведение стохастических систем из-за сложности учета внешних случайных воздействий.
- Ученые выделили две категории предсказания: сильное и слабое.
- Сильный прогноз - это составление четкой траектории движения модели…
«Яндекс» разрабатывает «рассуждающий» ИИ, запуск ожидается в 2025 году
3 мар 2025
0
0
…тестовом режиме.
- Разработка новинки обошлась компании до 1 миллиарда рублей.
- Такие алгоритмы строят сложные логические цепочки и проверяют свои ответы на ошибки.
- За рубежом этот подход используется в моделях OpenAI…
«Люди не замечают постепенных улучшений»: ИИ не зашёл в тупик — вот почему
16 фев 2025
0
0
…рост количества параметров в языковых моделях и их общий размер не являются единственным способом улучшения ИИ.
- DeepSeek - пример экономичной разработки ИИ, обошедшейся в сотни раз дешевле создания современных передовых LLM.
«Будущее за узкой специализацией»: судьбоносное интервью Ляна Вэньфэна, основателя DeepSeek, посвящённое v2
1 фев 2025
0
0
…DeepSeek ставит на математику, программирование, мультимодальность и естественный язык для достижения AGI.
- Компания планирует сосредоточиться на исследованиях следующего поколения больших моделей и создании специализированных компаний для базовых моделей и сервисов.
Эксперт Кугаевских: объем русскоязычных данных для обучения ИИ еще не исчерпан
16 янв 2025
0
0
…без противоречий и ошибок, и не нарушать авторские права.
- Синтетические данные для больших языковых моделей не являются самыми "горячими" направлениями, а совершенствование механизмов рассуждения и RAG - более приоритетно.
- РФ лидирует…
Сэм Альтман знает, как достичь AGI. Я тоже, и сейчас расскажу как
14 янв 2025
0
0
…падает со временем.
- Закон масштабирования обучения: ошибка модели зависит от C, D и N.
- Закон масштабирования предсказания: масштабировать обучение и получать качество больше не получится из-за исчерпания текстовых данных.
Эра «Живого» Интеллекта
13 янв 2025
0
0
…FTI) прогнозирует появление "живого" интеллекта (LI) на основе ИИ, биоинженерии и продвинутых датчиков.
- LI изменит мир и преобразует экономические модели, структуры рабочей силы и геополитическую динамику власти.
- ИИ ускоряет разработку…