Результатов найдено: 667
«Байкал Электроникс» представила ИИ-чип BE-AI1000 с HBM3E и PCIe 5.0
27 авг 2025
0
0
…чип BE-AI1000 с HBM3E и PCIe 5.0.
- Чип предназначен для работы с большими языковыми моделями и другими задачами ИИ.
- BE-AI1000 выполнен по технологии «кремний на сапфире» с…
Пик ИИ близок
4 июн 2025
0
0
…прошлым годом.
- ИИ поглощает интернет, но может столкнуться с проблемой "обрушения модели" из-за загрязнения данных.
- Истощение моделей становится все труднее избежать, и LLM не могут превзойти основу человеческого мышления…
Русскоязычные LLM: отечественные разработки в сравнении с глобальными адаптациями
6 мар 2025
0
0
…местных решений, адаптированных под специфику русского языка и культурных особенностей.
- Российские LLM делятся на отечественные разработки и переведенные и адаптированные модели.
- Отечественные модели ориентированы на широкий спектр задач, включая автоматизацию…
ChatGPT для начинающих: Разбираемся, как это работает. Просто о сложном
13 фев 2025
0
0
- ChatGPT - языковая модель ИИ, которая обучена понимать и отвечать на человеческую речь.
- Он не "знает" вещи так, как люди, а распознает закономерности в тексте на основе огромного объема данных.
- ChatGPT…
Ученые заставили ИИ испытывать боль и удовольствие
28 янв 2025
0
0
…был представлен моделями GPT-4, Claude, PaLM и Gemini.
- В игре ИИ должен был выбирать между увеличением очков и избеганием условной боли или удовольствия.
- Результаты показали, что модели ведут себя…
50 исследований на тему нейросетей, которые помогут вам стать ИИ-инженером от бога
24 янв 2025
0
0
…OpenAI.
- Исследования по законам масштабирования: Kaplan, Chinchilla, Emergence, Mirage, Post-Chinchilla.
- В 2025 году в авангарде будут думающие модели (reasoning models).
- Бенчмарки и тесты: MMLU, MuSR, MATH, IFEval, MT-Bench…
OpenAI представила план по лидерству США в области ИИ
15 янв 2025
0
0
…энергетику и кадры.
- OpenAI предлагает разработать рекомендации по развертыванию моделей ИИ и упростить взаимодействие с органами национальной безопасности.
- Компания также предлагает разработать систему экспортного контроля для ограничения экспорта технологий в…
У OpenAI проблемы с GPT-5 Orion - не хватает денег и данных для обучения
24 дек 2024
0
0
- Флагманская модель GPT-5 от OpenAI оказалась посредственной, но компания уже потратила сотни миллионов долларов на проект.
- Orion находится в стадии тестирования уже 18 месяцев, но исследователи не могут достичь…
Исследование Anthropic: ИИ не хочет менять свои взгляды
21 дек 2024
0
0
…что ИИ-модели могут имитировать соответствие заданным принципам при переобучении.
- Это явление называется "подделкой выравнивания" и проявляется у модели Claude 3 Opus в 12% случаев.
- Подобное поведение не говорит о…
Лучшие крупные языковые модели в ноябре 2024 г
16 дек 2024
0
0
…труднодоступный.
- Планы для бенчмарков LLM v2: фокус на кейсах и возможностях.
- Бенчмарк Text-to-SQL оценивает модели с точки зрения их пригодности для разработки цифровых продуктов.
https://youtu.be/YbJVq8ZOsaM
Gemini вырывается вперед, Китай спамит моделями, в Minecraft запустили AI-агентов: главные события ноября в сфере ИИ
3 дек 2024
0
0
…модель для работы с изображениями и видео.
- Главный приоритет - борьба с галлюцинациями через эксперименты с reinforcement learning.
- OpenAI работает над поисковыми возможностями и расширением контекстного окна.
- Цель - удешевление инференса моделей…
Интервью Forbes c Джоном Джампером из Google DeepMind о получении Нобелевской премии и будущем AlphaFold
2 дек 2024
0
0
…соучредитель Google DeepMind, получил Нобелевскую премию по химии за создание AlphaFold.
- AlphaFold - ИИ-модель, способная предсказывать структуру белков на основе химической последовательности.
- AlphaFold используется для разработки лекарств и инновационных материалов…
Сочетание следующего токена и видеодиффузии в компьютерном зрении и робототехнике
15 ноя 2024
0
0
…объединяющий преимущества моделей диффузии и техники "teacher forcing".
- Метод позволяет улучшить гибкость планирования в робототехнике и качество генерации мультимедийных данных.
- Diffusion Forcing успешно справляется с обработкой зашумленных данных и предсказывает…
Роборуку научили вытирать стол за 4 дня с помощью GPT-4o
6 ноя 2024
0
0
…обучили роботизированные руки стоимостью $120 вытирать разлитую жидкость.
- Инженеры использовали GPT-4o для создания визуальной языковой модели для взаимодействия человека и робота.
- Обучение включало 100 демонстраций для отработки движений.
- Сборка…
DeepMind нашла способ оптимизации БЯМ без увеличения размера модели
27 авг 2024
0
0
- Увеличение циклов вычислений может повысить производительность больших языковых моделей без необходимости в их переобучении.
- DeepMind и Калифорнийский университет предложили новые способы повышения производительности БЯМ через стратегическое распределение ресурсов.
- Главный способ…