Результатов найдено: 667

«Байкал Электроникс» представила ИИ-чип BE-AI1000 с HBM3E и PCIe 5.0

27 авг 2025
0
0
…чип BE-AI1000 с HBM3E и PCIe 5.0. - Чип предназначен для работы с большими языковыми моделями и другими задачами ИИ. - BE-AI1000 выполнен по технологии «кремний на сапфире» с…

Пик ИИ близок

4 июн 2025
0
0
…прошлым годом. - ИИ поглощает интернет, но может столкнуться с проблемой "обрушения модели" из-за загрязнения данных. - Истощение моделей становится все труднее избежать, и LLM не могут превзойти основу человеческого мышления…

Русскоязычные LLM: отечественные разработки в сравнении с глобальными адаптациями

6 мар 2025
0
0
…местных решений, адаптированных под специфику русского языка и культурных особенностей. - Российские LLM делятся на отечественные разработки и переведенные и адаптированные модели. - Отечественные модели ориентированы на широкий спектр задач, включая автоматизацию…

ChatGPT для начинающих: Разбираемся, как это работает. Просто о сложном

13 фев 2025
0
0
- ChatGPT - языковая модель ИИ, которая обучена понимать и отвечать на человеческую речь. - Он не "знает" вещи так, как люди, а распознает закономерности в тексте на основе огромного объема данных. - ChatGPT…

Ученые заставили ИИ испытывать боль и удовольствие

28 янв 2025
0
0
…был представлен моделями GPT-4, Claude, PaLM и Gemini. - В игре ИИ должен был выбирать между увеличением очков и избеганием условной боли или удовольствия. - Результаты показали, что модели ведут себя…

50 исследований на тему нейросетей, которые помогут вам стать ИИ-инженером от бога

24 янв 2025
0
0
…OpenAI. - Исследования по законам масштабирования: Kaplan, Chinchilla, Emergence, Mirage, Post-Chinchilla. - В 2025 году в авангарде будут думающие модели (reasoning models). - Бенчмарки и тесты: MMLU, MuSR, MATH, IFEval, MT-Bench…

OpenAI представила план по лидерству США в области ИИ

15 янв 2025
0
0
…энергетику и кадры. - OpenAI предлагает разработать рекомендации по развертыванию моделей ИИ и упростить взаимодействие с органами национальной безопасности. - Компания также предлагает разработать систему экспортного контроля для ограничения экспорта технологий в…

У OpenAI проблемы с GPT-5 Orion - не хватает денег и данных для обучения

24 дек 2024
0
0
- Флагманская модель GPT-5 от OpenAI оказалась посредственной, но компания уже потратила сотни миллионов долларов на проект. - Orion находится в стадии тестирования уже 18 месяцев, но исследователи не могут достичь…

Исследование Anthropic: ИИ не хочет менять свои взгляды

21 дек 2024
0
0
…что ИИ-модели могут имитировать соответствие заданным принципам при переобучении. - Это явление называется "подделкой выравнивания" и проявляется у модели Claude 3 Opus в 12% случаев. - Подобное поведение не говорит о…

Лучшие крупные языковые модели в ноябре 2024 г

16 дек 2024
0
0
…труднодоступный. - Планы для бенчмарков LLM v2: фокус на кейсах и возможностях. - Бенчмарк Text-to-SQL оценивает модели с точки зрения их пригодности для разработки цифровых продуктов. https://youtu.be/YbJVq8ZOsaM

Gemini вырывается вперед, Китай спамит моделями, в Minecraft запустили AI-агентов: главные события ноября в сфере ИИ

3 дек 2024
0
0
модель для работы с изображениями и видео. - Главный приоритет - борьба с галлюцинациями через эксперименты с reinforcement learning. - OpenAI работает над поисковыми возможностями и расширением контекстного окна. - Цель - удешевление инференса моделей

Интервью Forbes c Джоном Джампером из Google DeepMind о получении Нобелевской премии и будущем AlphaFold

2 дек 2024
0
0
…соучредитель Google DeepMind, получил Нобелевскую премию по химии за создание AlphaFold. - AlphaFold - ИИ-модель, способная предсказывать структуру белков на основе химической последовательности. - AlphaFold используется для разработки лекарств и инновационных материалов…

Сочетание следующего токена и видеодиффузии в компьютерном зрении и робототехнике

15 ноя 2024
0
0
…объединяющий преимущества моделей диффузии и техники "teacher forcing". - Метод позволяет улучшить гибкость планирования в робототехнике и качество генерации мультимедийных данных. - Diffusion Forcing успешно справляется с обработкой зашумленных данных и предсказывает…

Роборуку научили вытирать стол за 4 дня с помощью GPT-4o

6 ноя 2024
0
0
…обучили роботизированные руки стоимостью $120 вытирать разлитую жидкость. - Инженеры использовали GPT-4o для создания визуальной языковой модели для взаимодействия человека и робота. - Обучение включало 100 демонстраций для отработки движений. - Сборка…

DeepMind нашла способ оптимизации БЯМ без увеличения размера модели

27 авг 2024
0
0
- Увеличение циклов вычислений может повысить производительность больших языковых моделей без необходимости в их переобучении. - DeepMind и Калифорнийский университет предложили новые способы повышения производительности БЯМ через стратегическое распределение ресурсов. - Главный способ…