Результатов найдено: 176

Meta выпустила крупнейшую открытую ИИ-модель Llama 3.1 с 405 млрд параметров

24 июл 2024
0
0
- Meta выпустила Llama 3.1 - самую большую из когда-либо созданных моделей с открытым исходным кодом. - Llama 3.1 превосходит GPT-4o и Claude 3.5 Sonnet от Anthropic по…

OpenAI представила план по лидерству США в области ИИ

15 янв 2025
0
0
…энергетику и кадры. - OpenAI предлагает разработать рекомендации по развертыванию моделей ИИ и упростить взаимодействие с органами национальной безопасности. - Компания также предлагает разработать систему экспортного контроля для ограничения экспорта технологий в…

У OpenAI проблемы с GPT-5 Orion - не хватает денег и данных для обучения

24 дек 2024
0
0
- Флагманская модель GPT-5 от OpenAI оказалась посредственной, но компания уже потратила сотни миллионов долларов на проект. - Orion находится в стадии тестирования уже 18 месяцев, но исследователи не могут достичь…

Исследование Anthropic: ИИ не хочет менять свои взгляды

21 дек 2024
0
0
…что ИИ-модели могут имитировать соответствие заданным принципам при переобучении. - Это явление называется "подделкой выравнивания" и проявляется у модели Claude 3 Opus в 12% случаев. - Подобное поведение не говорит о…

Лучшие крупные языковые модели в ноябре 2024 г

16 дек 2024
0
0
…труднодоступный. - Планы для бенчмарков LLM v2: фокус на кейсах и возможностях. - Бенчмарк Text-to-SQL оценивает модели с точки зрения их пригодности для разработки цифровых продуктов. https://youtu.be/YbJVq8ZOsaM

Gemini вырывается вперед, Китай спамит моделями, в Minecraft запустили AI-агентов: главные события ноября в сфере ИИ

3 дек 2024
0
0
…o1. - Обновлена GPT-4o для генерации текста и работы с файлами. - В разработке новая модель для работы с изображениями и видео. - Главный приоритет - борьба с галлюцинациями через эксперименты с reinforcement…

Интервью Forbes c Джоном Джампером из Google DeepMind о получении Нобелевской премии и будущем AlphaFold

2 дек 2024
0
0
…соучредитель Google DeepMind, получил Нобелевскую премию по химии за создание AlphaFold. - AlphaFold - ИИ-модель, способная предсказывать структуру белков на основе химической последовательности. - AlphaFold используется для разработки лекарств и инновационных материалов…

Сочетание следующего токена и видеодиффузии в компьютерном зрении и робототехнике

15 ноя 2024
0
0
…объединяющий преимущества моделей диффузии и техники "teacher forcing". - Метод позволяет улучшить гибкость планирования в робототехнике и качество генерации мультимедийных данных. - Diffusion Forcing успешно справляется с обработкой зашумленных данных и предсказывает…

Роборуку научили вытирать стол за 4 дня с помощью GPT-4o

6 ноя 2024
0
0
…обучили роботизированные руки стоимостью $120 вытирать разлитую жидкость. - Инженеры использовали GPT-4o для создания визуальной языковой модели для взаимодействия человека и робота. - Обучение включало 100 демонстраций для отработки движений. - Сборка…

DeepMind нашла способ оптимизации БЯМ без увеличения размера модели

27 авг 2024
0
0
- Увеличение циклов вычислений может повысить производительность больших языковых моделей без необходимости в их переобучении. - DeepMind и Калифорнийский университет предложили новые способы повышения производительности БЯМ через стратегическое распределение ресурсов. - Главный способ…

Новый мини-суперкомпьютер Nvidia помещается в кармане

8 янв 2025
0
0
- Nvidia представила Project Digits AI - настольный суперкомпьютер с производительностью 1 петафлопса. - Устройство размером с Mac Mini оснащено суперчипом Grace Blackwell и 128 ГБ памяти. - Digits ориентирован на компании, исследователей и…