Результатов найдено: 176
Meta выпустила крупнейшую открытую ИИ-модель Llama 3.1 с 405 млрд параметров
24 июл 2024
0
0
- Meta выпустила Llama 3.1 - самую большую из когда-либо созданных моделей с открытым исходным кодом.
- Llama 3.1 превосходит GPT-4o и Claude 3.5 Sonnet от Anthropic по…
OpenAI представила план по лидерству США в области ИИ
15 янв 2025
0
0
…энергетику и кадры.
- OpenAI предлагает разработать рекомендации по развертыванию моделей ИИ и упростить взаимодействие с органами национальной безопасности.
- Компания также предлагает разработать систему экспортного контроля для ограничения экспорта технологий в…
У OpenAI проблемы с GPT-5 Orion - не хватает денег и данных для обучения
24 дек 2024
0
0
- Флагманская модель GPT-5 от OpenAI оказалась посредственной, но компания уже потратила сотни миллионов долларов на проект.
- Orion находится в стадии тестирования уже 18 месяцев, но исследователи не могут достичь…
Исследование Anthropic: ИИ не хочет менять свои взгляды
21 дек 2024
0
0
…что ИИ-модели могут имитировать соответствие заданным принципам при переобучении.
- Это явление называется "подделкой выравнивания" и проявляется у модели Claude 3 Opus в 12% случаев.
- Подобное поведение не говорит о…
Лучшие крупные языковые модели в ноябре 2024 г
16 дек 2024
0
0
…труднодоступный.
- Планы для бенчмарков LLM v2: фокус на кейсах и возможностях.
- Бенчмарк Text-to-SQL оценивает модели с точки зрения их пригодности для разработки цифровых продуктов.
https://youtu.be/YbJVq8ZOsaM
Gemini вырывается вперед, Китай спамит моделями, в Minecraft запустили AI-агентов: главные события ноября в сфере ИИ
3 дек 2024
0
0
…o1.
- Обновлена GPT-4o для генерации текста и работы с файлами.
- В разработке новая модель для работы с изображениями и видео.
- Главный приоритет - борьба с галлюцинациями через эксперименты с reinforcement…
Интервью Forbes c Джоном Джампером из Google DeepMind о получении Нобелевской премии и будущем AlphaFold
2 дек 2024
0
0
…соучредитель Google DeepMind, получил Нобелевскую премию по химии за создание AlphaFold.
- AlphaFold - ИИ-модель, способная предсказывать структуру белков на основе химической последовательности.
- AlphaFold используется для разработки лекарств и инновационных материалов…
Сочетание следующего токена и видеодиффузии в компьютерном зрении и робототехнике
15 ноя 2024
0
0
…объединяющий преимущества моделей диффузии и техники "teacher forcing".
- Метод позволяет улучшить гибкость планирования в робототехнике и качество генерации мультимедийных данных.
- Diffusion Forcing успешно справляется с обработкой зашумленных данных и предсказывает…
Роборуку научили вытирать стол за 4 дня с помощью GPT-4o
6 ноя 2024
0
0
…обучили роботизированные руки стоимостью $120 вытирать разлитую жидкость.
- Инженеры использовали GPT-4o для создания визуальной языковой модели для взаимодействия человека и робота.
- Обучение включало 100 демонстраций для отработки движений.
- Сборка…
DeepMind нашла способ оптимизации БЯМ без увеличения размера модели
27 авг 2024
0
0
- Увеличение циклов вычислений может повысить производительность больших языковых моделей без необходимости в их переобучении.
- DeepMind и Калифорнийский университет предложили новые способы повышения производительности БЯМ через стратегическое распределение ресурсов.
- Главный способ…
Новый мини-суперкомпьютер Nvidia помещается в кармане
8 янв 2025
0
0
- Nvidia представила Project Digits AI - настольный суперкомпьютер с производительностью 1 петафлопса.
- Устройство размером с Mac Mini оснащено суперчипом Grace Blackwell и 128 ГБ памяти.
- Digits ориентирован на компании, исследователей и…