- DeepSeek - ИИ-модели, которые показывают лучшие результаты в тестах и обходят другие модели по эффективности работы.
- Реальная картина сложнее, чем это представлено в материалах, и включает доступ к вычислительным ресурсам, экспортные ограничения и разработки в сфере ИИ.
- Настоящие экспортные ограничения на ИИ-чипы вступили в силу только в октябре 2023 года, и заявления об их неэффективности преждевременны.
- GPU Nvidia H800 использовались для обучения моделей DeepSeek, обеспечивая производительность, сопоставимую с ускорителями H100.
- GPU Nvidia H20 - самая современная разработка компании, экспортируется в Китай, обладает меньшей производительностью при обучении моделей, но имеет серьезные возможности на этапе развертывания ИИ-систем.
- Ускоритель H20 хорошо подходит для решения задач, требующих памяти, таких как формирование ответа модели с использованием длинного контекста.
- Ограничения на экспорт памяти с высокой пропускной способностью были введены в декабре 2024 года, но ускоритель H20 продолжает экспортироваться.
- Ограничения на экспортные ограничения действуют с задержкой, и их практическая реализация сложна.
- DeepSeek V3 была обучена с использованием меньших вычислительных ресурсов, и алгоритмы машинного обучения становятся менее ресурсоемкими со временем.
- Выбор времени выпуска модели может быть стратегическим решением, но технологии - это реальность.
- Ограничения на самые продвинутые чипы могут реально помешать развертыванию крупномасштабных ИИ-систем и замедлить развитие возможностей моделей.
Восстание DeepSeek: что не попало в заголовки новостей
3 фев 2025

Краткий пересказ
от нейросети YandexGPT
Источник:
habr.com
Обложка: Экспортные ограничения, пересмотренные в октябре 2023 года, и срок службы вычислительного кластера