- Стартап Миры Мурати представил ИИ, который видит, слышит и реагирует в реальном времени.
- ИИ изначально спроектирован для бесшовного сотрудничества с человеком.
- Большинство моделей работают пошагово, но Thinking Machines стремится преодолеть этот барьер.
- Флагманская модель компании, TML-Interaction-Small, представляет собой архитектуру «смесь экспертов».
- Модель разбивает взаимодействие на крошечные фрагменты длительностью 200 мс, что позволяет ей отслеживать динамику диалога.
- Система разделена на два уровня: «Модель взаимодействия» и асинхронная «фоновая модель».
- TML-Interaction-Small способна выполнять задачи, недоступные текущим коммерческим API, например, напоминать о дыхательных упражнениях или исправлять произношение.
- Безопасность в интерактивном режиме требует особых решений, таких как «разговорные отказы».
- Разработчики признают ограничения: для стабильной работы видеопотока требуется высокая пропускная способность сети.
Инженеры разделили систему на два уровня. «Модель взаимодействия» отвечает за мгновенные реакции и поддержание контакта в реальном времени. Если задача требует глубоких размышлений или поиска в сети, она делегирует её асинхронной «фоновой модели». Такой тандем позволяет сохранить «интеллект класса GPT-5» без ущерба для скорости отклика, обеспечивая задержку всего в 0,4 секунды.