Google и Boston Dynamics интегрировали ИИ Gemini в робота Spot, обеспечивая управление естественным языком, распознавание объектов и выполнение задач, продвигая адаптивную робототехникуGoogle и Boston Dynamics интегрировали ИИ Gemini в робота Spot, обеспечивая управление естественным языком, распознавание объектов и выполнение задач, продвигая адаптивную робототехнику

Google и Boston Dynamics интегрируют роботизированные модели Gemini в Spot для расширенного восприятия и выполнения задач

2026/04/16 22:41
3м. чтение
Для обратной связи или замечаний по поводу данного контента, свяжитесь с нами по адресу [email protected]
Google и Boston Dynamics интегрируют модели Gemini Robotics в Spot для расширенного восприятия и выполнения задач

Технологическая компания Google объявила о партнерстве с Boston Dynamics для интеграции своих моделей воплощенного мышления Gemini Robotics в четвероногого робота Spot, что знаменует шаг вперед в применении искусственного интеллекта к реальной робототехнике. Сотрудничество позволяет роботу лучше интерпретировать окружающую среду, идентифицировать объекты и выполнять задачи на основе инструкций на естественном языке, а не полагаться исключительно на предварительно запрограммированные процедуры.

Интеграция основана на экспериментальной работе, проведенной во время внутреннего хакатона 2025 года, где разработчики изучали, как большие языковые модели и системы визуального мышления могут повысить автономность Spot. Используя Gemini Robotics, робот может обрабатывать визуальную информацию со своих камер и преобразовывать высокоуровневые инструкции — такие как организация объектов в комнате — в координированные физические действия.

В отличие от традиционного программирования робототехники, которое часто зависит от жесткой пошаговой логики, система представляет более гибкий Интерфейс, основанный на разговорных подсказках. Разработчики создали промежуточный программный уровень, используя комплект разработки программного обеспечения Spot, позволяющий моделям Gemini взаимодействовать с программным интерфейсом робота. Эта структура позволяет ИИ выбирать из определенного набора действий, включая навигацию, обнаружение объектов, захват изображений, захват и размещение.

Интерфейсы на естественном языке меняют выполнение роботизированных задач

В практических демонстрациях система показала способность интерпретировать общие инструкции и адаптироваться к динамичным средам. Например, когда ей поручено организовать предметы, модель ИИ анализировала визуальные данные, идентифицировала соответствующие объекты и направляла робота через последовательность действий. Обратная связь от робота — такая как завершение задачи или физические ограничения — включалась в реальном времени, позволяя системе корректировать свое поведение без ручного вмешательства.

Подход поддерживает операционные границы, ограничивая ИИ предопределенными возможностями в рамках API робота, обеспечивая предсказуемую и контролируемую производительность. Этот дизайн балансирует адаптивность с безопасностью, что является ключевым соображением при развертывании ИИ в физических системах.

Партнерство также подчеркивает потенциальный прирост эффективности для разработчиков. Сокращая необходимость обширного ручного кодирования, интерфейсы на естественном языке позволяют инженерам сосредоточиться на определении целей, а не на программировании каждой последовательности действий. Этот сдвиг может ускорить разработку робототехнических приложений в таких отраслях, как производство, инспекция и логистика.

Хотя реализация остается экспериментальной, демонстрация отражает более широкие тенденции в физическом ИИ, где фундаментальные модели все чаще используются для улучшения машинного восприятия и принятия решений. Обе компании указали, что дальнейшие разработки продолжаются, включая продолжающуюся интеграцию систем на основе Gemini в робототехнические платформы.

Сотрудничество предполагает переход к более интуитивному взаимодействию человека и машины, где сложное роботизированное поведение может управляться через упрощенные входные данные. По мере продолжения развития моделей ИИ такие интеграции могут расширить функциональные возможности автономных систем, одновременно снижая технические барьеры для их развертывания.

Публикация Google и Boston Dynamics интегрируют модели Gemini Robotics в Spot для расширенного восприятия и выполнения задач впервые появилась на Metaverse Post.

Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу [email protected] для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.

Генезис USD1: 0% + 12% APR

Генезис USD1: 0% + 12% APRГенезис USD1: 0% + 12% APR

Новые пользователи: Стейкайте и получите до 600% APR