Революция в мире ИИ: Google выпускает Gemini 2.0 с поддержкой агентов

Корпорация Google анонсировала масштабное обновление своей флагманской модели искусственного интеллекта — Gemini 2.0. Новая версия отличается значительно возросшей производительностью и расширенными мультимодальными возможностями, закладывая фундамент для развития ИИ-агентов. Для обеспечения работы Gemini 2.0 компания задействовала процессор шестого поколения TPU Trillium, первый показ которого состоялся на конференции I/O в мае.
Агенты искусственного интеллекта: Переосмысление производительности и автоматизации
Сундар Пичаи, генеральный директор Google, объявил о стратегическом переходе компании к разработке агентных моделей ИИ. Эти системы создаются с прицелом на комплексное восприятие окружающей среды, многоступенчатое планирование задач и выполнение действий под надзором пользователя.
Google представила три экспериментальных ИИ-агента на базе архитектуры Gemini 2.0: Project Astra, Project Mariner и Jules. Каждый из них специализируется на различных задачах — от бытовых поручений до сложного программирования и навигации в интернете.
Project Astra: ИИ общего назначения для бесшовных разговоров
Project Astra демонстрирует впечатляющие возможности в области многоязычного общения, способен взаимодействовать с различными сервисами Google, включая Поиск и Карты, а также сохраняет историю диалогов для обеспечения преемственности общения. Например, система может проанализировать фотографию книжной полки и, опираясь на список пожеланий пользователя, предложить оптимальный вариант книги для подарка.
Проект Mariner: Веб-навигация заново
Project Mariner — это расширение для браузера Chrome на основе Gemini 2.0, разработанное для профессионалов и корпоративных пользователей. Оно автоматизирует навигацию в интернете, анализируя скриншоты и обрабатывая их в облаке. ИИ-агент способен интерпретировать и выполнять различные задачи, включая онлайн-покупки по заданному списку.
Жаклин Конзельманн, директор по управлению продуктами Google Labs, продемонстрировала возможности Mariner в поиске товаров, их добавлении в корзину и оформлении заказов. Несмотря на высокий показатель успешности выполнения задач в тестах WebVoyager (83,5%), система пока работает с небольшой задержкой — около 5 секунд между действиями.
Jules: Компаньон по кодированию для разработчиков
Jules специализируется на помощи программистам — анализирует кодовую базу, предлагает планы исправлений и вносит изменения в несколько файлов одновременно. Система интегрируется с популярными платформами, включая GitHub. На данный момент Jules доступен ограниченному кругу тестировщиков, широкий запуск запланирован на начало 2025 года.
Trillium: движок, стоящий за Gemini 2.0
Процессор Trillium стал ключевым элементом в обучении и функционировании Gemini 2.0. По сравнению с предыдущей версией, новый чип демонстрирует впечатляющие показатели: производительность выросла в 4,7 раза, удвоена емкость и пропускная способность HBM, а энергоэффективность повысилась на 67%.
Google развернула масштабную систему из более чем 100 000 чипов Trillium, объединенных сетевой архитектурой Jupiter. Эта конфигурация обеспечивает скорость передачи данных 13 петабайт в секунду, позволяя задействовать сотни тысяч ускорителей для решения единой задачи обучения.
Марк Ломайер, вице-президент по вычислительной инфраструктуре и инфраструктуре ИИ в Google Cloud, отметил, что тестирование Llama 2 70B на Trillium показало прямую зависимость между увеличением производительности и количеством используемых чипов.