Последняя модель искусственного интеллекта Google, Gemini 2.0, призвана открыть «эру агентов»

  • Начиная с сегодняшнего дня Google выпускает версию Gemini 2.0, которая положит начало тому, что компания называет «эрой агентов».
  • Сегодня Gemini 2.0 Flash Experimental доступен разработчикам в Google AI Studio и Vertex AI с использованием Gemini API.
  • Gemini 2.0 Flash Experimental также доступен в оптимизированной для чата форме в веб-клиенте Gemini, начиная с сегодняшнего дня, а полная линейка моделей Gemini 2.0 появится в других продуктах и ​​сервисах Google в следующем году.

Как технический энтузиаст с более чем двадцатилетним опытом работы за плечами, я должен сказать, что анонс Google Gemini 2.0 действительно взволновал меня! Став свидетелем эволюции искусственного интеллекта от зарождения до нынешнего состояния, интересно увидеть, куда движется отрасль. «Эра агентов» кажется многообещающим шагом вперед, и мне не терпится увидеть, как эти агенты ИИ произведут революцию в нашей повседневной жизни.

Как аналитик, я рад сообщить, что чуть более десяти месяцев с тех пор, как Google выпустил свои текущие модели искусственного интеллекта для публичного использования, они уже намекают на следующую большую вещь: Gemini 2.0. Начиная с сегодняшнего дня разработчики и существующие пользователи Gemini могут получить в свое распоряжение первоначальную, уменьшенную версию Gemini 2.0 (модель Flash Experimental). В следующем году будут представлены новые размеры и реализации.

Google рассматривает «эпоху агентов» как следующий значительный скачок в развитии ИИ, и в своем блоге они объяснили, как такие модели, как Gemini 2.0, специально разработаны для управления агентами ИИ. Эти агенты станут краеугольным камнем новаторских инициатив Google, начиная от многофункциональных помощников и заканчивая расширениями Chrome, которые смогут автономно управлять просмотром веб-страниц.

В течение прошлого года я сосредоточился на совершенствовании наших моделей искусственного интеллекта, чтобы они проявляли больше свободы действий, позволяя им понимать окружающую среду, стратегически мыслить на будущее и действовать по моим инструкциям с соответствующим надзором. Благодаря недавним прорывам в области мультимодальных возможностей, таких как генерация изображений и аудио, а также использованию собственных инструментов, мы теперь можем создавать усовершенствованные агенты искусственного интеллекта, которые приближают нас к нашей цели — созданию комплексного, всеобъемлющего помощника.

Несмотря на то, что на данный момент у нас есть только экспериментальная версия самой маленькой модели ИИ от Google, есть несколько веских причин для энтузиазма. Значительное усовершенствование, модель Gemini 2.0 Flash от Google, не только превосходит по производительности свою предшественницу Gemini 1.5 Flash, но также превосходит более крупную и мощную модель Gemini 1.5 Pro в конкретных тестах. Что отличает Gemini 2.0 Flash, так это его способность обрабатывать мультимодальные входные и выходные данные, позволяя модели естественным образом генерировать изображения, текст, речь или смесь этих форм самостоятельно.

Сегодня вы можете получить доступ к всемирному дебюту экспериментальной флэш-памяти Gemini 2.0 по всему миру через веб-клиент Gemini. Вскоре эта функция также будет доступна через мобильное приложение Gemini. Кроме того, у разработчиков есть возможность протестировать экспериментальную версию Gemini 2.0 Flash с использованием API Gemini в Google AI Studio или Vertex AI.

В будущем вполне вероятно, что Gemini 2.0 станет источником энергии для многих или всех функций Google, основанных на искусственном интеллекте. Эти настраиваемые модели предназначены для бесперебойной работы с агентами искусственного интеллекта, такими как Project Astra, который был представлен на Google I/O 2024. Этот многогранный помощник искусственного интеллекта способен обрабатывать ваше окружение и давать ответы с учетом контекста вашей среды. Кроме того, в разработке находятся новые инициативы, такие как Project Mariner. В настоящее время Project Mariner тестируется как исследовательский прототип расширения для браузеров Chrome, позволяющий ему управлять вашими потребностями в веб-навигации от вашего имени.

Представление Google об агентной системе обширно и предлагает множество возможностей. Есть Jules, инструмент, специально разработанный для разработчиков, который легко синхронизируется с процессами GitHub. Кроме того, Google сотрудничает с Supercell в проекте по изучению использования агентов искусственного интеллекта в стратегиях и играх-симуляторах в качестве потенциального применения.

Как исследователь, я рад объявить о введении нового режима глубоких исследований в Gemini Advanced. Эта инновационная функция использует обширные контекстные окна и сложную логическую обработку и служит незаменимым помощником в исследованиях, делая мой исследовательский процесс более эффективным и продуктивным.

Ряд концепций, основанных на технологии Google Gemini 2.0, на данный момент недоступен, но над ними активно работают. Например, Project Astra в настоящее время проходит внешние испытания с помощью надежной программы тестирования Google. С другой стороны, некоторые из них можно опробовать сразу же, например Gemini 2.0 Flash Experimental в Gemini и Gemini 2.0 в обзорах AI — в настоящее время они проходят ограниченное тестирование, а в следующем году ожидается их более широкая доступность.

Смотрите также

2024-12-11 21:53