Google представив нову модель штучного інтелекту під назвою Gemini, що
призначена для роботи з веб-сайтами через браузер.
Ця модель, відома як Gemini 2.5 Computer Use, використовує візуальне
розуміння для аналізу запитів та виконання завдань, як-от заповнення форм. Модель
допоможе тестувати інтерфейси без наявності API чи прямого з’єднання.
Інші версії Gemini вже використовувались для таких проектів, як AI Mode і
Project Mariner, де ШІ виконує завдання у браузері, наприклад, додає товари в кошик.
Оголошення Google відбулося після того, як OpenAI презентувала нові додатки для
ChatGPT, що виконує складні завдання.
**Google стверджує**, що ця модель перевершує конкурентів за багатьма
показниками. Gemini 2.5 функціонує лише у браузері та підтримує 13 дій, зокрема відкриття
веб-браузера і введення тексту. Для розробників модель доступна через Google AI Studio та Vertex AI.