Google презентує Gemini: революційну модель ШІ, здатну перевершити ChatGPT-4
Google презентував нову просунуту модель штучного інтелекту (AI) під назвою Gemini, яка, за словами Google, може значно перевершити поточного лідера Chat GPT. Компанія робить величезні ставки на нову модель у 2024 році та називає її проривом в користувацьких ШІ.
За словами Сундара Пічая, CEO Google, настав час нової ери AI в компанії, яку він називає “ерою Gemini”. Gemini — це остання розробка Google у сфері великомасштабних мовних моделей. Проєкт було анонсовано ще у червні на конференції розробників I/O, і тепер він стає доступним для загалу. Пічай та CEO Google DeepMind Деміс Хассабіс описують Gemini як значний прогрес у розвитку моделей ШІ, який вплине на майже всі продукти Google. Пічай зазначає: “Особливість цього моменту полягає в тому, що працюючи над однією базовою технологією та вдосконалюючи її, ми можемо негайно впливати на всі наші продукти.”
Gemini — це не просто одна модель AI (ШІ). Існує легша версія під назвою Gemini Nano, призначена для використання на Android-пристроях у режимі офлайн. Більш потужна версія, Gemini Pro, скоро стане основою для багатьох сервісів Google AI, а також для Bard. Є також найпотужніша модель Gemini Ultra, призначена для дата-центрів та корпоративного використання.
Наразі Google впроваджує модель декількома способами: Bard тепер працює на базі Gemini Pro, а користувачі Pixel 8 Pro отримають нові можливості завдяки Gemini Nano. Gemini Ultra заплановано на наступний рік. Розробники та корпоративні клієнти зможуть доступатися до Gemini Pro через Google Generative AI Studio або Vertex AI у Google Cloud, починаючи з 13 грудня. Наразі Gemini доступний лише англійською мовою, але планується додати інші мови. Пічай вказує, що модель з часом буде інтегрована в пошук Google, рекламні продукти, браузер Chrome та інше.
OpenAI запустив ChatGPT рік тому, і він швидко став важливою частиною AI-світу. Тепер Google готується відповісти на виклик.
Важливо підкреслити, що Gemini переважає у взаємодії з відео та аудіо, завдяки своїй мультимодальності. Google не створював окремі моделі для зображень та голосу, як OpenAI з DALL-E та Whisper, а розробив універсальну багаточуттєву модель з самого початку. Хассабіс говорить, що це є частиною більш широкого плану розвитку Gemini, який з часом отримає більше можливостей і стане більш точним та реалістичним.
Gemini не тільки є потужнішим, але й ефективнішим у порівнянні з попередніми моделями. Він був навчений на Tensor Processing Units Google, що робить його швидшим та дешевшим у використанні. Google також запускає нову версію своєї системи TPU, TPU v5p, призначену для тренування та використання великомасштабних моделей у дата-центрах.
Пічай та Хассабіс бачать запуск Gemini як початок більшого проекту та як крок, що змінює правила гри. Gemini може стати не тільки відповіддю Google на ChatGPT, але й початком нової епохи в технологіях штучного інтелекту.