OpenAI випустила GPT-4 — наступне покоління мовної моделі ШІ

Вона розуміє не лише текст, а й зображення

sundries Опубліковано Бер 15, 2023 11:14 225

Світ вже кілька місяців активно використовує ChatGPT, заснований на попередній версії мовної моделі OpenAI — оновлення зможе усунути недоліки в роботі чатбота, сподіваємось і ті, що стосувалися надання оманливих чи помилкових відповідей.

Компанія стверджує, що GPT-4 — «креативніша» і може розв’язувати складні завдання із більшою точністю завдяки розширеним загальним знанням. Мовна модель може аналізувати навіть зображення, однак відповідатиме лише за допомогою тексту.

OpenAI вже співпрацює з низкою компаній, які планують інтегрувати GPT-4 у власні продукти — це електронна платформа вивчення мов Duolingo; компанія Stripe, що розробляє рішення для електронних платежів; освітня організація Khan Academy. Нова модель доступна для широкого загалу через ChatGPT Plus — передплату на ChatGPT від $20 на місяць, а її API згодом опублікують для розробників (тут можна записатись у список очікування).

Генеральний директор OpenAI Сем Альтман написав у Twitter, що GPT-4 «все ще має недоліки та все ще обмежений».

here is GPT-4, our most capable and aligned model yet. it is available today in our API (with a waitlist) and in ChatGPT+.https://t.co/2ZFC36xqAJ

it is still flawed, still limited, and it still seems more impressive on first use than it does after you spend more time with it.

— Sam Altman (@sama) March 14, 2023

Однак покращення, кажуть в компанії, можна побачити за результатами тестів, включно з LSAT (вступний тест для майбутніх юристів), SAT Math (тест з математики) й SAT Evidence-Based Reading & Writing (іспити з читання та письма). У згаданих тестах GPT-4 набрав 88% і вище, повний список іспитів і бали системи можна переглянути тут.

Протягом останнього року було багато спекуляцій щодо GPT-4 та його можливостей, багато хто припускав, що це буде величезний прогрес у порівнянні з попередніми системами. Однак, судячи з оголошення OpenAI, покращення не надто значні.

«Люди хочуть розчарування і вони його отримають», — сказав Альтман в інтерв’ю про GPT-4 у січні.

Чутки ще більше пожвавилися після того, як керівник Microsoft обмовився, що система буде запущена цього тижня. Він припустив, що система буде мультимодальною, тобто здатною генерувати не лише текст, а й аудіо чи відео.

GPT-4 справді мультимодальна, але це відображається у функції сприйняття, а не відтворення. Компанія каже, що здатність моделі аналізувати текст і зображення одночасно дозволяє їй інтерпретувати складніші вхідні дані.

Нова версія також може приймати та створювати довші записи — до 25 000 слів.

Оригінальна дослідницька стаття з описом першої версії мовної моделі OpenAI GPT була опублікована у 2018 році, про GPT-2 було оголошено у 2019 році, а про GPT-3 — у 2020 році. Ці моделі тренуються на величезних масивах тексту, більшу частину якого взято з інтернету. На основі отриманих шаблонів система може прогнозувати, яке слово слідуватиме наступним у реченні. За описом — це відносно простий механізм, однак у кінцевому результаті з’являються гнучкі системи, які можуть генерувати, узагальнювати та перефразовувати текст, а також виконувати інші текстові завдання, такі як переклад або генерування коду.
Спочатку OpenAI відкладала випуск своїх моделей GPT, побоюючись, що вони будуть використані для зловмисних цілей, таких як створення спаму та дезінформації. Але наприкінці 2022 року компанія запустила ChatGPT — розмовний чатбот на основі GPT-3.5, до якого міг отримати доступ кожен.
Запуск ChatGPT викликав ажіотаж у світі технологій, а Microsoft так надихнулась чатботом, що інвестувала в його розробника $10 млрд та інтегрувала мовну ШІ-модель у власний пошуковик — а сьогодні підтвердила, що Bing вже працює на GPT-4. Google тим часом залишилася у статусі того, хто наздоганяє та терміново представила власного ШІ-чатбота Bard.

Очікувано, легкий доступ до ШІ-технологій не обійшовся без проблем — система освіти намагається адаптуватися до програмного забезпечення, яке пиши тексти, схожі на людські; онлайн-сайти, такі як Stack Overflow і науково-фантастичний журнал Clarkesworld, були змушені закрити подання матеріалів через наплив контенту, створеного ШІ; і раннє використання інструментів ШІ в журналістиці також було не дуже простим.

Джерело theverge

OpenAI випустила GPT-4 — наступне покоління мовної моделі ШІ

Вона розуміє не лише текст, а й зображення

Підпишись @02yilin02