Следующее поколение ChatGPT уже здесь: компания OpenAI представила в четверг, 7 августа, GPT-5 - свой новый флагманский модельный алгоритм, который, по ее словам, "устанавливает новую планку для мира искусственного интеллекта".
Речь идет о первом в своем роде унифицированном моделе, сочетающем возможности логического вывода из семейства моделей серии O с быстротой и плавностью откликов линейки GPT. Это, в свою очередь, должно превратить чат-бота из просто умного собеседника в агента, способного действительно выполнять для пользователей конкретные задачи.
Иными словами — если до сих пор GPT умел отвечать на вопросы и, например, создавать милые аниме-картинки по текстовым запросам, то теперь он также может писать приложения, планировать ваш календарь, готовить полноценные исследования — и даже самостоятельно понимать, каким образом лучше реагировать, без того чтобы пользователь вручную менял настройки.
Как и ожидалось, генеральный директор Сэм Альтман не поскупился на похвалы новому продукту компании. По его словам, "GPT-5 — это значительный шаг на нашем пути к разработке искусственного интеллекта, который сможет превзойти человека в наиболее важных видах работы", подразумевая, вероятно, искусственный интеллект общего назначения (AGI), своего рода "святой Грааль" отрасли.
Он отметил, что то, что "в любую другую эпоху казалось бы немыслимым", теперь стало реальностью. При этом важно подчеркнуть, что GPT-5, хоть и демонстрирует улучшения по сравнению с предыдущим поколением, еще не является тем самым AGI, о котором все говорят. Возможно, именно поэтому Альтман сознательно выбрал столь расплывчатую формулировку.
Также было объявлено, что впервые даже бесплатные пользователи по умолчанию получат доступ к такой продвинутой модели. По словам Ника Торли, вице-президента ChatGPT в OpenAI, часть усилий компании сводится к тому, чтобы "убедиться, что эта технология действительно дойдет до людей".
►Производительность: немного лучше конкурентов
Согласно внутренним тестам OpenAI, новая модель смогла превзойти в некоторых областях (но не во всех) ведущие модели, такие как Claude от Anthropic, Gemini от Google и Grok от xAI.
Например, в области программирования модель получила особенно высокий балл — 74,9% с первой попытки в тесте SWE-bench, оставив позади Claude Opus 4.1 от Anthropic и Gemini 2.5 Pro от Google DeepMind.
В других тестах, таких как Humanity’s Last Exam (оценивающий способности в математике, естественных и гуманитарных науках), более мощная версия — GPT 5 Pro — смогла набрать 42%, что немного ниже, чем у Grok 4 Heavy от Маска, который получил 44,4%. Однако в тесте GPQA, оценивающем научные знания на уровне докторантуры, GPT-5 Pro сумел достичь впечатляющего результата — 89,4%, самого высокого среди всех протестированных моделей.
Одна из самых серьезных проблем моделей искусственного интеллекта — это так называемые "галлюцинации", то есть выдумывание неверных фактов. По данным, представленным на мероприятии, GPT-5 сумел значительно сократить эту проблему — только 4,8% ответов содержали ошибки такого рода, по сравнению с 20% у моделей GPT-4o и o3.
Алекс Бьютел, глава направления безопасности в OpenAI, отметил, что GPT-5 также стал точнее в распознавании опасных запросов. Это привело к тому, что с одной стороны стало меньше отказов на безобидные вопросы, а с другой — больше отказов на запросы, направленные на злоупотребление системой.
Забавно, что примерно через два дня после того, как Маск и xAI представили новый "пикантный" режим Grok, который присоединился к уже существующим в системе "личностям", OpenAI также запустила возможность выбора между четырьмя режимами (или личностями) чат-бота: циник, робот, внимательный слушатель и ботаник. Что каждый из них реально умеет — еще предстоит выяснить.
Для платных пользователей в тарифе Plus (20 $ в месяц) будет расширенный доступ к новой модели, а подписчики Pro (200 $ в месяц) получат неограниченный доступ к GPT-5 и его более мощной версии Pro.
Разработчики смогут получить доступ к модели через API в трех версиях: gpt-5-mini, gpt-5-nano и gpt-5, с ценами от 1,25 $ за миллион входных токенов и до 10 $ за миллион выходных токенов.
►Действительно ли это шаг вперед?
GPT 5 был представлен после насыщенной недели для OpenAI, в течение которой компания также запустила gpt-oss, свою новую модель с открытым исходным кодом. Но, разумеется, все взгляды прикованы к новому флагману, который считается одним из самых ожидаемых продуктов со времен появления ChatGPT в 2022 году.
Тем не менее, несмотря на все обещания, похоже, что GPT-5 не обязательно является тем самым прорывом, которого многие ждали. Но, как всегда в мире искусственного интеллекта, тесты производительности — это лишь часть картины. Настоящий вопрос в том, что произойдет, когда модель начнет работать в реальных условиях.