Многообещающая презентация GPT-5.2

Многообещающая презентация GPT-5.2

Многообещающая презентация GPT-5.2

Впервые за три года с момента выхода GPT-3.5 в ноябре 2022, OpenAI уступила лидерство сначала Google с Gemini 3 Pro, а чуть позже и Anthropic с моделью Claude Opus 4.5.

Альтман ввел «красный код», мобилизировав все ресурсы и козыри, в целях населения контрудара индустрии.

Альман не может быть вторым, т.к. на способности удерживать лидерство завязана способность к выживанию компании, сильно зависящей от внешнего фондирования (практически полностью через венчурный капитал), которое за три года превысило 70 млрд долл.

Сейчас OpenAI генерирует примерно 1-1.5 доллара убытка на каждый доллар выручки (оценочная выручка 15 млрд при убытках около 15-20 млрд) и нет ни малейших признаков, что бизнес концепция улучшится, скорее наоборот – убытки будут нарастать в геометрической прогрессии на фоне неадекватных инвестиционных планов.

Я много описывал в серии материалов фундаментальные архитектурные ограничения современных LLMs, также описывал экономические препятствия для обеспечения положительного денежного потока в ИИ бизнеса.

В этом бизнесе есть несколько ключевых особенностей:

• Чрезвычайно неэффективная с ресурсной и экономической точки зрения архитектура LLMs;

• Высокая миграция клиентов сразу, как только у конкурентов появляется лучше модель;

• Непрерывная потребность в аккумуляции гигантских инвестиций в инфраструктуру и R&D для поддержания лидерства (выйти в прибыль практически невозможно);

• Крайне ограниченное пространство для монетизации ИИ услуг.

В отличие от Google, у OpenAI нет смежного бизнеса, генерирующего десятки миллиардов долларов OCF, поэтому устойчивость бизнеса держится на хайпе и интересе венчурных капиталистов, которые имеют определенный порог терпения и лимит финансовых средств.

Помимо конкурентных моделей, здесь необходимо поддерживать ажиотаж, постоянно «греть» интерес публики. Google это удалось с яркой презентацией Gemini 3 Pro, после которой кризис в OpenAI стал более заметным.

Альману необходимо было ответить и он выложил все, что у него было. Это, вероятно, самая акцентированная презентация за три года с точки зрения демонстрации преимуществ, особенностей и специализации моделей с сильным акцентом на бенчмарках.

Сразу отмечу, что успешность презентации проецируется через хайп-поглощение, зависимый от цитирования и обсуждения, которые в свою очередь зависят от формальных метрик в бенчмарках и акцентах в презентации (Альман усвоил этот урок).

Это означает, что модели специально тренируются для демонстрации хороших показателей в бенчмарках, поэтому все тесты больше не являются репрезентативными и информативными, хотя показывают общую тенденцию.

Не стоит слишком сильно придавать значение избыточному пафосу в презентации, где заявляется, что GPT-5.2 в очередной раз устанавливает новые стандарты, имея возможность трансформировать экономику и научно-технический прогресс. Помним, в каком положении находится Альман…

Из заявленного:

Проф.-задачи (GDPval): превосходит или сравнима с ведущими специалистами в 70.9% кейсов на задачах интеллектуального труда (44 профессии, 9 отраслей).

Долгий горизонт рассуждений и длинный контекст: фундаментальный прогресс в стабильности на всем контекстном окне (ранее ключевое препятствие для интеграции ИИ в реальные задачи).

Снижение галлюцинаций на ~30% в сравнении GPT-5.1Thinking.

Агентность и инструменты: надёжно выполняет длительные многошаговые задачи с вызовом инструментов; сильна в агентном анализе данных и документов.

Кодинг: лучше в интерактивном программировании, проверке/поиске ошибок; умеет рефакторить большие кодовые базы и доводить код с меньшим ручным вмешательством.

Фронтенд/UI: сильнее в сложной и нестандартной UI-разработке, включая 3D-элементы.

Визуальное восприятие: очень сильна в анализе диаграмм и понимании интерфейсов; лучше считывает пространственное расположение элементов на изображении; снижает ошибки примерно вдвое в визуальных задачах.

Общий интеллект и абстракции: заметные улучшения в общей компетентности и решении новых/абстрактных задач.

Многообещающая презентация GPT-5.2

Многообещающая презентация GPT-5.2

Источник: Telegram-канал "Spydell_finance"

Топ

Лента новостей