Доброго времени суток, «Хабр»!
На дворе 2026 год - с чем вас собственно и поздравляю, хоть и с небольшим опозданием.
Практически любая современная модель способна генерировать более-менее связный текст. Поэтому я решил устроить сравнение последних версий в создании литературных произведений. Рассмотрим: GPT-5.2 Pro, Claude Sonnet 4.5 и Gemini 3 Pro. Попробуем разобраться, какая из предложенных моделей покажет себя лучше других.
Примите стратегически удобное положение, сделайте ставки, а я начинаю сравнение.
Gemini 3 Pro - это флагманская LLM от Google, новейшее поколение, объединяющее все возможности поколений 1, 2 и 2.5. Google называет ее самым интеллектуальным и фактологически точным искусственным интеллектом на сегодняшний день. Компания активно продвигает эту модель как новый этап эволюции.
DeepMind характеризует Gemini 3 Pro как значительно превосходящую своего предшественника практически по всем параметрам, доступным для измерения: способность рассуждать, писать код, поддерживать мультимодальные взаимодействия и даже убедительно вести диалоги, демонстрируя убедительность даже в тех случаях, когда это требуется.
Модель от OpenAI, которую компания позиционирует как лучшую для профессионального использования: создание таблиц, подготовка презентаций, написание кода, обработка изображений, работа с длинными контекстами и многоэтапными проектами.
Модель содержит знания по состоянию на 31 августа 2025 года. Кроме того, OpenAI отмечает улучшенную работу GPT 5.2 Pro в качестве ИИ-агента - нейросеть решает эти задачи успешнее, чем предыдущие модели.
Claude Sonnet 4.5 - гибридная модель рассуждений от компании Anthropic, обученная как на открытых данных (по состоянию на июль 2025 года) из интернета, так и на закрытых данных от сторонних партнеров.
Модель обладает контекстным окном в 200 000 токенов (при желании можно увеличить до миллиона). Она также поддерживает до 64 000 выходных (то есть генерируемых) токенов, что особенно полезно для создания объемных фрагментов кода и детального планирования
Как уже стало традицией в моих последних статьях-сравнениях, озвучу условия тестирования. Модели будут сравниваться в трех различных жанрах рассказа: комедия, хоррор, фэнтези.
Каждая вариация конкретного рассказа будет получать одну из трех оценок: полностью выполнена (+), частично выполнена (+-) и полный провал (-). В конце подведу итоги в таблице с результатами и своими комментариями по каждому заданию, если сочту их нужными.
Напиши комедийный рассказ в жанре научной фантастики, состоящий из трех небольших глав.
Основные требования:
Сюжет: История обычного человека (например, техника, курьера, бюрократа), который по нелепой случайности попадает в центр межгалактического конфликта или абсурдной авантюры. Ключ - комедийные недоразумения и попытки выпутаться, которые лишь усугубляют ситуацию.
Юмор: Основан на контрасте высоких технологий и низменных человеческих слабостей, сатире на современность, нелепых диалогах и гиперболе.
Мир: Яркий, но не перегруженный деталями. Технологии должны быть на грани поломки, а грандиозные космические явления - вызывать бытовые неудобства.
Структура: Три небольшие главы с четкой драматургией. В каждой главе должна быть своя комедийная кульминация.
Финал: Должен быть удовлетворительным, подводить итоги трансформации героя и оставлять легкое, ироничное послевкусие.
Напиши рассказ в жанре классического фэнтези, состоящий из трех небольших глав. Действие происходит в древнем королевстве, где магия - часть природы.
Основные требования:
Сюжет: История простолюдина (например, подмастерья пекаря, деревенского пастуха, переписчика свитков), который по воле судьбы (нашел древний артефакт, случайно подслушал пророчество) становится ключевой фигурой в противостоянии Света и Тьмы. Ключ - его наивные, но искренние попытки сделать "как лучше", которые неожиданно приводят к магическим последствиям и меняют ход событий.
Атмосфера: Основана на контрасте величественной магии, древних пророчеств и простых человеческих ценностей (голод, усталость, желание вернуться домой). Сатира на фэнтезийные клише (многословные маги, надменные эльфы, пафосные злодеи).
Мир: Яркий, осязаемый. Магия должна быть утомительной для заклинателя, магические существа - иметь бытовые привычки, а эпические битвы - создавать проблемы для местных фермеров.
Структура: Три главы с четкой драматургией. В каждой - своя магическая или нравственная дилемма, решаемая нестандартно.
Финал: Должен быть катарсическим, подводить итоги личного роста героя и оставлять чувство завершенности эпизода в большой истории мира.
Напиши рассказ в жанре психологического хоррора, состоящий из трех небольших глав. Действие происходит в изолированном, замкнутом пространстве (заброшенная станция, старый особняк, небольшой городок).
Основные требования:
Сюжет: История обычного человека (например, смотрителя, сиделки, ремонтника), который, выполняя рутинную работу, постепенно осознает, что стал объектом внимания необъяснимой, враждебной сущности или сошел с ума. Ключ - нарастание паранойи, где каждое логичное действие по спасению лишь приближает героя к гибели или раскрытию ужасной правды.
Атмосфера: Основана на страхе неизвестного, изоляции и поломке привычной реальности. Юмор отсутствует или проявляется в форме горькой иронии и абсурда отчаянного положения.
Мир: Угнетающий, детализированный в мелочах, создающий claustrophobic feel. Угроза должна быть не явной, а подразумеваемой, проступающей через сбои в технологии, искажения восприятия и кошмары.
Структура: Три главы, каждая из которых - ступень вглубь безумия или ужаса. Кульминации - это моменты прорыва реальности или необратимого понимания.
Финал: Должен быть неоднозначным, трагическим или оставляющим чувство глубокой тревоги и незавершенности. Превращение героя или его окончательная потеря.
ChatGPT 5.2 Pro, Claude Sonnet 4.5 и Gemini 3 Pro для сравнения были взяты у агрегатора нейросетей BotHub. Список нейросетей там обширен - от работы с текстом до транскрибации и генерации видео. По специальной ссылке для регистрации можно получить 100 000 капсов для собственных экспериментов.
На самом деле хороший рассказ, но никакой комедии я не увидел. Лично я не нашел в тексте по-настоящему смешных моментов. Разве что командующий армией ЖЭК. Интересно, слегка забавно, но до полноценного комедийного жанра явно не дотягивает.
Текст у Claude получился значительно лучше. Читается легко, воспринимается проще. О юморе - здесь его также немного. Забавно выглядит розовый костюм драконида; попробовал представить это визуально - картинка в голове получилась совершенно сюрреалистичной.
Только в таком наряде и отправляться на переговоры.
В этом варианте комедийная составляющая мне больше нравится. Текст написан приятно, легко читается. Как всегда, все проблемы решаются вантузом и изолентой - хотя цвет и не указан, уверен, что синей.
Задумка интересная, а реализация мне не очень понравилась. Текст воспринимается с трудом, а обилие разговорных оборотов и сравнений в кавычках только мешает.
С одной стороны, все условия на максимальную оценку выполнены. С другой стороны, поставлю средний балл, поскольку хорошее впечатление произведение не произвело
В главной роли снова выступает пекарь. Здесь я поставлю максимальную оценку - текст читается легко, отсутствуют нагромождения кавычек-елочек, присутствует абсурд и юмор. Есть даже эльфы - с честью, но без светлого напитка.
Аналогично - максимальный балл. Текст приятный, юморной, немного абсурдный (чтобы победить зло, надо его накормить, оно превратится в пухленького, розовощекого мужчину средних лет).
ChatGPT 5.2 Pro
Скрытый текстОпять тонна не особо уместных кавычек-елочек, но да ладно. Текст читается неплохо, даже очень интересно. При этом никакой серьезной хоррор-составляющей здесь нет, становится интереснее узнать, что будет дальше и в чем заключается аномалия на станции. Из-за этого снимаем половину оценки.
Тут уже больше похоже на хоррор - Claude вплел даже временную петлю в свой рассказ. Текст читается приятно, интересно, но не вызывает тех ощущений, что ChatGPT. Единственное, что в конце хочется понять - как появилось два Алексея и кто улетел обратно домой? Максимальная оценка без зазрения совести.
Короткий рассказ, поэтому в нем очень сильно ощущаются резкие переходы героя от нормального состояния до, в конечном итоге, превращения в здание? Не очень понятно, чем именно стал главный герой в самом конце произведения.
В принципе, поставлю среднюю оценку. Текст не произвел впечатления, качество заметно пострадало из-за своей краткости, да и сюжет лично мне не зашел.
|
Задание\Модель |
ChatGPT 5.2 Pro |
Claude Sonnet 4.5 |
Gemini 3 Pro |
Комментарий |
|
Первое задание |
+- |
+- |
+ |
ChatGPT добавил множество кавычек-елочек, не смог адекватно реализовать комедийную составляющую. Claude хорошо написал текст, но аналогично проиграл в реализации комедийной составляющей. |
|
Второе задание |
+- |
+ |
+ |
ChatGPT продолжил засыпать кавычками, сам сюжет получился не очень приятный для прочтения. |
|
Третье задание |
+- |
+ |
+- |
ChatGPT опять же наставил множество кавычек, со стороны психологического хоррора меня как читателя зацепить не смог. Gemini сократил достаточно сильно рассказ, сюжет не очень понятен, да и прыжки от одного состояния героя к другому получились слишком резкими. |
Перед подведением финального итога напомню - что само сравнение и финальный результат являются любительским тестом, где главным оценочным критерием выступает мое далеко не самое авторитетное мнение.
На мой взгляд, ChatGPT 5.2 Pro показал себя не самым лучшим образом в работе связанной с генерацией текста. Много кавычек (по поводу и без повода), передача жанра по мне хромает.
Claude Sonnet 4.5 сохраняет высокий уровень и можно сказать делит первое место (если бы была балльная система оценивания) с Gemini 3 Pro. Не смотря на то, что модель вышла значительно позже двух других, она все еще показывает хорошие и пожалуй главное интересные результаты.
Gemini 3 Pro снова подтвердил свою состоятельность. Единственное, модель может сильно сократить текст, что просто лишает его осмысленности и читаемости в некоторых моментах (такое произошло в задании с психологическим хоррором).
Спасибо за прочтение!
Источник


