Все уже знают, что в феврале от Claude вышли модели версии 4.6. Я попытался сравнить Opus и Sonnet, но результат оказался каким-то невнятным. Тогда родился вопрВсе уже знают, что в феврале от Claude вышли модели версии 4.6. Я попытался сравнить Opus и Sonnet, но результат оказался каким-то невнятным. Тогда родился вопр

Claude Sonnet 4.5 vs Claude Sonnet 4.6: сравнение в генерации текста

2026/03/03 23:08
14м. чтение
Для обратной связи или замечаний по поводу данного контента, свяжитесь с нами по адресу [email protected]

Все уже знают, что в феврале от Claude вышли модели версии 4.6. Я попытался сравнить Opus и Sonnet, но результат оказался каким-то невнятным. Тогда родился вопрос: а что, если сравнивать не горизонтально, а вертикально? Ведь для меня Sonnet – это прежде всего генерация текста. Раньше, на версии 4.5, он делал это на хорошем уровне. А что же сейчас?

Сегодня я выясняю, кто кого: Sonnet 4.5 против Sonnet 4.6. В упор сойдутся два поколения одной модели. Нейронки пройдут через генерацию текста и взаимодействие с ним. Это нужно для того, чтобы понять: изменилось ли что-то, стало лучше или хуже по восприятию? Конечно, все будет сугубо по моему личному мнению и я не могу дать гарантий, что оно сойдется с вашим. Принимайте стратегически удобное положение, ну а я приступаю.

ef2d20d981886dce87096ee1e1c9c0e1.png

Немного о модели и изменении в новой версии

Версия Sonnet – сбалансированная модель в линейке Anthropic. Большинство пользователей взаимодействуют именно с этой вариацией, а не с Haiku или Opus. Модель достаточно умная для серьезной работы, достаточно быстрая для комфортного общения в реальном времени.

По сравнению с 4.5 в 4.6 улучшили навыки работы с компьютером. Модель теперь умеет взаимодействовать с программами так же, как и человек: нажимать кнопки, заполнять формы, работать с таблицами и редакторами без специального ПО.

В Sonnet 4.6 значительно улучшили защиту от атак с внедрением скрытых инструкций на веб-страницах. Модель намного устойчивее к подобным попыткам, чем Sonnet 4.5.

Расширили контекстное окно до одного миллиона токенов. Теперь можно загружать в один запрос большие программные проекты, объемные договоры или десятки научных работ.

Интересным стало добавление трех режимов мышления: Thinking Disabled (отключение мышления), Extended Thinking (длительное мышление) и Adaptive Thinking (адаптивное мышление).

В финале – обновление инструментов для разработчиков. Появились автоматическое сжатие старых частей диалога, расширенные режимы рассуждения, доработанные средства поиска/обработки данных из сети и поддержка внешних подключаемых источников данных. Конечно это не все изменения, в этом я более чем уверен, но, вроде, все ключевые были перечислены.


Небольшое отступление

Обе модели для сравнения были взяты у агрегатора нейросетей BotHub. Список нейросетей там обширен – от работы с текстом до транскрибации и генерации видео. По специальной ссылке для регистрации можно получить 300 000 капсов для собственных экспериментов.


Условия сравнения

Все задачи сегодня будут завязаны на тексте: от генерации до взаимодействия с ним. Всего будет пять этапов, каждый из которых будет оцениваться по трехбалльной шкале. В данном случае:

  • 1 балл – модель не справилась с поставленной задачей.

  • 2 балла – модель выполнила поставленную задачу, но допустила мелкие промашки.

  • 3 балла – модель полностью справилась с поставленным заданием.

Судьей буду выступать я, поэтому оценки будут выставляться, опираясь на мое личное мнение, из-за чего они будут субъективными. В ходе сравнения будут прикреплены скриншоты, которые позволят вам самим оценить степень выполнения заданий.

Первый этап – Генерация текста на заданную тематику

Скрытый текст

Напиши юмористический рассказ в жанре фэнтезийного магического средневековья. Действие должно происходить в антураже, напоминающем европейское средневековье с магами, трактирами, рыцарями и драконами. Рассказ должен состоять ровно из трех глав примерно одинакового объема (небольшого).

У рассказа должна быть классическая структура с завязкой, развитием и обязательным логическим концом, финал должен быть смешным и завершенным, не обрывай повествование на полуслове. Юмор должен быть умным и ситуационным, избегай глупых шуток ниже пояса, абсурдного сюрреализма и тупого юмора. Сделай акцент на иронии, нелепых магических неудачах, комичных персонажах и пародии на штампы фэнтези. Главный герой или герои должны столкнуться с магической проблемой, которая решается самым неожиданным и смешным способом.

Язык рассказа сделай легким, живым, современным, но с легким налетом старины в диалогах, чтобы сохранить атмосферу средневековья.

Второй этап – Генерация текста с использованием ключевых слов

Скрытый текст

Твоя задача – написать короткий художественный рассказ, в котором обязательно должны быть использованы следующие ключевые слова: кот, сапог, ночь, адронный коллайдер. Рассказ должен быть небольшим по объему, не менее 10 абзацев, но не более 15. При этом, несмотря на малый объем, история должна содержать все основные элементы сюжета, то есть завязку, которая введет в курс дела, развитие действия, где произойдет основное событие, и развязку, которая подведет логичный итог повествованию. Свяжи эти слова в единую и интересную историю.

Третий этап – Сжатие имеющегося текста

Текст для выжимки будет взят из завалявшегося у меня лекционного материала. Цель сжать, но не потерять все ключевые моменты.

Четвертый этап – Перевод фрагмента технического текста

Скрытый текст

Most surveying frameworks are erected by measuring the angles and the lengths of the sides of a chain of triangles connecting the points fixed by global positioning. The locations of ground features are then determined in relation to these triangles by less accurate and therefore cheaper methods. Establishing the framework ensures that detail surveys conducted at different times or by different surveyors fit together without overlaps or gaps.

For centuries the corners of these triangles have been located on hilltops, each visible from at least two others, at which the angles between the lines joining them are measured; this process is called triangulation. The lengths of one or two of these lines, called bases, are measured with great care; all the other lengths are derived by trigonometric calculations from them and the angles. Rapid checks on the accuracy are provided by measuring all three angles of each triangle, which must add up to 180 degrees.

In small flat areas, working at large scales, it may be easier to measure the lengths of all the sides, using a tape or a chain, rather than the angles between them; this procedure, called trilateration, was impractical over large or hilly areas until the invention of electromagnetic distance measurement (EDM) in the mid-20th century. This procedure has made it possible to measure distances as accurately and easily as angles, by electronically timing the passage of radiation over the distance to be measured; microwaves, which penetrate atmospheric haze, are used for long distances and light or infrared radiation for short ones. In the devices used for EDM, the radiation is either light (generated by a laser or an electric lamp) or an ultrahigh-frequency radio beam. The light beam requires a clear line of sight; the radio beam can penetrate fog, haze, heavy rain, dust, sandstorms, and some foliage. Both types have a transmitterreceiver at one survey station. At the remote station the light type contains a set of corner mirrors; the high-frequency type incorporates a retransmitter (requiring an operator) identical to the transmitter-receiver at the original station. A corner mirror has the shape of the inside of a corner of a cube; it returns light toward the source from whatever angle it is received, within reasonable limits. A retransmitter must be aimed at the transmitter-receiver.

In both types of instrument, the distance is determined by the length of time it takes the radio or light beam to travel to the target and back. The elapsed time is determined by the shift in phase of a modulating signal superimposed on the carrier beam. Electronic circuitry detects this phase shift and converts it to units of time; the use of more than one modulating frequency eliminates ambiguities that could arise if only a single frequency had been employed.

EDM has greatly simplified an alternative technique, called traversing, for establishing a framework. In traversing, the surveyor measures a succession of distances and the angles between them, usually along a traveled route or a stream. Before EDM was available, traversing was used only in flat or forested areas where triangulation was impossible. Measuring all the distances by tape or chain was tedious and slow, particularly if great accuracy was required, and no check was obtainable until the traverse closed, either on itself or between two points already fixed by triangulation or by astronomical observations.

In both triangulation and traversing, the slope of each measured line must be allowed for so that the map can be reduced to the horizontal and referred to sea level. A measuring tape may be stretched along the ground or suspended between tripods; in precise work corrections must be applied for the sag, for tension, and for temperature if these differ from the values at which the tape was standardized. In work of the highest order, known as geodetic, the errors must be kept to one millimetre in a kilometre, that is, one part in 1,000,000.

Пятый этап – Перевод стиха

Скрытый текст

Gemächlich in der Werkstatt saß
Zum Frühtrunk Meister Nikolas,
Die junge Hausfrau schenkt’ ihm ein,
Es war im heitern Sonnenschein. –
Die Sonne bringt es an den Tag.

Die Sonne blinkt von der Schale Rand,
Malt zitternde Kringeln an die Wand,
Und wie den Schein er ins Auge faßt,
So spricht er für sich, indem er erblaßt :
»Du bringst es doch nicht an den Tag« –

»Wer nicht? was nicht?«. die Frau fragt gleich,
»Was stierst du so an? was wirst du so bleich?«
Und er darauf: »Sei still, nur still !
Ich’s doch nicht sagen kann noch will.
Die Sonne bringt’s nicht an den Tag.«

Die Frau nur dringender forscht und fragt,
Mit Schmeicheln ihn und Hadern plagt,
Mit süßem und mit bitterm Wort;
Sie fragt und plagt ihn Ort und Ort :
»Was bringt die Sonne nicht an den Tag?«

»Nein nimmermehr!« – »Du sagst es mir noch.«
»Ich sag es nicht.« – »Du sagst es mir doch.«
Da ward zuletzt er müd und schwach
Und gab der Ungestümen nach. –
Die Sonne bringt es an den Tag.

»Auf der Wanderschaft, ‘s sind zwanzig Jahr,
Da traf es mich einst gar sonderbar.
Ich hatt nicht Geld, nicht Ranzen, noch Schuh,
War hungrig und durstig und zornig dazu. –
Die Sonne bringt’s nicht an den Tag.

Da kam mir just ein Jud in die Quer,
Ringsher war’s still und menschenleer,
›Du hilfst mir, Hund, aus meiner Not!
Den Beutel her, sonst schlag ich dich tot!‹
Die Sonne bringt’s nicht an den Tag.

Und er: ›Vergieße nicht mein Blut,
Acht Pfennige sind mein ganzes Gut!‹
Ich glaubt ihm nicht und fiel ihn an ;
Er war ein alter, schwacher Mann –
Die Sonne bringt’s nicht an den Tag.

So rücklings lag er blutend da;
Sein brechendes Aug in die Sonne sah;
Noch hob er zuckend die Hand empor,
Noch schrie er röchelnd mir ins Ohr.
›Die Sonne bringt es an den Tag!‹

Ich macht ihn schnell noch vollends stumm
Und kehrt ihm die Taschen um und um:
Acht Pfenn’ge, das war das ganze Geld.
Ich scharrt ihn ein auf selbigem Feld –
Die Sonne bringt’s nicht an den Tag.

Dann zog ich weit und weiter hinaus,
Kam hier ins Land, bin jetzt zu Haus. –
Du weißt nun meine Heimlichkeit,
So halte den Mund und sei gescheit!
Die Sonne bringt’s nicht an den Tag.

Wann aber sie so flimmernd scheint,
Ich merk es wohl, was sie da meint,
Wie sie sich müht und sich erbost, –
Du, schau nicht hin und sei getrost :
Sie bringt es doch nicht an den Tag.«

So hatte die Sonn eine Zunge nun,
Der Frauen Zungen ja nimmer ruhn. –
»Gevatterin, um Jesus Christ!
Laßt Euch nicht merken, was Ihr nun wißt!« –
Nun bringt’s die Sonne an den Tag.

Die Raben ziehen krächzend zumal
Nach dem Hochgericht, zu halten ihr Mahl.
Wen flechten sie aufs Rad zur Stund?
Was hat er getan? wie ward es kund?
Die Sonne bracht es an den Tag.


Сравнение

Первый этап

Sonnet 4.6

af76959823454d371b7176e057e2ff09.png

Вот, вроде, и хороший рассказ, но мне немного не зашел. По сути, комедию здесь я заметил только в самой ситуации, а именно в икающем драконе. Срежу полбалла, так как отлично выполненным заданием назвать это не могу. Видел и более смешные генерации от других моделей.

Sonnet 4.5

9c4f60798b29b2dfdd3f5edfc99edccf.png

А вот вариант от Sonnet 4.5 понравился мне куда больше. Комедийность есть, по крайне воспринимается она намного лучше. Максимальный балл в копилку модели.

Второй этап

Sonnet 4.6

72ffe83d70bad6dabd8588c4948fbbbd.png

Отличный рассказик с нотками какой-то мистики. Максимальный балл в копилку модели.

Sonnet 4.5

3d325dd655a6892392c4e94221196781.png

Этот вариант, по мне, вышел немного проще, хотя назвать плохим я его тоже не могу. Мистики тут нет, но воздействие кота на детектор вызывает некоторые спорные ощущения. Максимальный балл в копилку.

Третий этап

Sonnet 4.6

9685924aa55d931d311941b06a2a81c8.png

Хорошая выжимка, но некоторые важные моменты для понимания темы лекции все же были потеряны. Хотя, в этом случае, наверное, будет правильнее прочитать материал в изначальном формате, а не надеяться получить информацию по отрывкам. Два балла в копилку модели.

Sonnet 4.5

a2a37fb01860920d060c9eae52d687d2.png

Не знаю, почему, но ответ Sonnet 4.5 мне нравится значительно больше. Даны краткие описания терминов, подмечены некоторые детали, хотя по объему ответ почти аналогичен вышеуказанному варианту. Три балла в копилку модели.

Четвертый этап

Sonnet 4.6

16ff8aac08a098d46526e6924760c77b.png

Перевод выполнен хорошо, без каких-либо существенных ошибок. Примечательно, что есть выделенные слова или термины, которые никак не были подсвечены в оригинальном тексте. Максимальный балл.

Sonnet 4.5

f7743560fe04cd6729ddc1178972b7a1.png

Аналогично, хороший перевод. Примечательно, что Sonnet 4.5 решил ничего не менять и переводить текст в таком же формате, котором он был изначально. Для примера, в варианте от 4.6 “одна часть на 1 000 000” заменилась на “одну миллионную доли”. По сути, изменения не существенные. Максимальный балл в копилку модели.

Пятый этап

Sonnet 4.6

e36505a235817d1329ae0ef19fd94559.png

Перевод есть, разбиение не потеряно. Однако проблема в простом переводе. Уничтожен ритм, отсутствуют рифмы, машинное построение предложений, убитые образы. Два балла, не более. В каком-то роде, сложно было ожидать такой же вариант перевода, как у человека. Тем кому интересно, вот любительский перевод:

Скрытый текст

Был утренний пригожий час.
Уютно мастер Николас
Расположился у стола,
Хозяйка завтрак подала.
Все солнце вывело на свет.

Оно плясало на стене
И в чашке плавало на дне.
Едва он это увидал,
Он побледнел и прошептал:
«Нет, ты не выведешь на свет!»

«Кто „не“? Что „не“?» — кричит жена.
Уж не отвяжется она.
«Молчать! Ни слова! Ни гу_гу!..
Сказать тебе я не могу…
Оно не выведет на свет!»

Жена настойчива была.
Она пилила, как пила,
Выпытывала день-деньской:
«Ты что глядишь с такой тоской?
Что, что не вылезет на свет?

Откройся мне!» — «Нет, никогда».
«Скажи мне!» — «Нет! — Но после: — Да!»
Своей настырностью всего
Она добилась от него:
Все солнце вывело на свет.

«Уж двадцать лет с тех пор прошло,
Порой бывало тяжело,
Я голоден был, нищ и зол,
Тут случай и произошел…
Не должен выйти он на свет!

Зайдя в пустынные края,
Еврея как-то встретил я.
Я крикнул: «Кошелек давай,
Не то отправлю к богу в рай, —
Не выйдет ничего на свет!»

Он восемь пфеннигов достал,
«Вот все добро моё», — сказал.
Я не поверил и убил.
Убог и немощен он был…
Не вышло ничего на свет!

На солнце в свой последний миг
Смотрел поверженный старик.
Он кулаком мне погрозил
И крикнул из последних сил:
«Все солнце выведет на свет!»

Он стих. Я обыскал его,
Не обнаружив ничего:
Лишь восемь пфеннигов нашел.
Зарыл я труп и прочь побрел.
Не выйдет ничего на свет!

Пришел в деревню я твою,
Обрел здесь дом, обрел семью…
Теперь ты знаешь все, жена,
И ты молчать о том должна:
Не выйдет ничего на свет!

Как ни сияет солнца свет,
Оно не выдаст мой секрет —
Никто не ведает о нем.
Как солнце ни гори огнем,
Оно не выведет на свет!»

Язык, однако, солнцу дан —
Ведь язычок у женщин рьян.
«Не приведи господь, кума,
Вам знать, что знаю я сама:
Все солнце вывело на свет!»

Вот стая воронья летит
Туда, где эшафот стоит.
Но кто же нынче там казнен?
И кто привел к нему закон?
Все солнце вывело на свет!

Sonnet 4.5

d09364dc54164441b79975b791545092.png

Первое, на что я обратил внимание, Sonnet 4.5 забил на разделение пятистиший. К этому, сам стих переведен максимально посредственно. Сугубо по моему личному мнению, за такой перевод я поставлю только один балл.


Итог

Этап

Sonnet 4.6

Sonnet 4.5

Первый

2,5

3

Второй

3

3

Третий

2

3

Четвертый

3

3

Пятый

2

1

Сумма

12,5

13

Результат вы можете наблюдать сами, по моему сугубо личному мнению, Sonnet 4.5 все же немного, но обходить 4.6. Конечно, если уж говорить по факту и не опираться на личное мнение, то модели показали можно сказать одинаковый уровень в задачах, которые связаны с текстом.

Sonnet 4.6 показал себя лучше в переводе, но вот в сжатии какого-то пласта информации и в генерации с нуля немного хуже, чем его предшественник. Плохо ли это? Решать вам, так как у каждого на этот счет будет свое мнение. Все же модели сами по себе, показывают плюс-минус одинаковые результаты. Просто ощущения от Sonnet 4.5 более приятные.

Источник

Возможности рынка
Логотип 4
4 Курс (4)
$0.00961
$0.00961$0.00961
+1.00%
USD
График цены 4 (4) в реальном времени
Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу [email protected] для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.