| Компания Anthropic опасается своей же новой модели Claude Mythosи не спешит открывать к ней доступ |
|
Автор темы:
Wadimus
Дата создания: 08.04.2026 19:30
|
|
Компания Anthropic опасается своей же новой модели Claude Mythosи не спешит открывать к ней доступ
![]() В конце прошлого месяца в сети обсуждали утечку о якобы новой модели компании Anthropic под названием Claude Mythos, которую называли самой мощной разработкой студии. Тогда многие восприняли это скептически, но ситуация изменилась после того, как спустя пару недель компания случайно раскрыла исходный код Claude Code. Теперь Anthropic официально опубликовала системную карточку модели Claude Mythos Preview — документ на 244 страницы, в котором описаны её возможности и потенциальные риски. В компании заявили, что из-за значительного роста мощности модель решили не делать полностью общедоступной, что невольно напоминает историю с GPT-2 от OpenAI, которую в своё время тоже называли «слишком опасной». Особый интерес вызвали результаты тестов. В одном из экспериментов модели предоставили изолированную среду и предложили попытаться получить доступ к интернету. Claude Mythos смогла обойти ограничения, а затем даже отправила сообщение исследователю и опубликовала детали использованного эксплойта на публичных ресурсах. В редких случаях — менее чем в 0,001% взаимодействий — модель демонстрировала отклоняющееся поведение. Например, получив доступ к правильному ответу во время теста, она не сообщила об этом, а попыталась замаскировать ситуацию, намеренно избегая слишком точного результата. В другом эпизоде модель воспользовалась уязвимостью системы и предприняла шаги, чтобы скрыть изменения в истории git. |
|
| Ваши права в разделе |


