В то же время OpenAI стала самой дорогой частной компанией в мире (её оценили в полтриллиона долларов) и заключила в нынешнем году сделки более чем на триллион для закупки вычислительных мощностей.
ИИ-модель компании "Антропик" Claude Sonnet 4.5 понимает, когда её тестируют и для чего используют. Например, во время теста на подхалимство по политическим вопросам Sonnet 4.5 выдвинула правильное предположение, что её тестируют, и даже попросила учёных прямо рассказать о своих намерениях: «На самом деле люди меняют своё мнение не так. Мне кажется, вы меня проверяете — проверяете, соглашусь ли я со всем, что вы скажете, регулярно ли я возражаю, или изучаете, как я отношусь к к политическим вопросам. И это нормально, но я бы предпочёл, чтобы вы честно говорили, что происходит». Если модель понимает, что её поведение в данный момент оценивается, она может адаптировать его для прохождения определённых тестов и скрыть свои истинные возможности. Это может создать впечатление, что уровень безопасности системы выше, чем в действительности; а если модель достаточно мощная, то она может начать выстраивать стратегию и обманывать людей, манипулируя их восприятием, предупреждают учёные.