Впервые за 75 лет существования теста Тьюринга искусственный интеллект сумел успешно пройти его в классическом формате. Этот тест — один из самых известных способов проверить, насколько машина похожа на человека.
Исследователи Калифорнийского университета в Сан-Диего провели эксперимент, в котором люди в течение пяти минут переписывались одновременно с другим человеком и с ИИ — не зная, кто есть кто. После разговора участники должны были угадать, где был настоящий человек.
Модель GPT-4.5, настроенная на разговор в стиле молодого интроверта, увлеченного интернет-культурой, смогла обмануть участников в 73% случаев — ее чаще принимали за человека, чем настоящего собеседника. Модель LLaMa-3.1 тоже показала высокий результат — 56%. При этом более простые системы, вроде старой программы ELIZA и версии GPT-4o без «персоны», распознавали правильно почти всегда.
Исследователи отмечают: это первое надежное доказательство, что современные языковые модели могут вести как люди.
Авторы эксперимента считают, что такие ИИ-системы в будущем смогут заменить человека в части общения — например, в службах поддержки, образовании и других сферах, где важна быстрая реакция и «человеческий» стиль общения.