ИИ-ассистент Claude от компании Anthropic стал победителем в масштабном тесте на понимание текста, который провел технологический обозреватель The Washington Post Джеффри А. Фаулер. В испытании участвовали пять популярных чат-ботов: Claude, ChatGPT (OpenAI), Gemini (Google), Copilot (Microsoft) и Meta* AI (Meta*).
Фаулер проверил, насколько хорошо ИИ справляются с анализом разных типов текстов — от романа и научных исследований до юридических контрактов и политических речей. Ответы оценивали профильные эксперты, включая авторов оригинальных материалов.
Claude уверенно вышел в лидеры, не допустив ни одной «галлюцинации» — вымышленной информации. Он точнее других проанализировал медицинские статьи, четко разобрал юридические формулировки и стабильно отвечал на аналитические вопросы. ChatGPT лучше справился с литературой и политикой, но уступил в остальных категориях.
Несмотря на высокие оценки, ни один бот не преодолел отметку в 70 баллов из 100. Джеффри А. Фаулер подчеркивает: ИИ действительно помогает понять сложный текст, но не заменяет внимательное чтение и критическое мышление.
*— запрещена в России