Разница в креативности между популярными ИИ-моделями, включая ChatGPT, Gemini и Claude, оказалась минимальной. К такому выводу пришли исследователи платформы Springboards по итогам масштабного тестирования 16 систем от ведущих компаний — OpenAI, Google, Meta, Anthropic и других.
Каждой модели предлагали реальные маркетинговые задачи для 100 известных брендов, включая Nike, IKEA и McDonald’s. Затем 678 специалистов из сферы маркетинга и рекламы оценивали более 11 тысяч ответов ИИ в формате «слепого» тестирования.
Главный вывод — ни одна модель не показала явного превосходства. Даже лучшие из них выигрывали в сравнении не более чем в 61% случаев, что исследователи сравнили с подбрасыванием монетки.
Кроме того, ИИ-системы плохо оценивают собственную работу: они часто не совпадают с мнением людей и проявляют чрезмерную уверенность в своих решениях.
По мнению авторов исследования, ИИ следует использовать не как источник окончательных решений, а как инструмент расширения круга идей. Финальная оценка — за человеком.




