ИИ-модели показали схожие результаты при генерации креативных идей

ИИ, креативность, модели, исследование, идеи

Разница в креативности между популярными ИИ-моделями, включая ChatGPT, Gemini и Claude, оказалась минимальной. К такому выводу пришли исследователи платформы Springboards по итогам масштабного тестирования 16 систем от ведущих компаний — OpenAI, Google, Meta, Anthropic и других.

Каждой модели предлагали реальные маркетинговые задачи для 100 известных брендов, включая Nike, IKEA и McDonald’s. Затем 678 специалистов из сферы маркетинга и рекламы оценивали более 11 тысяч ответов ИИ в формате «слепого» тестирования.

Главный вывод — ни одна модель не показала явного превосходства. Даже лучшие из них выигрывали в сравнении не более чем в 61% случаев, что исследователи сравнили с подбрасыванием монетки.

Кроме того, ИИ-системы плохо оценивают собственную работу: они часто не совпадают с мнением людей и проявляют чрезмерную уверенность в своих решениях.

По мнению авторов исследования, ИИ следует использовать не как источник окончательных решений, а как инструмент расширения круга идей. Финальная оценка — за человеком.