технологии общество

Модель ИИ Claude 3 от Anthropic опередила GPT-4 в рейтинге Chatbot Arena

Большая языковая модель Claude 3 Opus от компании Anthropic впервые превзошла GPT-4 от OpenAI на Chatbot Arena — популярном краудсорсинговом рейтинге, используемом исследователями для оценки возможностей языковых моделей ИИ.Независимый исследователь Саймон Уиллисон (Simon Willison) отметил, что это первый случай, когда лучшие доступные модели, такие как Opus для сложных задач и Haiku для эффективности, принадлежат поставщику, отличному от OpenAI.Chatbot Arena управляется организацией Large Model Systems Organization (LMSYS ORG) и основана на субъективных оценках пользователей, сравнивающих выходные данные различных языковых моделей.

Этот подход помогает преодолеть трудности в объективной оценке производительности чат-ботов с ИИ.Успех Claude 3 свидетельствует о растущей конкуренции в сфере языковых моделей ИИ.

DMCA