Исследование: ИИ сложнее подделать токсичное поведение, чем интеллект

habr.com:

Большие языковые модели (БЯМ) легко отличить от людей при общении в социальных сетях, поскольку наиболее явным признаком служит чрезмерно дружелюбный тон.

Учёные из нескольких университетов протестировали девять моделей с открытым доступом на платформах X, Bluesky и Reddit. Созданные исследователями классификаторы смогли выявлять ответы, сгенерированные искусственным интеллектом, с точностью от 70 до 80%.В своей работе научная группа представила «вычислительный тест Тьюринга» для оценки того, насколько ИИ-модели соответствуют человеческому языку.

Читать на habr.com Все новости от habr.com

Лаборатория Марка Цукерберга представила жёсткий бенчмарк для проверки LLM на выполнение сложных инструкций

Uber уволила подрядчиков, разрабатывающих инструменты искусственного интеллекта

Dell утверждает, что внедрение Windows 11 происходит гораздо медленнее, чем Windows 10

Названа предполагаемая цена компактного PC Steam Machine — больше, чем хотелось, но меньше, чем могло быть

Лаборатория Марка Цукерберга представила жёсткий бенчмарк для проверки LLM на выполнение сложных инструкций

Uber уволила подрядчиков, разрабатывающих инструменты искусственного интеллекта

Dell утверждает, что внедрение Windows 11 происходит гораздо медленнее, чем Windows 10

Названа предполагаемая цена компактного PC Steam Machine — больше, чем хотелось, но меньше, чем могло быть

Почему Samsung сложно навязать борьбу Meta в сегменте смарт-очков

Исследователи МГУ и Яндекса создали первый открытый датасет и метод обучения нейросетей сложным правилам русского языка

Fleet Space обнаружил крупное месторождение лития с помощью искусственного интеллекта и спутников