OpenAI представили SWE-Lancer: как ИИ заменит разработчиков в задачах на $1,000,000?

habr.com

habr.com:

Сегодня OpenAI представили новый бенчмарк SWE-Lancer, предназначенный для оценки возможностей передовых языковых моделей (LLM) в выполнении реальных фриланс-задач по программированию.

Бенчмарк включает 1488 (гусары, молчать) задач с платформы Upwork, суммарной стоимостью $1 млн, и охватывает как индивидуальные инженерные задачи, так и управленческие (что особенно интересно, то есть оцениваются не только навыки программирования, но и менеджерские).Разработчики оценивали модели в двух категориях: IC SWE, где AI решает инженерные задачи, и SWE Manager, где AI выбирает наилучшее техническое предложение среди нескольких.

Читать на habr.com Все новости от habr.com

CEO студии Rebellion, которая создала Sniper Elite, не представляет, как можно организовать работу из 2000 человек, поэтому студия акцентируется на малых проектах

Разработчики Disco Elysium из студии ZA/UM представили “инновационную шпионскую RPG” Project [C4]

Роботизация и BI: как перейти от данных к решениям

Сотрудничество Microsoft и OpenAI под микроскопом: решение антимонопольного регулятора Великобритании

CEO студии Rebellion, которая создала Sniper Elite, не представляет, как можно организовать работу из 2000 человек, поэтому студия акцентируется на малых проектах

Разработчики Disco Elysium из студии ZA/UM представили “инновационную шпионскую RPG” Project [C4]

Роботизация и BI: как перейти от данных к решениям

Сотрудничество Microsoft и OpenAI под микроскопом: решение антимонопольного регулятора Великобритании

GPT-4.5: самая большая модель ИИ от OpenAI или шаг назад в развитии технологий?

Великобритания разрешила Microsoft инвестировать в OpenAI 13 миллиардов долларов в OpenAI

Возможное ограничение использования новой языковой модели OpenAI GPT-4.5 через API

Вышел GPT-4.5 от OpenAI [обновляется, UPD 4]

OpenAI GPT-4.5 – лучший и более естественный собеседник

OpenAI представила обновленную модель GPT-4.5

OpenAI представила свою самую крупную, но не самую передовую модель GPT-4.5

OpenAI блокирует китайские аккаунты за слежку в социальных сетях

OpenAI отклонила предложение Маска о покупке компании

OpenAI отвечает на вызовы конкурентов: что нового в последней модели рассуждений o3-mini?

Илон Маск хочет купить OpenAI за $97.4 млрд

OpenAI начала публиковать планы по GPT-5

OpenAI назвала даты выпуска GPT-4.5 и GPT-5 — последняя будет доступна «без ограничений» в бесплатной версии ChatGPT

OpenAI расширяет своё присутствие в Европе, предоставляя услуги хранения данных в ЕС

Universal Pictures представила трейлер нового фильма "Как приручить дракона"

Илон Маск против Сэма Альтмана. Как противостояние технобизнесменов за OpenAI может повлиять на будущее ИИ? Разбор FT, NYT и Reuters

Инвесторы во главе с Илоном Маском хотят купить OpenAI: в компании уже ответили

Илон Маск предложил выкупить OpenAI за треть стоимости. Сэм Альтман резко ответил

Discord, OpenAI и Google создают группу по безопасности детей

OpenAI провела ребрендинг, немного изменила логотип и представила новый шрифт OpenAI Sans

Минутка красоты: разработчики Disco Elysium представили сумку в виде пакета главного героя игры

AI-модели, такие как Deepseek-R1 и OpenAI o1, страдают от «недомыслия»: как это можно исправить

Технологический баттл: OpenAI o3-mini против DeepSeek-R1

Новый флагман Xiaomi 15s Pro прошёл сертификацию MIIT, раскрыв некоторые характеристики

Чат-бот Илона Маска Grok AI заявил, что Дональд Трамп и сам Илон Маск заслуживают смертной казни

Будущий планшет Samsung Galaxy Tab S10 FE прошел сертификацию Bluetooth SIG

Китай продемонстрировал первый в мире двусторонний интерфейс мозг-компьютер

Вот какие устройства Galaxy завершат свой путь с получением One UI 7.0 на базе Android 15

Перечень продуктов, которые уменьшают биологический возраст - исследование это подтвердило

Рейд на титана: как Bybit пережила крупнейший в истории взлом на $1,5 млрд

Gothic уже не та: блогер сравнил ремейк с оригинальной игрой 2001 года — и не все остались довольны

Kingdom Come: Deliverance 2 станет еще сложнее: Warhorse Studios почти закончила работу над хардкорным режимом

Apple показала лабораторию, где испытывала свой новый модем C1

Ученые нашли неожиданное применение окуркам

Какой напиток нужно пить после обеда, чтобы избежать воспаления и снизить холестерин

Первый складной iPhone может быть похожим на Oppo Find N: инсайдер раскрыл диагональ дисплеев будущей новинки от Apple

Создатель серии X-COM анонсировал необычную экшен-стратегию Chip ‘n Clawz vs. The Brainioids

22 проекта привлекли более $133 млн инвестиций за прошедшую неделю

CTO SafeMoon признал вину в криптомошенничестве на $200 млн

Хакеры взломали биржу Bybit и вывели Ethereum на $1,46 млрд

Представлен игровой монитор ViewSonic XG2737

Армия США испытывает новую боевую машину M10 Booker в экстремальных условиях Аляски

Польша представила пулемет WLKM, который может успешно сбивать вражеские дроны

Архитектура в Assassin's Creed Shadows выглядит аутентично, но не повредит ли это игре? Новый ролик показал красоты Киото

В Apple Watch Series 10 нашли существенную проблему

Капитана американского авианосца USS Harry S. Truman уволили из-за столкновения с гражданским судном

Китай проводит морские учения вблизи берегов Австралии

Ежедневные приседания: как отреагирует ваш организм и изменится самочувствие

Каша на завтрак, которая предотвращает инсульт и оздоравливает сосуды

Украинская компания Pars презентовала крылатую ракету "Трембита" с дальностью до 150 км

Бельгийские F-16 прибудут в Украину на год позже из-за задержки F-35

Alpha3D и MoonlanderAI объединяют усилия: революция в создании игр и 3D-приложений

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA