AI выигрывает 40% от бюджета в миллион долларов в последнем тесте кодирования OpenAI

habr.com

habr.com:

Новый бенчмарк от OpenAI раскрывает как перспективы, так и ограничения AI в разработке ПО. Хотя модели AI могут справиться со многими задачами программирования, они все еще испытывают трудности со сложными программными проектами, требующими глубокого понимания и комплексных решений.

Тест SWE-Lancer от OpenAI проверил возможности моделей AI с использованием 1400 реальных заданий от Upwork, что составляет $1 млн.

Читать на habr.com Все новости от habr.com

OpenAI запускает новые инструменты для создания агентов AI

Microsoft готовит внутренние модели AI, способные конкурировать с OpenAI и Anthropic

Turing, ключевой поставщик кодирования для OpenAI и других производителей LLM, привлек $111 млн при оценке в $2,2 млрд

Бывший руководитель отдела политики OpenAI критикует компанию за «переписывание» истории безопасности AI

OpenAI запускает новые инструменты для создания агентов AI

Microsoft готовит внутренние модели AI, способные конкурировать с OpenAI и Anthropic

Turing, ключевой поставщик кодирования для OpenAI и других производителей LLM, привлек $111 млн при оценке в $2,2 млрд

Бывший руководитель отдела политики OpenAI критикует компанию за «переписывание» истории безопасности AI

OpenAI отходит от теории внезапного прорыва в области AGI

Сообщается, что OpenAI планирует взимать до $20 000 в месяц за специализированных AI-агентов

OpenAI планирует внедрить видеогенератор Sora в ChatGPT

OpenAI представляет видеогенератор Sora в Великобритании и ЕС

«GPT-4.5 доказывает возможность продолжения парадигмы масштабирования», — главный научный сотрудник OpenAI

OpenAI представляет GPT-4.5: новый рубеж в эволюции языковых моделей

You.com представляет агент на основе AI, который обрабатывает более 400 источников одновременно

Выручка Nvidia достигла 39,3 млрд долларов, увеличившись на 78% в четвертом финансовом квартале

Стремление OpenAI к росту оказывает давление на стартапы в сфере AI

Лгал ли xAI о тестах Grok 3?

Сообщается, что Safe Superintelligence Суцкевера привлекает средства на сумму 30 миллиардов долларов

Стартап Codeium, занимающийся кодированием AI, ведет переговоры о привлечении оценки почти в 3 млрд долларов

OpenAI теперь обслуживает 400 миллионов пользователей каждую неделю

OpenAI заявляет, что ее совет директоров единогласно отклонил заявку Илона Маска

OpenAI представляет рекомендации по эффективному использованию моделей серии O: акцент на прямом обучении

Искусственный интеллект без угодливости: OpenAI обновляет спецификацию ChatGPT

OpenAI планирует выпустить GPT-4.5 в течение нескольких недель, подготавливая почву для GPT-5

Microsoft предлагает авторам 5000 долларов за обучение AI на их книгах

Стартап по разработке суперинтеллекта бывшего ученого OpenAI Суцкевера может достичь оценки в 20 миллиардов долларов

Hugging Face работает над копированием возможностей OpenAI Deep Research с помощью агента AI с открытым исходным кодом

Intel Capital выделяет TrueFoundry 19 млн долларов на финансирование масштабного внедрения AI

Исследователи создали открытого конкурента модели рассуждений OpenAI o1 менее чем за $50

Робототехнический стартап Figure AI прекращает партнерство с OpenAI, чтобы создавать собственные модели AI

Продукты, которые обезвоживают кожу и приводят к быстрому появлению морщин

Какой сыр помогает оставаться молодым дольше - неожиданное открытие

Разобучаем языковые модели: как заставить ИИ забыть только определенные знания

«Career Dreamer» от Google использует AI, чтобы помочь изучить возможности трудоустройства

Стартап ИИ-рекрутинга Mercor привлек первые $100 млн и получил оценку в $2 млрд

В Formula E появились остановки для подзарядки Pit Boost

Samsung Galaxy Fold 7 появился на первых рендерах, которые полностью раскрывают его дизайн

Для самых нетерпеливых: инсайдер показал CAD-рендеры четырех моделей iPhone 17

Темная тема разряжает батарею смартфонов и ноутбуков быстрее, чем считалось ранее

На юге Прибайкалья соорудят антенное поле 700 на 700 м для изучения ионосферы

Военнослужащий США признал вину во взломе AT&T и Verizon и краже данных абонентов

Напитки, которые нужно исключить после 50 лет - могут подорвать здоровье

Devolver Digital сообщила дату релиза Talos Principle: Reawakened - 10 апреля

Релиз велосипедного симулятора Wheel World состоится летом этого года, на PC стала доступна бета-версия

На каком боку нужно спать, чтобы не храпеть, рассказал врач

Простой продукт снижает риск рака – неожиданные результаты исследований

Полезнейшая закуска, которую категорически запрещено сочетать с алкоголем

Фрукт, который поможет предотвратить деменцию и болезнь Альцгеймера

Топ-10 вещей, которые делать в самолете категорически нельзя

Леденящий ужас: видео-момент с акулой, когда дайвер понял, что его преследуют

Камера случайно упала в пропасть подо льдами в Антарктиде - уникальные кадры

Привычки, разрушающие ваше тело после 50 лет - о чем врачи советуют забыть

Новая модель AI от Microsoft «Muse» способна генерировать игровой процесс

OpenEvidence привлекает $75 миллионов для расширения использования ИИ в медицине

Google удаляет Gemini из основного поискового приложения на iOS

Релиз Wireshark 4.4.4

GlowByte приглашает на презентацию книги Брюса Сильвера «BPMN метод и стиль»

Samsung показала первый видео-тизер смартфонов Galaxy A36 и Galaxy A56, в котором намекнула на 6 лет обновлений ОС Android

Состоялся анонс Wanderstop для Xbox Series, также стала доступна бета-версия для PC

Официально: DC одобрила производство долгожданного сиквела фильма “Константин”

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA