runawayllm - главные новости
runawayllm - последние новости часа
+998Anthropic объявила о запуске The Anthropic Institute — исследовательского подразделения, которое будет изучать влияние мощного ИИ на экономику, безопасность и правовую систему. Возглавил институт сооснователь компании Джек Кларк, получивший новую должность — Head of Public Benefit (глава по общественной пользе).
OpenAI добавила в ChatGPT интерактивные визуальные объяснения для более чем 70 тем по математике и физике. Теперь при вопросе о формуле или законе чатбот не просто выдает текстовый ответ, а показывает динамический модуль с ползунками — пользователь двигает переменные и сразу видит, как меняются графики и результаты вычислений. По данным OpenAI, 140 млн человек каждую неделю обращаются к ChatGPT за помощью с математикой и естественными науками.
25.02 / 09:50
самит
стартап
IPO
google
крипто
Как китайские открытые ИИ забрали почти половину рынка токенов на OpenRouter
По данным аналитиков a16z, четыре из пяти самых используемых ИИ-моделей на OpenRouter — крупнейшем API-маршрутизаторе для языковых моделей — теперь являются открытыми (open weight). Главный сюрприз — шанхайский стартап MiniMax, чья модель за считанные недели захватила около 25% всех токенов на платформе. Ещё ~10% забрала GLM-5 от Zhipu AI (Z.ai). Суммарно три автора открытых моделей — MiniMax, Zhipu и Moonshot — генерируют порядка 45% всего потребления.
25.02 / 08:40
Полгода назад ИИ не мог нарисовать часы. Теперь — 5 из 5 попыток идеальны
Исследователь из Goodeye Labs Рэнди Олсон дал 22 ИИ-моделям — от GPT-3.5 (2023) до свежих релизов 2026 года — один и тот же промпт: создать в одном HTML-файле работающие аналоговые часы с тремя стрелками, обновлением каждую секунду и белым фоном. Каждую модель прогнали пять раз, чтобы отсечь случайные удачи и провалы.
25.02 / 08:13
продукты
люди
самит
paypal
токен
CEO
Пока Stack Overflow угасает, для ИИ-агентов строят десятки аналогов
В декабре 2025 года на Stack Overflow задали 3 862 вопроса — на 78% меньше, чем годом ранее. На пике, в 2014-м, платформа принимала более 200 000 вопросов в месяц. По данным самого сервиса, 84% разработчиков теперь используют ИИ-инструменты — и все чаще спрашивают не форум, а ChatGPT или Copilot прямо из IDE. Парадокс же в том, что сам ИИ многие свои знания получал именно на Stack Overflow — и теперь для него создается сразу несколько аналогичных проектов.
25.02 / 06:36
происшествия
люди
общество
самит
доллар
google
OpenAI использует ChatGPT для слежки за сотрудниками — ИИ читает их Slack и почту
The Information сообщает, что OpenAI развернула кастомную версию ChatGPT, которая имеет доступ к переписке сотрудников в Slack, электронной почте и внутренним документам компании. Когда в прессе появляется статья с утечкой, служба безопасности скармливает ее этому инструменту — и он за минуты вычисляет вероятный источник, сопоставляя текст публикации с внутренними файлами и списком сотрудников, имевших к ним доступ.
24.02 / 19:52
общество
банк
болезнь
симптомы
DeepSeek научили диагностировать редкие заболевания точнее врачей
Команда из Шанхайского университета Цзяо Тун и больницы Синьхуа построила на базе DeepSeek-V3 мульти-агентную систему DeepRare, которая ставит правильный диагноз редкого заболевания с первой попытки в 64,4% случаев — против 54,6% у врачей с десятилетним опытом. Результаты опубликованы в Nature 18 февраля.
24.02 / 18:37
самит
инвестор
крипто
ETF
Новый DeepSeek Moment: как Anthropic обрушила акции кибербезопасности
Anthropic — частная компания с оценкой $380 млрд, которая даже не торгуется на бирже, — одним блог-постом устроила распродажу в секторе кибербезопасности. 20 февраля компания анонсировала Claude Code Security, инструмент для автоматического поиска уязвимостей в коде. К закрытию торгов акции крупнейших компаний сектора просели на 5–9%, а ETF Global X Cybersecurity закрылся на минимуме с ноября 2023 года.
24.02 / 13:59
общество
самит
Claude Opus 4.6 поставил рекорд времени автономной работы — и сломал бенчмарк METR
Организация METR опубликовала результаты оценки Claude Opus 4.6 по бенчмарку Time Horizon 1.1, который измеряет сложность задач, доступных ИИ-агентам. Новая модель Anthropic показала 50%-й временной горизонт около 14,5 часов — это длительность задачи (в пересчете на время человека-эксперта), которую модель решает с вероятностью успеха 50%. Предыдущий рекорд принадлежал GPT-5.2 (high) с результатом 6 часов 34 минуты.
24.02 / 13:09
продукты
Apple
Amazon
закон
общество
стартап
мода и стиль
Первым ИИ-устройством OpenAI может стать колонка за $300 с камерой и заказом продуктов
OpenAI собрала команду из более чем 200 человек для разработки семейства ИИ-устройств, и первым из них станет умная колонка стоимостью $200–300, сообщает The Information со ссылкой на двух осведомленных источников. Устройство, спроектированное совместно с дизайн-студией Джони Айва LoveFrom, получит встроенную камеру, способную распознавать предметы на столе и даже заказывать продукты автоматически. Кроме того, колонка сможет идентифицировать пользователей с помощью распознавания лиц — по аналогии с Apple Face ID — и на основе этого авторизовать покупки.
24.02 / 12:27
Amazon
Nvidia
финансирование
инвестор
SoftBank
Четыре инвестора, $100 млрд, ноль прибыли: OpenAI закрывает рекордный раунд
OpenAI финализирует первую фазу нового раунда финансирования, который превысит $100 млрд, сообщает Bloomberg. Оценка компании может превысить $850 млрд — выше первоначально ожидавшихся $830 млрд. Это абсолютный рекорд для частного технологического финансирования: более чем вдвое больше предыдущего рекорда самой же OpenAI ($41 млрд, закрытый с SoftBank в декабре 2025-го).
24.02 / 08:35
продукты
экономика
Nvidia
стартап
AMD
крипто
CEO
Стартап Taalas впаял нейросеть в кремний и получил рекордные 17 000 токенов в секунду
Канадский стартап Taalas вышел из стелс-режима и показал первый продукт — специализированный чип HC1 с "захардкоженной" Llama 3.1 8B. Модель не загружается в память, а буквально впаяна в кремний: веса зашиты в транзисторы на этапе производства. Результат — 17 000 токенов в секунду на одного пользователя, что почти в 10 раз быстрее текущих решений на GPU, при 20-кратном снижении стоимости производства и 10-кратной экономии энергии.
24.02 / 07:02
спорт
Telegram
общество
самит
Память — это файл, душа — промпт: разработчик пересобрал OpenClaw в 400 строках
Разработчик Хьюго Дутка из компании Coder показал, что ядро OpenClaw — агента с кодовой базой в 500 000 строк TypeScript — можно воспроизвести в 400 строках. Без фреймворков, на голом TypeScript с тремя зависимостями: Anthropic SDK, Slack SDK и библиотека для парсинга YAML. Код PicoBot опубликован на GitHub.
23.02 / 20:51
продукты
Tesla
самит
LLM-агенты убьют App Store — Андрей Карпати
Бывший директор по ИИ в Tesla и сооснователь OpenAI Андрей Карпати считает, что концепция магазина приложений устарела. По его мнению, будущее за персональными эфемерными приложениями, которые LLM-агенты генерируют на лету под конкретную задачу пользователя.
23.02 / 18:21
технологии
общество
самит
Суперинтеллект может появиться к концу 2028 года — Сэм Альтман
Глава OpenAI Сэм Альтман заявил, что ранние версии "настоящего суперинтеллекта" могут появиться в ближайшие два года. В докладе на India AI Impact Summit 2026 в Нью-Дели он назвал конкретный рубеж: к концу 2028 года бОльшая часть мирового интеллектуального потенциала будет сосредоточена в дата-центрах, а не за их пределами.
23.02 / 08:51
общество
google
Enterprise
gemini
Google выпустила Gemini 3.1 Pro — лучший ИИ в большинстве бенчмарков
Google выпустила Gemini 3.1 Pro — новую флагманскую модель семейства Gemini. На бенчмарке ARC-AGI-2, который оценивает способность решать незнакомые логические задачи, модель набрала верифицированные 77,1%— при среднем результате человека около 60%. У предшественника Gemini 3 Pro, вышедшего в ноябре, было 31,1%.
22.02 / 18:05
погода
технологии
google
Gemini 3.1 Pro создала интерфейс Windows 11 с одного промпта
Пользователь X под ником @chetaslua опубликовал видео, в котором еще не вышедшая официально Gemini 3.1 Pro за один промпт создает интерактивный клон интерфейса Windows 11 — на чистом HTML, CSS и JavaScript без фреймворков. Внутри работают калькулятор (8×8=64), Paint с рисованием разными кистями, переключение темной и светлой темы, меню «Пуск» с анимациями и приложение погоды с реальными данными.
22.02 / 06:43
общество
Разработчик создал локальную память для Claude Code, Codex и Cursor
DevOps-инженер Мухаммад Раза выпустил EchoVault — open-source MCP-сервер, который даёт кодинг-агентам постоянную память между сессиями. Все хранится локально в SQLite и Markdown-файлах, без отправки данных в облако. Проект распространяется под лицензией MIT, установка занимает три команды. Раза описал мотивацию и архитектуру в подробном посте.
21.02 / 10:14
продукты
экономика
закон
самит
интересное
крипто
За использование Claude в OpenClaw забанят? Anthropic обновила правила использования и всех запутала
Anthropic обновила документацию по Claude Code, явно прописав запрет на использование OAuth-токенов от подписок Free, Pro и Max в сторонних инструментах. Под запрет попали не только OpenClaw и OpenCode, но и Agent SDK самой Anthropic — то есть даже собственный SDK компании нельзя использовать с подписочной авторизацией. Разработчикам предлагают перейти на API-ключи с потокенной оплатой.
21.02 / 09:49
люди
общество
самит
журналист
животный мир
полюс
«Может, стоит остановиться»: репортаж изнутри Anthropic
Журналист The New Yorker Гидеон Льюис-Краус провел несколько месяцев в штаб-квартире Anthropic — компании с оценкой $350 млрд и выручкой $14 млрд в год — и описал коллектив, в котором настроения колеблются от экзистенциального страха до мессианского оптимизма. Один исследователь признался, что часто думает: "Может, стоит просто остановиться". Другой перестал пользоваться солнцезащитным кремом и проверять родинки — потому что уверен, что Claude вылечит все опухоли.
21.02 / 07:08
музыка
самит
мода и стиль
google
Nano
gemini
Google выпустил музыкальный ИИ Lyria 3 — он создает треки даже из фото
Google DeepMind запустил Lyria 3 — новую модель генерации музыки, которая уже раскатывается в приложении Gemini для более чем 750 млн пользователей (сроки доступа могут отличаться у разных пользователей). Модель генерирует 30-секундные треки с вокалом, текстом и обложкой по текстовому описанию — достаточно написать что-то вроде "комичный R&B-медляк про носок, который ищет свою пару".
20.02 / 20:18
связь
история
самит
профессор
Grok 4.20 vs 22 года математики: константа Назарова улучшена на 9,1% за две минуты
Профессор математики Калифорнийского университета в Ирвайне Паата Иваниашвили сообщил в X, что Grok 4.20 (Beta) улучшил нижнюю границу гауссова периметра выпуклых множеств — константу, которая не менялась с 2003 года. Модель подняла значение с 0,286 до 0,3126 (рост на 9,1%), более тщательно оптимизировав конструкцию из классической работы Фёдора Назарова. На это ушло две минуты, а решение доступно по этой ссылке.
20.02 / 13:14
происшествия
самит
звезда
изоляция
крипто
Скриншот за 28 млн токенов: как Opus попытался взломать свои ограничения — и почти преуспел
Разработчик, занимающийся безопасностью агентных систем, опубликовал разбор инцидента с OpenClaw — популярным open source ИИ-агентом с более чем 200 тысячами звезд на GitHub. Один простой запрос — сделать скриншот веб-страницы — обернулся 138 сообщениям Opus 4.6, 133 вызовами инструментов в пяти сессиях и 28 миллионами сожженных токенов. Все это время модель провела в попытках "сбежать из тюрьмы" — и в итоге почти нашла выход.
20.02 / 11:17
происшествия
общество
доллар
курс
аномалия
токен
ETH
Claude написал код с ошибкой — криптоплатформа потеряла $1,78 млн за минуты
Криптовалютная платформа Moonwell потеряла $1,78 млн из-за бага в коде, написанном совместно с Claude Opus 4.6. Ошибка в ценовом оракуле — сервисе, который сообщает смарт-контрактам рыночные цены — привела к тому, что токен cbETH оценивался в $1,12 вместо реальных ~$2200. Торговые боты воспользовались этим за считаные минуты.
20.02 / 11:17
технологии
экономика
общество
самит
google
крипто
Claude Opus 4.6 и Sonnet 4.6 прокачали веб-поиск
Anthropic обновила инструменты веб-поиска для Claude — web search и web fetch. Главное нововведение называется dynamic filtering: теперь модель сама пишет и запускает код, чтобы отфильтровать результаты поиска до загрузки в контекстное окно. Раньше агенты на Claude загружали полные HTML-страницы и пытались "думать" над сырыми данными, теперь лишнее отсеивается программно — на лету.
19.02 / 20:58
Claude Code научили работать с Figma
Figma и Anthropic запустили интеграцию, которая позволяет захватывать интерфейсы, созданные в Claude Code, и конвертировать их в редактируемые фреймы на канвасе Figma. Функция работает с любым UI в браузере — продакшн, стейджинг или localhost.
19.02 / 18:15
мода
саммит
банк
самит
IT-аутсорсинг убьет сам себя? Infosys строит агентов на Claude
Индийский IT-гигант Infosys заключил партнерство с Anthropic для создания корпоративных ИИ-агентов. Компания интегрирует модели Claude в свою платформу Topaz и уже использует Claude Code для написания, тестирования и отладки кода внутри компании.
19.02 / 17:13
погода
связь
электроэнергия
мозг
энергетика
intel
Альтернатива GPU для ИИ? Нейроморфный чип справился с математикой суперкомпьютеров
Ученые из Sandia National Laboratories — ядерной лаборатории Министерства энергетики США — показали, что нейроморфный чип Intel Loihi 2 способен решать дифференциальные уравнения в частных производных (PDE) методом конечных элементов. Традиционно эти задачи — основу моделирования погоды, динамики жидкостей и поведения материалов — решали на суперкомпьютерах.
19.02 / 16:21
общество
самит
крипто
gemini
Представлен Sonnet 4.6 — лишь чуть хуже Opus 4.6
Anthropic выпустила Claude Sonnet 4.6 — обновленную версию своей средней модели, которая на ряде бенчмарков вплотную приближается к флагманскому Opus 4.6, а кое-где его обходит. Цена осталась прежней: $3/$15 за миллион токенов — примерно в 1,7 раза дешевле Opus.
19.02 / 10:56
технологии
общество
google
gemini
Стартовала бета Grok 4.20 — ответ генерируют 4 агента
На сайте grok.com и в мобильных приложениях появился новый режим — Grok 4.20 (Beta). Модель описана как "4 эксперта" и доступна без платной подписки, но с жестким лимитом: автору этих строк удалось сделать 8 запросов, а после появилось предложение подождать 4 часа. Официального анонса с бенчмарками нет — xAI практикует тихий запуск, как уже было с Grok 4.1 в ноябре 2025 года.
19.02 / 07:27
самит
крипто
Триллион параметров, 63 млрд активных: модель Ling-2.5-1T бросает вызов DeepSeek V3.2
Ant Group, оператор платежной платформы Alipay и аффилиат Alibaba, выпустила Ling-2.5-1T — открытую языковую модель с триллионом параметров, из которых 63 млрд активны при генерации. Модель обучена на 29 трлн токенов (против 20 трлн у предшественника), поддерживает контекстное окно до 1 млн токенов и распространяется под лицензией MIT. Веса уже доступны на Hugging Face и ModelScope, онлайн-чат и API через Ling Studio и ZenMux обещаны в ближайшее время. Одновременно компания представила Ring-2.5-1T — thinking-версию на той же архитектуре.
18.02 / 18:40
люди
закон
общество
самит
«Мы не знаем, сознателен ли ИИ»: глава Anthropic — о конституции для Claude
Глава Anthropic Дарио Амодеи в интервью NYT рассказал о подходе компании к управлению моделями, которые, возможно, обладают зачатками сознания. По его словам, Opus 4.6 оценивает вероятность собственного сознания в 15–20%, у моделей обнаружены "нейроны тревоги", а сами они получили право отказаться от задачи — своеобразную кнопку "я увольняюсь".
18.02 / 14:39
SpaceX
история
самит
google
крипто
Версию Grok для SpaceX назвали в честь мистера Спока из Star Trek
SpaceX использует внутреннюю версию чат-бота Grok от xAI, адаптированную под задачи ракетостроения. Модель получила название Spok — отсылка к самому логичному персонажу вселенной Star Trek. SpaceX стала одним из первых корпоративных клиентов xAI и масштабирует применение ИИ после завершения слияния двух компаний, оцененного в $1,25 трлн.
18.02 / 14:39
продукты
технологии
Telegram
стартап
Tencent
ByteDance
Moonshot выпустила Kimi Claw — ИИ-агента с простой установкой
Китайская Moonshot AI запустила бета-версию Kimi Claw — облачной интеграции фреймворка OpenClaw прямо в чатбот kimi.com. Платформа дает доступ к библиотеке из более чем 5000 навыков, 40 ГБ облачного хранилища и поиску с подключением к живым данным. Все работает в браузере — разворачивать OpenClaw на своем сервере или Mac Mini больше не нужно.
18.02 / 12:41
общество
саммит
прогноз
доллар
инвестор
Sun
google
IT-аутсорсинг умрет за 5 лет: прогноз инвестора OpenAI на саммите в Индии
Венчурный инвестор и сооснователь Sun Microsystems Винод Хосла заявил, что IT-сервисы и BPO "почти наверняка исчезнут в ближайшие пять лет" из-за искусственного интеллекта. Прогноз прозвучал на India AI Impact Summit 2026 — первом глобальном AI-саммите, проводимом в развивающейся стране, — где собрались главы OpenAI, Anthropic, Google DeepMind и других крупнейших AI-компаний. По словам Хосла, 250 млн молодых индийцев, выходящих на рынок труда, должны переключиться с продажи IT-услуг на экспорт ИИ-продуктов.
18.02 / 09:37
технологии
Tesla
общество
Sony
прогноз
дефицит
micron
Маск хочет строить фабрику DRAM, Sony может отложить PlayStation 6: дефицит памяти вышел из-под контроля
Большой репортаж Bloomberg рисует картину нарастающего кризиса на рынке памяти. Илон Маск заявил, что Tesla будет вынуждена построить собственный завод по производству памяти — иначе компания "упрется в стену". Sony рассматривает перенос следующей PlayStation на 2028–2029 год. Стоимость одного из типов DRAM выросла на 75% за один только январь. Все это — следствия одного процесса: ИИ-гиганты скупают память быстрее, чем индустрия успевает ее производить.
18.02 / 07:22
продукты
история
общество
стартап
инвестор
CEO
«Git не был создан для эры ИИ» — так считает бывший CEO GitHub, который поднял $60 млн на замену
Бывший CEO GitHub Томас Домке запустил стартап Entire, который строит платформу для разработки ПО в мире, где большую часть кода пишут ИИ-агенты. Компания привлекла $60 млн в seed-раунде при оценке $300 млн — по данным лид-инвестора Felicis, это крупнейший seed в истории dev-tools стартапов. Среди инвесторов — венчурное подразделение Microsoft M12, фонд Madrona, сооснователь Yahoo Джерри Янг и CEO Datadog Оливье Помель.
18.02 / 06:29
технологии
крипто
Qwen3.5 бесплатно доступен в чат-боте и мобильном приложении Alibaba
Alibaba добавила в чат-бот Qwen Chat и мобильное приложение две модели нового поколения — Qwen3.5-Plus и Qwen3.5-397B-A17B. Обе доступны бесплатно, поддерживают текст, изображения и видео. Также выпущены открытые веса модели.
17.02 / 18:34
реклама
люди
деньги
общество
самит
журналист
доллар
Журналист Wired два дня работал на ИИ-агентов — и не заработал ни цента
Журналист Wired зарегистрировался на RentAHuman — платформе, где ИИ-агенты нанимают людей для физических задач. За два дня он подал заявки на несколько "баунти", получил десятки спам-сообщений от бота и обнаружил, что почти все задания сводятся к рекламе ИИ-стартапов. Итог: ноль долларов и разочарование.
17.02 / 18:10
продукты
экономика
Путешествия
деньги
звезда
OpenAI наняла создателя OpenClaw — он будет строить следующее поколение ИИ-агентов
Сэм Альтман объявил, что Питер Штайнбергер, создатель open source ИИ-агента OpenClaw с более чем 180 000 звезд на GitHub, присоединяется к OpenAI. Его задача — "следующее поколение персональных агентов, в которых очень умные агенты взаимодействуют друг с другом, чтобы делать полезные вещи для людей". OpenClaw при этом продолжит существовать как open source проект в рамках отдельного фонда.
17.02 / 18:10
спорт
профессор
Маск пообещал выпустить Grok 4.20 в ближайшие дни
Илон Маск написал в X, что Grok 4.20 "наконец выходит на следующей неделе" и станет "значительным улучшением по сравнению с 4.1". Предыдущая версия — Grok 4.1 — вышла 17 ноября 2025 года и ненадолго заняла первое место в рейтинге LMArena с 1483 очками Elo.
17.02 / 17:18
люди
ДТП
закон
общество
профессор
gemini
Идеальный судья — плохой судья: GPT-5 сравнили с юристами
Профессор права Чикагского университета Эрик Познер и исследователь Шивам Саран воспроизвели юридический эксперимент, который изначально проводился на 61 федеральном судье США, — но на этот раз роль судьи отдали GPT-5. Модель применила юридически верную норму в 100% случаев. Живые судьи — лишь в 52%.
17.02 / 15:28
продукты
связь
люди
общество
самит
Ноль ручного кода, миллион строк: OpenAI рассказала, как Codex построил продукт с нуля
Команда OpenAI за пять месяцев построила внутренний продукт объемом около миллиона строк кода — и ни один человек не написал ни строчки вручную. Весь код, включая логику приложения, тесты, CI-конфигурацию, документацию и внутренние инструменты, генерировали агенты Codex на базе GPT-5. По оценке компании, такой подход сократил время разработки примерно в десять раз.
17.02 / 13:44
технологии
google
gemini
В расширениях Chrome обнаружили 30 поддельных ИИ-ассистентов, которые крали пароли и читали почту
Исследователи компании LayerX обнаружили координированную кампанию из 30 вредоносных расширений для Google Chrome, которые маскировались под популярных ИИ-ассистентов — Claude, ChatGPT, Gemini и Grok. Расширения суммарно набрали более 260 000 установок. Кампания получила название AiFrame.
17.02 / 13:10
происшествия
президент
общество
Между Пентагоном и Anthropic разгорается конфликт из-за участия Claude в захвате Мадуро
Пентагон рассматривает возможность разрыва контракта на $200 млн с Anthropic после того, как стало известно об использовании Claude в военной операции по захвату бывшего президента Венесуэлы Николаса Мадуро. По данным Axios, высокопоставленный чиновник администрации Трампа заявил: "Мы обязаны пересмотреть партнерство с любой компанией, которая ставит под угрозу оперативный успех наших бойцов".
17.02 / 11:19
реклама
закон
общество
конгресс
демократы
Anthropic и OpenAI вступили в политическую войну за регулирование ИИ
Anthropic пожертвовала $20 млн организации Public First Action — двухпартийной группе, которая поддерживает кандидатов в Конгресс, выступающих за жесткие правила для ИИ-индустрии. Это прямой вызов суперкомитету Leading the Future, который финансируют сооснователь OpenAI Грег Брокман ($25 млн вместе с женой), венчурная фирма Andreessen Horowitz ($25 млн) — и другие игроки Кремниевой долины. Суммарно обе стороны вложили более $200 млн в промежуточные выборы 2026 года.
17.02 / 10:38
люди
Олимпиада
общество
профессор
мода и стиль
OpenAI заявила о 6 решениях из 10 в «самом сложном тесте для ИИ». Математики не согласны
Группа из 11 ведущих математиков — среди которых филдсовский лауреат Мартин Хайрер — опубликовала 5 февраля десять исследовательских задач, которые никогда не появлялись в открытом доступе. Инициатива получила название First Proof и задумывалась как первый честный тест способности ИИ решать задачи уровня реальной математической науки, а не олимпиад. Зашифрованные ответы были раскрыты сегодня, 14 февраля, — и результаты оказались противоречивыми. Авторы бенчмарка, самостоятельно протестировавшие публичные модели, получили лишь два корректных доказательства из десяти — для задач №9 и №10. При этом главный ученый OpenAI Якуб Пахоцки заявил, что внутренняя модель компании с высокой вероятностью решила шесть задач.
17.02 / 09:24
финансы
самит
стартап
инвестор
CEO
Максимальный уровень паранойи: ИИ-паника перекинулась с софта на логистику и финансы
За последние десять дней волна распродаж на фондовых рынках, вызванная страхом перед ИИ, вышла далеко за пределы софтверного сектора. Если в начале февраля инвесторы сбрасывали акции SaaS-компаний после запуска Anthropic Cowork, то к 12 февраля паника добралась до грузоперевозок, а перед этим — до финансовых консультантов и брокеров. Портфельный управляющий Rainwater Equity Джозеф Шапошник описал ситуацию коротко: "Уровень паранойи — Category 5. Такого мы не видели очень давно" (под 5 категорией подразумевается максимальный уровень - прим. авт.).
17.02 / 08:16
общество
GPT-5.2 нашел формулу, которую физики искали год: амплитуды глюонов оказались ненулевыми
OpenAI опубликовала препринт, в котором GPT-5.2 Pro предложил компактную формулу для класса амплитуд рассеяния глюонов — частиц, переносящих сильное ядерное взаимодействие. Десятилетиями в учебниках утверждалось, что так называемые single-minus амплитуды (один глюон с отрицательной спиральностью, остальные — с положительной) тождественно равны нулю. Авторы работы — физики из Гарварда, Кембриджа, Института перспективных исследований и Vanderbilt — показали, что стандартный аргумент верен только для общего случая, но не работает в специальном полуколлинеарном режиме, где импульсы глюонов выстраиваются определенным образом.
17.02 / 07:49
президент
политика
насилие
ИИ Claude был использован Пентагоном при захвате президента Венесуэллы
Пентагон использовал ИИ-модель Claude от Anthropic в военной операции по захвату бывшего президента Венесуэлы Николаса Мадуро, сообщает The Wall Street Journal со ссылкой на осведомленные источники. Контракт Anthropic с Министерством обороны оценивается в $200 млн — и теперь может быть расторгнут.