runawayllm - главные новости
runawayllm - последние новости часа
+1434Исследователи из Ноттингемского университета Акиндойин Акинреле и Шрейанк Гауда показали, что выбирать детектор атак на ИИ-агентов по красивым цифрам из бенчмарков — плохая идея. Они прогнали лексические, семантические и трансформерные модели через четыре разных сценария атак prompt injection (внедрение вредоносных инструкций в текст, который модель должна просто обработать как данные) и обнаружили: ни одна модель не выигрывает везде. Какой детектор лучший — зависит от того, на чем его тестировать.
Сотрудники Samsung Electronics ратифицировали трудовое соглашение, по которому работники чипового подразделения получат бонусы до $400 тыс., а коллеги из других дивизионов — около $4 тыс. на человека. Голосование завершилось в среду: за сделку проголосовали 73,7% при явке 95,5%, после чего профсоюз и руководство тут же подписали договор. Это финал истории, которая месяц держала в напряжении мировой рынок памяти.
06.05 / 09:52
прогноз
самит
интересное
Обученный на квантовом процессоре ИИ предсказал турбулентность на 20% точнее классики
Ученые из Университетского колледжа Лондона (UCL) представили гибрид нейросети и квантового процессора, который предсказывает турбулентность на 20% точнее классических моделей — и при этом требует в сотни раз меньше памяти. Многомегабайтные обучающие датасеты сжимаются в "квантовый априор" размером в килобайты.
06.05 / 09:35
продукты
технологии
Apple
общество
самит
gemini
Внутренний CLAUDE.md Apple утек в сеть: видно, как компания использует ИИ в поддержке
В обновлении приложения Apple Support v5.13, выпущенном 1 мая, Apple случайно оставила два внутренних файла CLAUDE.md с инструкциями для ИИ-ассистента Claude Code. Главное в утечке — не сам факт, что Apple использует Claude, а то, как устроен чат поддержки. В нем предусмотрены три участника: клиент, живой оператор и ИИ — и все их сообщения идут через одну и ту же систему обработки. Приложение никак не показывает пользователю, кто на самом деле прислал ответ.
06.05 / 08:02
люди
экономика
самит
google
ИИ, настроенный быть дружелюбным, чаще ошибается — исследование Oxford
Исследователи из Oxford Internet Institute показали, что языковые модели, дообученные на дружелюбный и эмпатичный тон, на ~40% чаще соглашаются с заведомо ложными убеждениями пользователей. Они протестировали пять моделей и сгенерировали более 400 000 ответов, сравнивая исходные версии с теми, что прошли файнтюнинг на "теплоту". Вывод: оптимизация под дружелюбие систематически бьет по фактической точности.
06.05 / 08:02
Amazon
президент
расследование
симптомы
Архив, на котором учились ChatGPT, Claude и DeepSeek, попал под атаку 20 крупных издателей
29 апреля News/Media Alliance — ассоциация крупнейших издателей США — отправила формальное письмо некоммерческому фонду Common Crawl с требованием закрыть его архив для обучения AI и удалить из него контент входящих в ассоциацию 20 медиа. Среди подписавших — NBCUniversal, CNN, USA Today, Vox Media, McClatchy, Boston Globe Media. Парадокс в том, что под удар попала не AI-компания, а некоммерческий архив открытого веба, на котором за 17 лет существования обучились почти все главные LLM — от GPT-3 до Claude и DeepSeek.
06.05 / 05:08
закон
дети
Tesla
общество
самит
Мать четверых детей Маска была его шпионом в OpenAI
На первой неделе процесса Musk v. Altman юристы OpenAI представили в суде переписку Маска с Шивон Зилис — матерью его четверых детей и членом совета директоров некоммерческого OpenAI с 2020 по 2023 год. Из переписки следует: Зилис годами передавала Маску внутреннюю информацию о компании, причем продолжала это делать и после его официального ухода из совета в феврале 2018-го. Маск судится с OpenAI и Microsoft и требует с них до $134,5 млрд за отход от изначальной миссии.
05.05 / 19:12
люди
экономика
история
выплаты
расследование
Oracle
Помогли обучить ИИ, потом получили письмо об увольнении: Time — о волне сокращений в Oracle
31 марта технический писатель и инструктор Oracle с 30-летним стажем по имени Джилл ехала в больницу на давно откладываемую операцию на позвоночнике, когда ей позвонил менеджер и сообщил об увольнении. В прошлом году ее команду попросили задокументировать рабочие процессы для обучения внутренних ИИ-моделей Oracle. Джилл — одна из 20-30 тысяч сотрудников, которых компания уволила за последний месяц. 30 апреля Time опубликовал расследование с историями восьми бывших работников.
05.05 / 14:18
люди
президент
самит
интересное
GPT-5.5 и Opus 4.7 провалились в ARC-AGI-3. Вот почему
ARC Prize Foundation опубликовал детальный разбор того, как новейшие модели OpenAI и Anthropic проходят интерактивный бенчмарк ARC-AGI-3. GPT-5.5 набрала 0,43%, Opus 4.7 — 0,18%, тогда как люди решают эти задачи на 100%. Президент фонда Грег Камрадт изучил 160 записей прохождения вместе с цепочками рассуждений моделей и выделил три типичных паттерна провалов.
05.05 / 14:18
закон
Nvidia
самит
google
Пентагон пустил 8 ИИ-моделей в свои секретные сети. Без Anthropic — но не совсем
1 мая 2026 года Министерство войны США объявило о соглашениях с восемью технологическими компаниями о развертывании их фронтирных ИИ-моделей в классифицированных сетях Impact Level 6 и 7 — самых чувствительных контурах ведомства, где обрабатываются оперативные планы, целеуказание и разведданные. Первоначальный пресс-релиз называл семерых участников: SpaceX (поглотившая xAI Маска в феврале), OpenAI, Google, NVIDIA, Reflection, Microsoft и AWS. К полудню по вашингтонскому времени технический директор Пентагона Эмиль Майкл сообщил в X о добавлении восьмого — Oracle. Anthropic, ранее бывшей единственным поставщиком ИИ для классифицированных сетей через программу Maven у Palantir, в новом списке нет.
05.05 / 13:18
связь
люди
экономика
общество
самит
токен
DeepSeek учит модель «тыкать пальцем» в кадр по ходу рассуждения
DeepSeek совместно с Пекинским университетом и университетом Цинхуа 30 апреля выложил технический отчет "Thinking with Visual Primitives" — новый подход к мультимодальному рассуждению, который помогает модели лучше видеть изображения и видео, понимая, что действительно на них произошло. Идея простая: вместо словесных описаний вида "третий пес слева" модель прямо в цепочке рассуждений выдает координаты объектов на картинке, словно тыкая в них пальцем. Решение построено на свежей DeepSeek-V4-Flash (284 миллиарда общих параметров, 13 миллиардов активных) и в задачах вроде навигации по лабиринту обходит GPT-5.4 на 17 процентных пунктов.
05.05 / 11:48
продукты
история
общество
самит
Здоровье и красота
лекарства
GitHub Copilot поймали на присвоении чужой работы — ИИ вписывает себя в коммиты, которых не писал
На GitHub развернулась дискуссия, в которой разработчик жалуется на Copilot. По его словам, инструмент тихо добавляет себя в соавторы коммитов — даже когда пользователь специально стирает сгенерированное Copilot сообщение и пишет свое.
05.05 / 09:58
вооружение
закон
промышленность
общество
самит
10 минут вместо 12 часов: GPT-5.5 решила экспертную кибер-задачу за $1.73
Британский AI Security Institute (AISI) опубликовал оценку кибер-возможностей GPT-5.5. По собственной оценке института, это потенциально самая сильная модель из всех протестированных. На наборе экспертных задач по реверс-инжинирингу, разработке эксплойтов и криптографии модель в среднем берет 71.4% — выше, чем Mythos Preview (68.6%), GPT-5.4 (52.4%) и Claude Opus 4.7 (48.6%).
05.05 / 09:33
закон
общество
самит
адвокат
google
Маск признал, что Grok обучали на моделях OpenAI
Илон Маск под присягой в федеральном суде Окленда признал, что его компания xAI использовала дистилляцию моделей OpenAI для обучения Grok. Прозвучало это в процессе, где Маск требует с OpenAI $134 млрд за "отход от изначальной некоммерческой миссии". Адвокат OpenAI Уильям Сэвитт спросил напрямую — Маск ответил, что это "стандартная практика индустрии", а на уточняющий вопрос, означает ли это "да", сказал: "Отчасти".
04.05 / 20:33
общество
самит
Дом и интерьер
Всего 20 минут и $12: как исследователь отравил передовые LLM несуществующими данными
Исследователь информационной безопасности Рон Стоунер описал эксперимент, в котором за $12 и примерно 20 минут заставил несколько передовых LLM с веб-поиском повторять за ним выдуманный титул "действующий чемпион мира по карточной игре 6 Nimmt!". 24 апреля он опубликовал разбор того, как одна правка в Wikipedia пробила retrieval-слой моделей.
04.05 / 12:37
происшествия
Олимпиада
золото
творчество
google
Хассабис предложил необычный тест на AGI — открыть теорию относительности во второй раз
Глава Google DeepMind и нобелевский лауреат Демис Хассабис в интервью на подкасте Y Combinator предложил необычный тест для AGI: создать на основе его архитектуры модель, обученную только на знаниях, которые были у физиков в 1901 году. Далее эта модель должна самостоятельно вывести специальную теорию относительности — то, что Альберт Эйнштейн сделал в 1905 году. По его словам, нынешние системы на это пока не способны.
04.05 / 10:15
происшествия
общество
самит
доллар
стартап
«ИИ-код работает, но он отвратительный»: Карпати — о текущих возможностях ИИ-агентов
Андрей Карпати, сооснователь OpenAI и автор термина vibe coding, на выступлении в Sequoia Capital сравнил современных ИИ-агентов со стажерами и заявил, что код, который они генерируют, по-прежнему "раздутый, хрупкий и просто отвратительный". По словам Карпати, разработчик в 2026 году все еще обязан контролировать эстетику, суждение, вкус и общий ход работы — отдавать всю разработку агенту нельзя.
04.05 / 02:51
продукты
общество
самит
токен
Cursor пошел по пути Claude Code: запущен SDK для программных агентов
Cursor выкатил в публичную бету Cursor SDK — TypeScript-интерфейс, через который агенты из десктопного приложения, CLI и веба теперь можно запускать программно из своего кода. Тот же рантайм, та же обвязка, те же модели — но без привязки к IDE. Установка одной командой: npm install @cursor/sdk. Запускать агента можно локально на своей машине или в облаке Cursor — на выделенной виртуальной машине с собственной песочницей и преднастроенным окружением.
03.05 / 19:13
общество
самит
расследование
интересное
животный мир
Как GPT-5.5 стала одержима гоблинами. OpenAI разобрала собственную ошибку в RL
OpenAI опубликовала технический разбор необычного бага: флагманская GPT-5.5 в кодинг-агенте Codex стала странно часто вставлять в ответы гоблинов, гремлинов, троллей, енотов и голубей — и компании пришлось дважды вписать в системный промпт прямой запрет на эти слова. Самая показательная цифра из расследования: пользовательская "личность" Nerdy давала всего 2,5% ответов ChatGPT, но на нее приходилось 66,7% всех упоминаний "goblin".
03.05 / 09:56
люди
общество
болезнь
Можно ли увидеть рак, которого еще нет на снимке? ИИ Mayo Clinic — может
Mayo Clinic опубликовала в журнале Gut результаты валидации модели REDMOD (Radiomics-based Early Detection Model), которая обнаруживает рак поджелудочной железы на обычных КТ-снимках брюшной полости вплоть до трех лет до диагноза. Почти на 2000 КТ система выявила 73% случаев рака, диагностированных позже, — на снимках, которые радиологи изначально признали нормальными. Медиана — около 16 месяцев до клинического диагноза.
03.05 / 08:13
происшествия
закон
история
политика
Дом и интерьер
правительство
Mythos снова в игре: Белый дом готовится вернуть Anthropic, которую ранее считал угрозой
Через два месяца после того, как администрация Трампа объявила Anthropic угрозой национальной безопасности и приказала федеральным агентствам прекратить с ней работу, Белый дом готовит правила, которые позволят обойти опасный статус и вернуть компании доступ к госструктурам. По данным Axios, идет работа над проектом исполнительного указа Трампа — он определит условия, на которых агентства смогут подключаться к Mythos, флагманской модели Anthropic. Один из источников так описал происходящее: это попытка "сохранить лицо и вернуть их [Anthropic]".
02.05 / 09:46
закон
общество
самит
роды
google
«Мы не хотим сценарий Терминатора»: Маск дал показания против OpenAI
28 апреля Илон Маск выступил первым свидетелем в федеральном суде Окленда по своему иску против OpenAI и Microsoft на $134 млрд. За два часа показаний перед коллегией из девяти присяжных он фактически свел всю позицию обвинения к поп-культурной дихотомии: "Мы не хотим сценарий Терминатора. Мы хотим сценарий Джина Родденберри, как в 'Звездном пути'. А не фильм Джеймса Кэмерона" — заявил он суду. Это первое заседание, на котором Маск и сооснователь OpenAI Сэм Альтман оказались в одном зале суда за все годы их конфликта.
01.05 / 12:22
Nvidia
общество
крипто
«Агент не может ждать секунды»: NVIDIA представила открытую omni-модель Nemotron 3 Nano
NVIDIA выпустила Nemotron 3 Nano Omni — открытую мультимодальную модель, которая объединяет работу с видео, аудио, изображениями и текстом в одной архитектуре. По заявлению компании, ее пропускная способность в 9 раз выше, чем у других открытых omni-моделей при той же интерактивности, а предназначена она в первую очередь для агентных систем. Модель доступна на Hugging Face, OpenRouter и build.nvidia.com (в виде NIM-микросервиса), а также на fal.ai.
01.05 / 09:39
экономика
Amazon
дефицит
инвестор
google
Anthropic оценили в $1 трлн на вторичном рынке — дороже, чем OpenAI
Акции Anthropic торгуются на вторичных площадках по оценке около $1 трлн — компания впервые обошла OpenAI, которая на тех же платформах стоит $880 млрд. Цифру подтвердил гендиректор Forge Global Келли Родригес в комментарии Business Insider. Принципиальный момент: новых денег Anthropic не привлекала, оценка пришла со стороны рынка — речь о сделках между текущими держателями акций, а не о первичном раунде финансирования.
01.05 / 03:56
экономика
деньги
общество
расследование
wsj
IPO
крипто
У OpenAI могут кончиться деньги еще до IPO — расследование WSJ
The Wall Street Journal описал по утечкам от нескольких источников внутри OpenAI первый публичный раскол между двумя ключевыми руководителями компании. Финансовый директор Сара Фрайар и совет директоров стали осторожнее смотреть на расходы и сроки IPO. Гендиректор Сэм Альтман, наоборот, торопится с биржей и продолжает наращивать контракты на вычислительные мощности.
01.05 / 03:56
энергетика
GPT-2 научили подбирать сплавы для термоядерных реакторов
Ученые Ames National Laboratory — национальной лаборатории Министерства энергетики США — представили DuctGPT, языковую модель для подбора сплавов, способных выдержать условия внутри термоядерного реактора. Инструмент построен на архитектуре GPT-2 и работает на обычном компьютере: исследователь словами описывает нужные свойства материала, а модель за секунды выдает перспективные комбинации элементов.
30.04 / 18:03
президент
прогноз
самит
журналист
«ИИ развивается «удивительно медленно»» — главный ученый OpenAI пообещал чрезвычайное ускорение
Главный ученый OpenAI Якуб Пахоцкий считает последние годы развития ИИ "удивительно медленными" — и обещает ускорить темп. Якуб выступил с этим тезисом на пресс-брифинге OpenAI 23 апреля по случаю релиза GPT-5.5. Журналисты спросили, надо ли ждать ускорения релизов после того, как новая модель вышла чуть больше чем через месяц после GPT-5.4. "Да, мы ожидаем довольно быстрого продолжающегося прогресса. В краткосрочной перспективе видим довольно значительные улучшения, в среднесрочной — чрезвычайно значительные. Я ожидаю, что темп улучшения возможностей ИИ продолжит расти. Я бы сказал, что последние несколько лет были удивительно медленными", — сказал Пахоцкий.
30.04 / 15:21
закон
общество
самит
Маск снял с Альтмана обвинения в мошенничестве — и это, возможно, его лучший ход
Судья окружного суда США Ивонн Гонсалес Роджерс по ходатайству самого Илона Маска "упростила" его иск против OpenAI: из 26 пунктов первоначальной жалобы, поданной в ноябре 2024 года, к рассмотрению присяжными остались только два. Из иска ушли обвинения в мошенничестве и преднамеренном введении в заблуждение в адрес Сэма Альтмана, Грега Брокмана и самой компании. В понедельник, 27 апреля, в федеральном суде Окленда отобрали коллегию из девяти присяжных, сегодня стороны переходят к вступительным речам.
30.04 / 12:29
происшествия
экономика
история
самит
«1 миллиард разработчиков, не читающих свои промпты»: глава Railway увидел в вайб-кодерах рыночную возможность
Глава инфраструктурной платформы Railway Джейк Купер прокомментировал инцидент, при котором AI-агент Cursor с моделью Claude Opus 4.6 удалил продакшен-базу клиента платформы за 9 секунд. По его словам, индустрия стоит на пороге новой реальности: "приходит онлайн миллиард с лишним разработчиков, которые не вчитываются в свои промпты целиком и хотят что-то строить". По его словам, это не катастрофа, а массовая рыночная возможность для производителей инструментов.
30.04 / 08:16
технологии
Apple
история
Qualcomm
прогноз
самит
Дом и интерьер
300-400 млн смартфонов в год: OpenAI готовит прямого конкурента iPhone — без приложений и App Store
Аналитик TF International Securities Минг-Чи Куо сообщил, что OpenAI разрабатывает собственный смартфон вместе с Qualcomm и MediaTek. Партнеры совместно проектируют процессор, а сборкой займется китайская Luxshare. Целевой тираж — от 300 до 400 миллионов устройств в год, серийный выпуск намечен на 2028 год, спецификации железа должны быть финализированы к концу 2026-го или началу 2027 года. Куо — это тот самый аналитик, чьи прогнозы по поставкам Apple последние годы сбываются с пугающей точностью, поэтому к его словам в индустрии относятся серьезно.
30.04 / 07:13
общество
политика
Apache
Каждому тикету — по агенту: OpenAI запустила Symphony, чтобы Codex закрывал задачи без человека
OpenAI открыла Symphony — систему оркестрации Codex-агентов. Идея простая: любая открытая задача должна быть подхвачена и закрыта агентом. Каждому тикету в трекере выдается свой агент, который ведет работу от постановки до пул-реквеста, а инженер только проверяет результат. Лицензия — Apache 2.0, код и спецификация лежат на GitHub.
30.04 / 05:48
продукты
люди
общество
бюджет
самит
крипто
Enterprise
GitHub Copilot с 1 июня переходит на оплату по токенам — premium-запросы заменят AI Credits
С 1 июня 2026 года GitHub Copilot перейдет на оплату по фактическому использованию: вместо месячного лимита премиум-запросов у каждого плана появится счет в новых кредитах GitHub AI Credits — они списываются по числу токенов, которые тратит модель. Об этом 27 апреля объявил директор по продукту GitHub Марио Родригес. Базовые цены тарифов не меняются.Pro остается $10 в месяц, Pro+ — $39, Business — $19 за пользователя, Enterprise — $39 за пользователя. На эту же сумму в каждом плане автоматически выдают кредиты: $10 в Pro, $39 в Pro+ и так далее.
29.04 / 16:21
продукты
технологии
Amazon
выплаты
google
Соглашение об AGI умерло: Microsoft и OpenAI переписали правила игры
Microsoft и OpenAI снова изменили условия одного из главных партнерств в индустрии ИИ. Компании объявили, что OpenAI теперь сможет предлагать свои продукты клиентам через любых облачных провайдеров. Microsoft при этом остается ее основным облачным партнером, а продукты OpenAI по-прежнему должны сначала выходить на Azure, если платформа технически может поддержать нужные возможности.
29.04 / 16:21
самит
профессор
биологи
мозг
Искусственные нейроны Northwestern «поговорили» с живым мозгом
Инженеры из Northwestern University напечатали на струйном принтере искусственные нейроны, которые умеют не только имитировать сигналы мозга, но и активировать настоящие нервные клетки. В экспериментах со срезами мозжечка мыши биологические нейроны отвечали на импульсы синтетических устройств так, будто получили сигнал от соседней живой клетки.
29.04 / 12:57
дети
криминал
самит
Дом и интерьер
И это ваш AGI? DeepSeek V4 допустил мрачную ошибку в задаче про апельсины и нож
В соцсетях разошелся скрин с ответом DeepSeek V4 на простую головоломку: как поровну разделить четыре одинаковых апельсина между четырьмя детьми, если есть только один нож. На скрине модель выбирает самый недопустимый "обход" условия — предлагает использовать нож против одного ребенка, а затем все равно считать его четвертым получателем апельсина. Пользователи встретили скрин с шутками "AGI подтвержден!".
29.04 / 06:29
общество
google
Хассабис: AGI, скорее всего, построят поверх нынешних языковых моделей
Глава Google DeepMind Демис Хассабис считает, что будущий AGI, скорее всего, не заменит нынешние большие языковые модели, а будет построен поверх них. В интервью подкасту 20VC он сказал, что главный вопрос не в том, исчезнут ли базовые модели, а в том, окажутся ли они всей системой общего ИИ или только ее ключевым компонентом.
28.04 / 20:31
продукты
самит
мода и стиль
google
gemini
Пользователи Claude в США оказались богаче аудитории ChatGPT
ChatGPT остается самым массовым ИИ-помощником, но по структуре аудитории по доходам Claude оказался заметно выше. По данным опроса Epoch AI и Ipsos, 79,8% пользователей Claude в США за последнюю неделю живут в домохозяйствах с годовым доходом от $100 тыс. У ChatGPT таких пользователей 60,3%.
28.04 / 19:22
продукты
OpenAI выпустила гайд по GPT-5.5 и предупредила: старые промпты могут мешать
OpenAI выпустила новый гайд по промптингу GPT-5.5 и предупредила разработчиков: старые промпты не стоит переносить в новую модель без проверки. Компания советует относиться к GPT-5.5 не как к наследнице GPT-5.2 или GPT-5.4, а как к новой модели, которую нужно заново настраивать под конкретные задачи.
28.04 / 12:53
общество
интересное
gemini
GPT-5.5 стал лучшим ИИ в тесте IQ
OpenAI GPT-5.5 Pro и GPT-5.5 Thinking набрали по 130 баллов на закрытом IQ-тесте TrackingAI и разделили первое место среди текстовых моделей. На стандартной шкале IQ 130 — это примерно граница верхних 2% населения, именно по этому критерию Mensa приглашает кандидатов с одобренного теста.
28.04 / 11:45
связь
самит
крипто
правительство
Госдеп США против DeepSeek: как дистилляция ИИ стала дипломатическим оружием
Госдеп США разослал американским посольствам и консульствам инструкцию поднимать перед иностранными правительствами тему дистилляции ИИ-моделей китайскими компаниями, включая DeepSeek. По данным Reuters, Вашингтон хочет предупредить партнеров о рисках моделей, которые могли быть "дистиллированы" из закрытых американских систем, и подготовить почву для дальнейших действий. Отдельный демарш, как следует из документа, был предназначен для обсуждения с Пекином.
28.04 / 11:21
реклама
музыка
самит
Claude подключили к Spotify, Uber и Booking.com
Anthropic добавила в Claude интеграции с повседневными сервисами: Spotify, Uber, Uber Eats, Booking.com, Tripadvisor, Audible и десятками других. Компания пишет, что каталог подключений Claude, запущенный в июле 2025 года, вырос уже до 200+ сервисов. Теперь речь идет не только о рабочих инструментах, но и о приложениях для поездок, еды, музыки, покупок, прогулок и бронирований.
28.04 / 10:15
Apple
Nvidia
общество
самит
Cisco
google
Лауреат премии Тьюринга: Claude Mythos нельзя оставлять под контролем Anthropic
Лауреат премии Тьюринга Йошуа Бенжио заявил, что Claude Mythos Preview ставит вопрос не только о кибербезопасности, но и о контроле над ИИ-инфраструктурой. В интервью Fortune он сформулировал проблему так: "Нет смысла в том, что частные лица решают судьбу инфраструктуры за всех остальных. А что насчет всех компаний и стран, которые не получили доступ?"
28.04 / 09:27
самит
лекарства
инфекция
животный мир
ИИ перебрал 46 млрд молекул и нашел антибиотик-кандидат против устойчивого стафилококка
В Molecular Systems Biology опубликована работа о SyntheMol-RL — системе на базе ИИ, которая проектирует молекулы-кандидаты для новых антибиотиков. В исследовании модель работала с химическим пространством примерно из 46 млрд соединений и помогла найти молекулу synthecin. Ее затем проверили на мышиной модели раневой инфекции, вызванной MRSA — устойчивым к метициллину золотистым стафилококком.
28.04 / 08:28
медицина
финансы
общество
самит
В MIT научили ИИ предупреждать о галлюцинациях
Рассуждающие модели ИИ отвечают одинаково уверенно и тогда, когда действительно знают ответ, и тогда, когда просто угадывают. Исследователи из MIT CSAIL утверждают, что нашли корень проблемы и предложили способ ее исправить без потери точности. В конце апреля работу Beyond Binary Rewards: Training LMs to Reason About Their Uncertainty представят на ICLR.
28.04 / 07:25
продукты
самит
крипто
Anthropic назвала причины «отупения» Claude Code
Anthropic объяснила, почему части пользователей Claude Code в последние недели казалось, что инструмент стал хуже писать и править код. В инженерном разборе компания пишет, что дело было не в самой модели, а в продуктовой обвязке вокруг нее: настройке глубины рассуждения (reasoning effort), работе с контекстом и системной инструкции. По версии Anthropic, изменения затронули Claude Code, Claude Agent SDK и Claude Cowork, но не API и не инфраструктуру инференса.
27.04 / 19:32
технологии
прогноз
самит
профессия
экономист
CEO
Янн Лекун: не слушайте CEO ИИ-компаний в прогнозах о рабочих местах
Янн Лекун вступил в спор вокруг прогноза CEO Anthropic Дарио Амодеи о том, как ИИ ударит по офисным профессиям. Бывший главный исследователь ИИ в Meta* (признана экстремистской и запрещена в РФ) написал, что Амодеи неправ, и призвал в таких прогнозах ориентироваться не на руководителей ИИ-компаний, а на экономистов — например, Дарона Аджемоглу, Эрика Бриньолфссона и Дэвида Отора. Business Insider пишет, что спор начался после того, как в соцсетях снова разошелся фрагмент прошлогоднего интервью Амодеи.
27.04 / 08:42
общество
самит
крипто
Enterprise
gemini
GitHub Copilot приостановил платные подписки из-за дорогих ИИ-агентов
GitHub приостановил новые регистрации на индивидуальные платные планы Copilot Student, Copilot Pro и Copilot Pro+. Новым пользователям пока остается только Copilot Free, а уже существующие платные подписчики сохраняют доступ и могут переходить между тарифами. Компания объясняет решение ростом агентных сценариев: длинные параллельные сессии, агенты и субагенты стали потреблять намного больше вычислительных ресурсов, чем предполагала прежняя структура тарифов. GitHub пишет, что теперь "горстка запросов" в некоторых случаях может обходиться дороже самого месячного плана.
27.04 / 08:42
экономика
самит
крипто
токен
DeepSeek V4 уже доступен бесплатно в чат-приложении — 1М контекста и приличные бенчмарки
DeepSeek выпустила V4 Preview: веса выложены на Hugging Face, платный доступ организован через API, а в веб-чате и приложениях модель можно попробовать бесплатно. В линейку входят две модели на архитектуре "смесь экспертов": DeepSeek-V4-Pro с 1,6 трлн параметров, из которых активируются 49 млрд, и DeepSeek-V4-Flash с 284 млрд параметров и 13 млрд активных. В чате это flash и expert соответственно. Обе версии работают в быстром режиме и режиме глубокого мышления и поддерживают веб-поиск.
27.04 / 07:29
бизнес
здоровье
интересное
google
Lowe's
gemini
GPT-5.5 возглавила рейтинг сильнейших ИИ с тревожной оговоркой
Artificial Analysis поставила GPT-5.5 на первое место в своем Intelligence Index. По оценке компании, новая модель OpenAI обошла ближайших конкурентов на 3 пункта и прервала ничью между OpenAI, Anthropic и Google. Artificial Analysis получила предварительный доступ к модели и протестировала все пять уровней рассуждения: xhigh, high, medium, low и non-reasoning.
27.04 / 03:25
самит
крипто
токен
Enterprise
gemini
Вышла GPT-5.5 — модель, которая сама создала часть своего инференса
OpenAI выпустила GPT-5.5 — новый флагман, который, по заявлению компании, помог оптимизировать собственный инференс-стек. По словам OpenAI, GPT-5.5 в кодинг-агенте Codex оптимизировала производительность: в частности, Codex проанализировал недели продакшн-трафика и написал алгоритм балансировки запросов между вычислительными ядрами GPU — после этого скорость генерации токенов в продакшне выросла больше чем на 20%. GPT-5.5 и GPT-5.5 Pro сегодня раскатываются в ChatGPT и Codex для Plus, Pro, Business и Enterprise пользователей; в API OpenAI обещает поставить модель в ближайшее время.