runawayllm - главные новости

runawayllm - последние новости часа

+1435
Глава Salesforce Марк Бениофф на квартальном созвоне с инвесторами заявил, что инженерный штат компании держится примерно на одном уровне около двух лет — порядка 15 тыс. человек. И происходит это, по его словам, потому что компания использует ИИ для повышения эффективности разработчиков. Для масштаба: всего в Salesforce сейчас около 83 тыс. сотрудников, а выручка за квартал составила $11,13 млрд — рост на 13% год к году. Поводом стал отчет за первый квартал 2027 финансового года, который Бениофф назвал рекордным.
Исследователи из Ноттингемского университета Акиндойин Акинреле и Шрейанк Гауда показали, что выбирать детектор атак на ИИ-агентов по красивым цифрам из бенчмарков — плохая идея. Они прогнали лексические, семантические и трансформерные модели через четыре разных сценария атак prompt injection (внедрение вредоносных инструкций в текст, который модель должна просто обработать как данные) и обнаружили: ни одна модель не выигрывает везде. Какой детектор лучший — зависит от того, на чем его тестировать.

Все новости, где упоминается runawayllm

25.02 / 14:40
продукты экономика самит доллар google OpenClaw «обрушил» Antigravity: Google объяснил массовые баны нехваткой мощностей
Варун Мохан, создатель Antigravity и сотрудник Google DeepMind, объяснил волну блокировок подписчиков Google AI Ultra ($250/мес): массовое использование OAuth-токенов Antigravity через сторонние инструменты вроде OpenClaw "серьезно ухудшило качество сервиса" для обычных пользователей. Его пост в X набрал почти 200 тысяч просмотров за несколько часов.
25.02 / 14:05
Samsung конференция Nvidia прогноз дефицит AMD micron ИИ-бум может обернуться убытками для производителей памяти — глава SK Hynix
Председатель SK Group Чхе Тхэ-вон, выступая на конференции в Вашингтоне 20 февраля, заявил, что средний прогноз аналитиков по операционной прибыли SK Hynix на 2026 год вырос с $50 млрд до $70 млрд всего за два месяца, а некоторые оценки уже превышают $100 млрд. "Звучит как отличная новость, — сказал Чхе, — но это так же легко может превратиться в $100 млрд убытков".
25.02 / 13:08
Telegram общество бюджет самит звезда ИИ-агент zclaw работает на микроконтроллере за $5 — в 35 КБ кода
Разработчик под ником tnm опубликовал open-source ИИ-агента zclaw, который запускается на микроконтроллерах ESP32 — при общем размере прошивки менее 888 КБ. Сам код агента занимает около 35 КБ, остальное — Wi-Fi-стек (~388 КБ), TLS-шифрование (~110 КБ) и сертификаты. Проект написан на C поверх ESP-IDF и FreeRTOS, а рекомендуемая плата Seeed XIAO ESP32-C3 стоит около $5. На момент публикации репозиторий собрал более 750 звезд на GitHub. Код доступен под лицензией MIT.
25.02 / 11:48
Tesla самит звезда Cisco Claws — новый слой ИИ-стека. Карпати оценил OpenClaw и его конкурентов
Бывший директор по ИИ в Tesla Андрей Карпати опубликовал развернутый пост о Claws — категории персональных ИИ-агентов, выросшей вокруг вирусного проекта OpenClaw (более 217 000 звезд на GitHub). По его оценке, Claws — это новый архитектурный слой: если LLM-агенты стали надстройкой над языковыми моделями, то Claws добавляют поверх них оркестрацию, планирование, контекст, вызов инструментов и способность к непрерывной работе. Сам Карпати купил Mac Mini для экспериментов с Claws, но пока колеблется — как их использовать.
25.02 / 11:05
экономика Amazon Nvidia прогноз SoftBank Oracle $665 млрд расходов к 2030-му: OpenAI пересмотрела прогнозы — и стало страшнее
OpenAI снова пересмотрела финансовые прогнозы до 2030 года — во второй раз за полгода. Согласно внутренним документам, с которыми ознакомилось издание The Information, совокупные расходы на обучение и эксплуатацию моделей вырастут до $665 млрд — на $111 млрд больше предыдущей оценки. Прогноз по выручке тоже подняли на 27%, но расходы растут быстрее: в 2025 году компания утроила выручку до $13,1 млрд, а скорректированная валовая маржа при этом упала с 40% до 33%.
25.02 / 09:50
налоги доллар Enterprise ChatGPT может получить подписку за $100
В коде веб-приложения ChatGPT обнаружили упоминание нового тарифного плана Pro Lite стоимостью $100 в месяц. Находку сделал Тибор Блахо — исследователь, известный точными утечками об обновлениях OpenAI.
25.02 / 09:50
самит стартап IPO google крипто Как китайские открытые ИИ забрали почти половину рынка токенов на OpenRouter
По данным аналитиков a16z, четыре из пяти самых используемых ИИ-моделей на OpenRouter — крупнейшем API-маршрутизаторе для языковых моделей — теперь являются открытыми (open weight). Главный сюрприз — шанхайский стартап MiniMax, чья модель за считанные недели захватила около 25% всех токенов на платформе. Ещё ~10% забрала GLM-5 от Zhipu AI (Z.ai). Суммарно три автора открытых моделей — MiniMax, Zhipu и Moonshot — генерируют порядка 45% всего потребления.
25.02 / 08:40
Полгода назад ИИ не мог нарисовать часы. Теперь — 5 из 5 попыток идеальны
Исследователь из Goodeye Labs Рэнди Олсон дал 22 ИИ-моделям — от GPT-3.5 (2023) до свежих релизов 2026 года — один и тот же промпт: создать в одном HTML-файле работающие аналоговые часы с тремя стрелками, обновлением каждую секунду и белым фоном. Каждую модель прогнали пять раз, чтобы отсечь случайные удачи и провалы.
25.02 / 08:13
продукты люди самит paypal токен CEO Пока Stack Overflow угасает, для ИИ-агентов строят десятки аналогов
В декабре 2025 года на Stack Overflow задали 3 862 вопроса — на 78% меньше, чем годом ранее. На пике, в 2014-м, платформа принимала более 200 000 вопросов в месяц. По данным самого сервиса, 84% разработчиков теперь используют ИИ-инструменты — и все чаще спрашивают не форум, а ChatGPT или Copilot прямо из IDE. Парадокс же в том, что сам ИИ многие свои знания получал именно на Stack Overflow — и теперь для него создается сразу несколько аналогичных проектов.
25.02 / 06:36
происшествия люди общество самит доллар google OpenAI использует ChatGPT для слежки за сотрудниками — ИИ читает их Slack и почту
The Information сообщает, что OpenAI развернула кастомную версию ChatGPT, которая имеет доступ к переписке сотрудников в Slack, электронной почте и внутренним документам компании. Когда в прессе появляется статья с утечкой, служба безопасности скармливает ее этому инструменту — и он за минуты вычисляет вероятный источник, сопоставляя текст публикации с внутренними файлами и списком сотрудников, имевших к ним доступ.
24.02 / 19:52
общество банк болезнь симптомы DeepSeek научили диагностировать редкие заболевания точнее врачей
Команда из Шанхайского университета Цзяо Тун и больницы Синьхуа построила на базе DeepSeek-V3 мульти-агентную систему DeepRare, которая ставит правильный диагноз редкого заболевания с первой попытки в 64,4% случаев — против 54,6% у врачей с десятилетним опытом. Результаты опубликованы в Nature 18 февраля.
24.02 / 18:37
самит инвестор крипто ETF Новый DeepSeek Moment: как Anthropic обрушила акции кибербезопасности
Anthropic — частная компания с оценкой $380 млрд, которая даже не торгуется на бирже, — одним блог-постом устроила распродажу в секторе кибербезопасности. 20 февраля компания анонсировала Claude Code Security, инструмент для автоматического поиска уязвимостей в коде. К закрытию торгов акции крупнейших компаний сектора просели на 5–9%, а ETF Global X Cybersecurity закрылся на минимуме с ноября 2023 года.
24.02 / 13:59
общество самит Claude Opus 4.6 поставил рекорд времени автономной работы — и сломал бенчмарк METR
Организация METR опубликовала результаты оценки Claude Opus 4.6 по бенчмарку Time Horizon 1.1, который измеряет сложность задач, доступных ИИ-агентам. Новая модель Anthropic показала 50%-й временной горизонт около 14,5 часов — это длительность задачи (в пересчете на время человека-эксперта), которую модель решает с вероятностью успеха 50%. Предыдущий рекорд принадлежал GPT-5.2 (high) с результатом 6 часов 34 минуты.
24.02 / 13:09
продукты Apple Amazon закон общество стартап мода и стиль Первым ИИ-устройством OpenAI может стать колонка за $300 с камерой и заказом продуктов
OpenAI собрала команду из более чем 200 человек для разработки семейства ИИ-устройств, и первым из них станет умная колонка стоимостью $200–300, сообщает The Information со ссылкой на двух осведомленных источников. Устройство, спроектированное совместно с дизайн-студией Джони Айва LoveFrom, получит встроенную камеру, способную распознавать предметы на столе и даже заказывать продукты автоматически. Кроме того, колонка сможет идентифицировать пользователей с помощью распознавания лиц — по аналогии с Apple Face ID — и на основе этого авторизовать покупки.
24.02 / 12:27
Amazon Nvidia финансирование инвестор SoftBank Четыре инвестора, $100 млрд, ноль прибыли: OpenAI закрывает рекордный раунд
OpenAI финализирует первую фазу нового раунда финансирования, который превысит $100 млрд, сообщает Bloomberg. Оценка компании может превысить $850 млрд — выше первоначально ожидавшихся $830 млрд. Это абсолютный рекорд для частного технологического финансирования: более чем вдвое больше предыдущего рекорда самой же OpenAI ($41 млрд, закрытый с SoftBank в декабре 2025-го).
24.02 / 08:35
продукты экономика Nvidia стартап AMD крипто CEO Стартап Taalas впаял нейросеть в кремний и получил рекордные 17 000 токенов в секунду
Канадский стартап Taalas вышел из стелс-режима и показал первый продукт — специализированный чип HC1 с "захардкоженной" Llama 3.1 8B. Модель не загружается в память, а буквально впаяна в кремний: веса зашиты в транзисторы на этапе производства. Результат — 17 000 токенов в секунду на одного пользователя, что почти в 10 раз быстрее текущих решений на GPU, при 20-кратном снижении стоимости производства и 10-кратной экономии энергии.
24.02 / 07:02
спорт Telegram общество самит Память — это файл, душа — промпт: разработчик пересобрал OpenClaw в 400 строках
Разработчик Хьюго Дутка из компании Coder показал, что ядро OpenClaw — агента с кодовой базой в 500 000 строк TypeScript — можно воспроизвести в 400 строках. Без фреймворков, на голом TypeScript с тремя зависимостями: Anthropic SDK, Slack SDK и библиотека для парсинга YAML. Код PicoBot опубликован на GitHub. 
23.02 / 20:51
продукты Tesla самит LLM-агенты убьют App Store — Андрей Карпати
Бывший директор по ИИ в Tesla и сооснователь OpenAI Андрей Карпати считает, что концепция магазина приложений устарела. По его мнению, будущее за персональными эфемерными приложениями, которые LLM-агенты генерируют на лету под конкретную задачу пользователя.
23.02 / 18:21
технологии общество самит Суперинтеллект может появиться к концу 2028 года — Сэм Альтман
Глава OpenAI Сэм Альтман заявил, что ранние версии "настоящего суперинтеллекта" могут появиться в ближайшие два года. В докладе на India AI Impact Summit 2026 в Нью-Дели он назвал конкретный рубеж: к концу 2028 года бОльшая часть мирового интеллектуального потенциала будет сосредоточена в дата-центрах, а не за их пределами.
23.02 / 08:51
общество google Enterprise gemini Google выпустила Gemini 3.1 Pro — лучший ИИ в большинстве бенчмарков
Google выпустила Gemini 3.1 Pro — новую флагманскую модель семейства Gemini. На бенчмарке ARC-AGI-2, который оценивает способность решать незнакомые логические задачи, модель набрала верифицированные 77,1%— при среднем результате человека около 60%. У предшественника Gemini 3 Pro, вышедшего в ноябре, было 31,1%.
22.02 / 18:05
погода технологии google Gemini 3.1 Pro создала интерфейс Windows 11 с одного промпта
Пользователь X под ником @chetaslua опубликовал видео, в котором еще не вышедшая официально Gemini 3.1 Pro за один промпт создает интерактивный клон интерфейса Windows 11 — на чистом HTML, CSS и JavaScript без фреймворков. Внутри работают калькулятор (8×8=64), Paint с рисованием разными кистями, переключение темной и светлой темы, меню «Пуск» с анимациями и приложение погоды с реальными данными.
22.02 / 06:43
общество Разработчик создал локальную память для Claude Code, Codex и Cursor
DevOps-инженер Мухаммад Раза выпустил EchoVault — open-source MCP-сервер, который даёт кодинг-агентам постоянную память между сессиями. Все хранится локально в SQLite и Markdown-файлах, без отправки данных в облако. Проект распространяется под лицензией MIT, установка занимает три команды. Раза описал мотивацию и архитектуру в подробном посте.
21.02 / 10:14
продукты экономика закон самит интересное крипто За использование Claude в OpenClaw забанят? Anthropic обновила правила использования и всех запутала
Anthropic обновила документацию по Claude Code, явно прописав запрет на использование OAuth-токенов от подписок Free, Pro и Max в сторонних инструментах. Под запрет попали не только OpenClaw и OpenCode, но и Agent SDK самой Anthropic — то есть даже собственный SDK компании нельзя использовать с подписочной авторизацией. Разработчикам предлагают перейти на API-ключи с потокенной оплатой.
21.02 / 09:49
люди общество самит журналист животный мир полюс «Может, стоит остановиться»: репортаж изнутри Anthropic
Журналист The New Yorker Гидеон Льюис-Краус провел несколько месяцев в штаб-квартире Anthropic — компании с оценкой $350 млрд и выручкой $14 млрд в год — и описал коллектив, в котором настроения колеблются от экзистенциального страха до мессианского оптимизма. Один исследователь признался, что часто думает: "Может, стоит просто остановиться". Другой перестал пользоваться солнцезащитным кремом и проверять родинки — потому что уверен, что Claude вылечит все опухоли.
21.02 / 07:08
музыка самит мода и стиль google Nano gemini Google выпустил музыкальный ИИ Lyria 3 — он создает треки даже из фото
Google DeepMind запустил Lyria 3 — новую модель генерации музыки, которая уже раскатывается в приложении Gemini для более чем 750 млн пользователей (сроки доступа могут отличаться у разных пользователей). Модель генерирует 30-секундные треки с вокалом, текстом и обложкой по текстовому описанию — достаточно написать что-то вроде "комичный R&B-медляк про носок, который ищет свою пару".
20.02 / 20:18
связь история самит профессор Grok 4.20 vs 22 года математики: константа Назарова улучшена на 9,1% за две минуты
Профессор математики Калифорнийского университета в Ирвайне Паата Иваниашвили сообщил в X, что Grok 4.20 (Beta) улучшил нижнюю границу гауссова периметра выпуклых множеств — константу, которая не менялась с 2003 года. Модель подняла значение с 0,286 до 0,3126 (рост на 9,1%), более тщательно оптимизировав конструкцию из классической работы Фёдора Назарова. На это ушло две минуты, а решение доступно по этой ссылке.
20.02 / 13:14
происшествия самит звезда изоляция крипто Скриншот за 28 млн токенов: как Opus попытался взломать свои ограничения — и почти преуспел
Разработчик, занимающийся безопасностью агентных систем, опубликовал разбор инцидента с OpenClaw — популярным open source ИИ-агентом с более чем 200 тысячами звезд на GitHub. Один простой запрос — сделать скриншот веб-страницы — обернулся 138 сообщениям Opus 4.6, 133 вызовами инструментов в пяти сессиях и 28 миллионами сожженных токенов. Все это время модель провела в попытках "сбежать из тюрьмы" — и в итоге почти нашла выход.
20.02 / 11:17
происшествия общество доллар курс аномалия токен ETH Claude написал код с ошибкой — криптоплатформа потеряла $1,78 млн за минуты
Криптовалютная платформа Moonwell потеряла $1,78 млн из-за бага в коде, написанном совместно с Claude Opus 4.6. Ошибка в ценовом оракуле — сервисе, который сообщает смарт-контрактам рыночные цены — привела к тому, что токен cbETH оценивался в $1,12 вместо реальных ~$2200. Торговые боты воспользовались этим за считаные минуты.
20.02 / 11:17
технологии экономика общество самит google крипто Claude Opus 4.6 и Sonnet 4.6 прокачали веб-поиск
Anthropic обновила инструменты веб-поиска для Claude — web search и web fetch. Главное нововведение называется dynamic filtering: теперь модель сама пишет и запускает код, чтобы отфильтровать результаты поиска до загрузки в контекстное окно. Раньше агенты на Claude загружали полные HTML-страницы и пытались "думать" над сырыми данными, теперь лишнее отсеивается программно — на лету.
19.02 / 20:58
Claude Code научили работать с Figma
Figma и Anthropic запустили интеграцию, которая позволяет захватывать интерфейсы, созданные в Claude Code, и конвертировать их в редактируемые фреймы на канвасе Figma. Функция работает с любым UI в браузере — продакшн, стейджинг или localhost.
19.02 / 18:15
мода саммит банк самит IT-аутсорсинг убьет сам себя? Infosys строит агентов на Claude
Индийский IT-гигант Infosys заключил партнерство с Anthropic для создания корпоративных ИИ-агентов. Компания интегрирует модели Claude в свою платформу Topaz и уже использует Claude Code для написания, тестирования и отладки кода внутри компании.
19.02 / 17:13
погода связь электроэнергия мозг энергетика intel Альтернатива GPU для ИИ? Нейроморфный чип справился с математикой суперкомпьютеров
Ученые из Sandia National Laboratories — ядерной лаборатории Министерства энергетики США — показали, что нейроморфный чип Intel Loihi 2 способен решать дифференциальные уравнения в частных производных (PDE) методом конечных элементов. Традиционно эти задачи — основу моделирования погоды, динамики жидкостей и поведения материалов — решали на суперкомпьютерах.
19.02 / 16:21
общество самит крипто gemini Представлен Sonnet 4.6 — лишь чуть хуже Opus 4.6
Anthropic выпустила Claude Sonnet 4.6 — обновленную версию своей средней модели, которая на ряде бенчмарков вплотную приближается к флагманскому Opus 4.6, а кое-где его обходит. Цена осталась прежней: $3/$15 за миллион токенов — примерно в 1,7 раза дешевле Opus.
19.02 / 10:56
технологии общество google gemini Стартовала бета Grok 4.20 — ответ генерируют 4 агента
На сайте grok.com и в мобильных приложениях появился новый режим — Grok 4.20 (Beta). Модель описана как "4 эксперта" и доступна без платной подписки, но с жестким лимитом: автору этих строк удалось сделать 8 запросов, а после появилось предложение подождать 4 часа. Официального анонса с бенчмарками нет — xAI практикует тихий запуск, как уже было с Grok 4.1 в ноябре 2025 года.
19.02 / 07:27
самит крипто Триллион параметров, 63 млрд активных: модель Ling-2.5-1T бросает вызов DeepSeek V3.2
Ant Group, оператор платежной платформы Alipay и аффилиат Alibaba, выпустила Ling-2.5-1T — открытую языковую модель с триллионом параметров, из которых 63 млрд активны при генерации. Модель обучена на 29 трлн токенов (против 20 трлн у предшественника), поддерживает контекстное окно до 1 млн токенов и распространяется под лицензией MIT. Веса уже доступны на Hugging Face и ModelScope, онлайн-чат и API через Ling Studio и ZenMux обещаны в ближайшее время. Одновременно компания представила Ring-2.5-1T — thinking-версию на той же архитектуре.
18.02 / 18:40
люди закон общество самит «Мы не знаем, сознателен ли ИИ»: глава Anthropic — о конституции для Claude
Глава Anthropic Дарио Амодеи в интервью NYT рассказал о подходе компании к управлению моделями, которые, возможно, обладают зачатками сознания. По его словам, Opus 4.6 оценивает вероятность собственного сознания в 15–20%, у моделей обнаружены "нейроны тревоги", а сами они получили право отказаться от задачи — своеобразную кнопку "я увольняюсь".
18.02 / 14:39
SpaceX история самит google крипто Версию Grok для SpaceX назвали в честь мистера Спока из Star Trek
SpaceX использует внутреннюю версию чат-бота Grok от xAI, адаптированную под задачи ракетостроения. Модель получила название Spok — отсылка к самому логичному персонажу вселенной Star Trek. SpaceX стала одним из первых корпоративных клиентов xAI и масштабирует применение ИИ после завершения слияния двух компаний, оцененного в $1,25 трлн.
18.02 / 14:39
продукты технологии Telegram стартап Tencent ByteDance Moonshot выпустила Kimi Claw — ИИ-агента с простой установкой
Китайская Moonshot AI запустила бета-версию Kimi Claw — облачной интеграции фреймворка OpenClaw прямо в чатбот kimi.com. Платформа дает доступ к библиотеке из более чем 5000 навыков, 40 ГБ облачного хранилища и поиску с подключением к живым данным. Все работает в браузере — разворачивать OpenClaw на своем сервере или Mac Mini больше не нужно.
18.02 / 12:41
общество саммит прогноз доллар инвестор Sun google IT-аутсорсинг умрет за 5 лет: прогноз инвестора OpenAI на саммите в Индии
Венчурный инвестор и сооснователь Sun Microsystems Винод Хосла заявил, что IT-сервисы и BPO "почти наверняка исчезнут в ближайшие пять лет" из-за искусственного интеллекта. Прогноз прозвучал на India AI Impact Summit 2026 — первом глобальном AI-саммите, проводимом в развивающейся стране, — где собрались главы OpenAI, Anthropic, Google DeepMind и других крупнейших AI-компаний. По словам Хосла, 250 млн молодых индийцев, выходящих на рынок труда, должны переключиться с продажи IT-услуг на экспорт ИИ-продуктов.
18.02 / 09:37
технологии Tesla общество Sony прогноз дефицит micron Маск хочет строить фабрику DRAM, Sony может отложить PlayStation 6: дефицит памяти вышел из-под контроля
Большой репортаж Bloomberg рисует картину нарастающего кризиса на рынке памяти. Илон Маск заявил, что Tesla будет вынуждена построить собственный завод по производству памяти — иначе компания "упрется в стену". Sony рассматривает перенос следующей PlayStation на 2028–2029 год. Стоимость одного из типов DRAM выросла на 75% за один только январь. Все это — следствия одного процесса: ИИ-гиганты скупают память быстрее, чем индустрия успевает ее производить.
18.02 / 07:22
продукты история общество стартап инвестор CEO «Git не был создан для эры ИИ» — так считает бывший CEO GitHub, который поднял $60 млн на замену
Бывший CEO GitHub Томас Домке запустил стартап Entire, который строит платформу для разработки ПО в мире, где большую часть кода пишут ИИ-агенты. Компания привлекла $60 млн в seed-раунде при оценке $300 млн — по данным лид-инвестора Felicis, это крупнейший seed в истории dev-tools стартапов. Среди инвесторов — венчурное подразделение Microsoft M12, фонд Madrona, сооснователь Yahoo Джерри Янг и CEO Datadog Оливье Помель.
18.02 / 06:29
технологии крипто Qwen3.5 бесплатно доступен в чат-боте и мобильном приложении Alibaba
Alibaba добавила в чат-бот Qwen Chat и мобильное приложение две модели нового поколения — Qwen3.5-Plus и Qwen3.5-397B-A17B. Обе доступны бесплатно, поддерживают текст, изображения и видео. Также выпущены открытые веса модели.
17.02 / 18:34
реклама люди деньги общество самит журналист доллар Журналист Wired два дня работал на ИИ-агентов — и не заработал ни цента
Журналист Wired зарегистрировался на RentAHuman — платформе, где ИИ-агенты нанимают людей для физических задач. За два дня он подал заявки на несколько "баунти", получил десятки спам-сообщений от бота и обнаружил, что почти все задания сводятся к рекламе ИИ-стартапов. Итог: ноль долларов и разочарование.
17.02 / 18:10
продукты экономика Путешествия деньги звезда OpenAI наняла создателя OpenClaw — он будет строить следующее поколение ИИ-агентов
Сэм Альтман объявил, что Питер Штайнбергер, создатель open source ИИ-агента OpenClaw с более чем 180 000 звезд на GitHub, присоединяется к OpenAI. Его задача — "следующее поколение персональных агентов, в которых очень умные агенты взаимодействуют друг с другом, чтобы делать полезные вещи для людей". OpenClaw при этом продолжит существовать как open source проект в рамках отдельного фонда.
17.02 / 18:10
спорт профессор Маск пообещал выпустить Grok 4.20 в ближайшие дни
Илон Маск написал в X, что Grok 4.20 "наконец выходит на следующей неделе" и станет "значительным улучшением по сравнению с 4.1". Предыдущая версия — Grok 4.1 — вышла 17 ноября 2025 года и ненадолго заняла первое место в рейтинге LMArena с 1483 очками Elo.
17.02 / 17:18
люди ДТП закон общество профессор gemini Идеальный судья — плохой судья: GPT-5 сравнили с юристами
Профессор права Чикагского университета Эрик Познер и исследователь Шивам Саран воспроизвели юридический эксперимент, который изначально проводился на 61 федеральном судье США, — но на этот раз роль судьи отдали GPT-5. Модель применила юридически верную норму в 100% случаев. Живые судьи — лишь в 52%.
17.02 / 15:28
продукты связь люди общество самит Ноль ручного кода, миллион строк: OpenAI рассказала, как Codex построил продукт с нуля
Команда OpenAI за пять месяцев построила внутренний продукт объемом около миллиона строк кода — и ни один человек не написал ни строчки вручную. Весь код, включая логику приложения, тесты, CI-конфигурацию, документацию и внутренние инструменты, генерировали агенты Codex на базе GPT-5. По оценке компании, такой подход сократил время разработки примерно в десять раз.
17.02 / 13:44
технологии google gemini В расширениях Chrome обнаружили 30 поддельных ИИ-ассистентов, которые крали пароли и читали почту
Исследователи компании LayerX обнаружили координированную кампанию из 30 вредоносных расширений для Google Chrome, которые маскировались под популярных ИИ-ассистентов — Claude, ChatGPT, Gemini и Grok. Расширения суммарно набрали более 260 000 установок. Кампания получила название AiFrame.
DMCA