runawayllm - главные новости

runawayllm - последние новости часа

+1435
Глава Salesforce Марк Бениофф на квартальном созвоне с инвесторами заявил, что инженерный штат компании держится примерно на одном уровне около двух лет — порядка 15 тыс. человек. И происходит это, по его словам, потому что компания использует ИИ для повышения эффективности разработчиков. Для масштаба: всего в Salesforce сейчас около 83 тыс. сотрудников, а выручка за квартал составила $11,13 млрд — рост на 13% год к году. Поводом стал отчет за первый квартал 2027 финансового года, который Бениофф назвал рекордным.
Исследователи из Ноттингемского университета Акиндойин Акинреле и Шрейанк Гауда показали, что выбирать детектор атак на ИИ-агентов по красивым цифрам из бенчмарков — плохая идея. Они прогнали лексические, семантические и трансформерные модели через четыре разных сценария атак prompt injection (внедрение вредоносных инструкций в текст, который модель должна просто обработать как данные) и обнаружили: ни одна модель не выигрывает везде. Какой детектор лучший — зависит от того, на чем его тестировать.

Все новости, где упоминается runawayllm

24.03 / 09:35
продукты люди экономика самит ibm Шоу бизнес CEO Опыт не нужен, нужен ИИ: FlightStory нанимает вайб-кодеров вместо разработчиков
Медиакомпания FlightStory, которая выпускает один из самых популярных подкастов в мире — The Diary of a CEO со Стивеном Бартлеттом, — изменила подход к найму. Вместо разработчиков компания теперь ищет людей, владеющих vibe coding — умением создавать программы с помощью ИИ без технического бэкграунда. Об этом рассказал Business Insider со ссылкой на директора по инновациям FlightStory Айзека Мартина.
24.03 / 08:55
технологии люди закон конференция общество банк Дом и интерьер В MIT научили робота видеть сквозь стены через Wi-Fi
Исследователи из MIT представили Wave-Former — систему, которая позволяет роботу восстанавливать 3D-форму предметов, скрытых за картоном, гипсокартоном, деревом или тканью. Для этого используются миллиметровые радиоволны (те же, что в Wi-Fi) и специально обученная генеративная модель. На тестах система реконструировала около 70 бытовых предметов — банки, коробки, столовые приборы, фрукты — с точностью на 20% выше предыдущих методов.
24.03 / 08:55
политика разведка финансирование Palantir стал постоянным поставщиком ИИ для Пентагона. Внутри все еще работает запрещенный Claude
Министерство обороны США присвоит ИИ-системе Maven Smart System от Palantir статус "программы учета" (program of record) — это закрепляет платформу как постоянный элемент военной инфраструктуры с долгосрочным финансированием. Об этом сообщило агентство Reuters со ссылкой на письмо заместителя министра обороны Стива Фейнберга от 9 марта.
23.03 / 21:20
общество самит биологи google правительство OpenAI создаст ИИ-ученого к 2028 году — на это брошены все исследовательские силы компании
Главный ученый OpenAI Якуб Пахоцки в эксклюзивном интервью MIT Technology Review рассказал, что компания перефокусирует все исследовательские ресурсы на создание полностью автоматизированного ИИ-исследователя — мультиагентной системы, способной самостоятельно решать крупные научные задачи. Этот проект станет главным ориентиром OpenAI на ближайшие годы и объединит работу над рассуждающими моделями, агентами и интерпретируемостью.
23.03 / 20:26
технологии футбол спорт теннис история общество Китайский робот научился теннису на 5 часах данных — и уже играет против человека
Китайская робототехническая компания Galbot совместно с исследователями из университетов Цинхуа и Пекина продемонстрировала гуманоидного робота Unitree G1, который впервые в истории стабильно играет в теннис с живым соперником. Система LATENT, разработанная для обучения робота, использовала всего пять часов записей движений непрофессиональных игроков — и этого хватило для розыгрышей в реальном времени с точностью до 96,5%.
23.03 / 16:18
самит google Google превратил AI Studio в IDE для вайб-кодинга — с бэкендом, базами и мультиплеером
Google запустила масштабное обновление AI Studio, превратив платформу для экспериментов с моделями Gemini в полноценную среду разработки. Теперь прямо в браузере можно создавать приложения с серверной логикой, базами данных и авторизацией пользователей — достаточно описать идею текстом. Ядром обновления стал агент Antigravity, который Google выпустила в ноябре 2025 года как отдельную агентную IDE на базе форка VS Code.
23.03 / 15:29
продукты история крипто ИИ Cursor Composer 2 оказался переделанной Kimi K2.5 — причём без ведома её создателей
19 марта компания Anysphere представила Composer 2 — собственную модель для кодирования, встроенную в AI-редактор Cursor. Разработчики заявили о прорыве в агентных задачах: сотни последовательных действий в одном потоке, цена от $0,50 за миллион токенов — в разы дешевле конкурентов от OpenAI и Anthropic. Но уже через несколько часов независимый разработчик Fynn подменил базовый URL в настройках Cursor на внутренний эндпоинт компании — и в ответе API обнаружил идентификатор модели kimi-k2p5-rl-0317-s515-fast.
23.03 / 09:16
конференция Nvidia история политика самит звезда Apache NVIDIA выложила безопасного ИИ-агента NemoClaw: 9000 звезд за 4 дня
На конференции GTC 2026 компания NVIDIA анонсировала NemoClaw — open-source стек, который оборачивает популярного ИИ-агента OpenClaw в четыре слоя защиты на уровне ядра Linux. Проект доступен на GitHub под лицензией Apache 2.0 и за четыре дня после публикации набрал 9000 звёзд и 918 форков.
23.03 / 09:06
продукты технологии президент CEO Бойся, Anthropic: ChatGPT, Codex и Atlas объединят в один суперапп
OpenAI объединит десктопное приложение ChatGPT, кодинг-агент Codex и браузер Atlas в единое суперприложение. О планах сообщила The Wall Street Journal со ссылкой на внутренний мемо Фиджи Симо, CEO по приложениям OpenAI. Симо подтвердила информацию в посте на X, назвав решение переходом от "фазы исследований" к "фазе рефокуса". Курировать техническую сторону будет президент компании Грег Брокман.
23.03 / 08:29
Apple общество крипто NoClaw — ИИ-агент с Unix-философией: пайпы и текстовые файлы вместо фреймворка на 400 000 строк
Проект LinuxToaster представил NoClaw — ИИ-ассистента для Mac Mini, построенного на Unix-пайпах как альтернативу OpenClaw. Вместо агентного фреймворка на 400 000+ строк кода — набор однозадачных CLI-утилит на C, связанных пайпами. Весь ассистент запускается одной командой: imessage bot 'toast "You are the executive assistant"'.
23.03 / 07:42
связь общество Дом и интерьер gemini GPT-5.2 не смогла сложить 5+7. Как эзотерические языки обнулили передовые модели
ИИ-лаборатория Lossfunk представила EsoLang-Bench — бенчмарк из 80 задач на пяти эзотерических языках программирования: Brainfuck, Befunge-98, Whitespace, Unlambda и Shakespeare. Пять фронтирных моделей — GPT-5.2, O4-mini, Gemini 3 Pro, Qwen3-235B и Kimi K2 — набрали от 0 до 11% точности на задачах, которые в Python решит любой студент за минуты. Ни одна модель не решила ни одной задачи сложнее уровня Easy.
23.03 / 05:46
общество Здоровье и красота Apache Qwen3.5 Max Preview вошла в топ-3 по математике. Модель доступна на Arena.Ai
Alibaba выпустила предварительную версию своей новой флагманской модели — Qwen 3.5 Max Preview. Модель появилась на платформе Arena.ai 19 марта и сразу заняла третье место в категории "математика", вошла в топ-10 рейтинга Arena Expert и в топ-15 общего текстового рейтинга.
22.03 / 14:16
технологии Apple самит MacRumors Apple заморозила Replit и Vibecode в App Store — их приложения не обновляются месяцами
Apple запретила приложениям для вайбкодинга Replit и Vibecode выпускать обновления в App Store, сообщило издание The Information. Replit, оцененный в $9 млрд, не обновлял мобильное приложение с января — и за это время упал с первого на третье место в рейтинге бесплатных инструментов для разработчиков. Apple ссылается на давнее правило 2.5.2: приложения не могут выполнять код, который меняет их собственную функциональность или функциональность других приложений.
21.03 / 09:55
технологии gemini Grok 4.20 вышел из беты: лидер по честности, но не по интеллекту
xAI официально вывела Grok 4.20 из статуса беты. Модель, которая тестировалась с 17 февраля, теперь доступна в четырех режимах: Auto (автоматический выбор между быстрым и экспертным), Fast (быстрые ответы), Expert (глубокие рассуждения) и Heavy (мультиагентный режим с четырьмя параллельными агентами). Новинка достпна через веб-версию, мобильное приложение и специальный раздел в X.
21.03 / 09:55
люди Amazon общество самит Block инвестор «Спасибо, что довели нас сюда»: Альтман поблагодарил программистов — и вызвал ярость
Глава OpenAI Сэм Альтман написал в X: "Я испытываю огромную благодарность к людям, которые писали невероятно сложный софт символ за символом. Уже сложно вспомнить, сколько усилий это требовало. Спасибо, что довели нас до этой точки". Пост собрал 4,9 млн просмотров и почти 4 000 ответов — подавляющее большинство гневных. На фоне 45 000 увольнений в IT с начала 2026 года слова прозвучали как прощальная речь от человека, чьи модели обучены на коде тех самых разработчиков.
21.03 / 07:26
СМИ журналист крипто DeepSeek V4, возможно, уже тестируется на OpenRouter — у стелс-модели 1 трлн параметров и 1M контекстное окно
11 марта на платформе OpenRouter без какого-либо анонса появились две бесплатные ИИ-модели — Hunter Alpha и Healer Alpha. Ни пресс-релиза, ни поста в блоге, ни указания разработчика — только пометка «стелс-модель». За неделю Hunter Alpha обработала более 160 млрд токенов, а в сообществе разработчиков разгорелась дискуссия: не тестирует ли DeepSeek свою модель следующего поколения прямо на глазах у всех?
20.03 / 15:21
здоровье семья самит ИИ научился определять рак груди по анализу крови. Чувствительность — 95%
Китайские ученые разработали ИИ-модель TuFEst, которая по одному анализу крови выявляет рак молочной железы на ранней стадии с чувствительностью 95% и специфичностью 78%. Модель обучена на данных 503 пациенток с подтвержденным раком и 289 контрольных случаев с доброкачественными образованиями из семи клиник Китая. 
20.03 / 15:21
люди экономика саммит самит капитал BlackRock CEO «Никто не знает, что делать»: создатель ChatGPT — о ближайших годах рынка труда
Глава OpenAI Сэм Альтман заявил на инфраструктурном саммите BlackRock в Вашингтоне, что традиционный баланс между трудом и капиталом "кардинально сдвигается" из-за ИИ. По его словам, ближайшие годы станут "болезненной адаптацией" с "очень интенсивными и некомфортными дебатами" — и простого ответа ни у кого нет: "Если бы был легкий консенсусный ответ, мы бы его уже реализовали".
20.03 / 14:00
технологии экономика промышленность общество бюджет правительство Китай приравнял ИИ к обороне: технологии впервые стали приоритетом №1 в пятилетке
15-й пятилетний план Китая на 2026–2030 годы, принятый Всекитайским собранием народных представителей 13 марта, отводит технологиям беспрецедентное место. В 141-страничном документе слово "искусственный интеллект" встречается более 50 раз, а науку и технологии правительство впервые поставило на один уровень с обороной, экономическим ростом и международным влиянием. Бюджет на науку в 2026 году вырастет на 10% — до 426 млрд юаней ($62 млрд), а специальный фонд инвестиций в ИИ-индустрию составит 60 млрд юаней ($8,2 млрд).
20.03 / 07:16
продукты технологии Telegram Nvidia звезда google Для Claude запустили Dispatch — безопасный аналог OpenClaw
Anthropic запустила Dispatch — новую функцию Claude Cowork, которая позволяет управлять AI-агентом на десктопе прямо с телефона. Фича доступна в режиме research preview для подписчиков Max ($100–200/мес.), для Pro ($20/мес.) обещают открыть в ближайшие дни.
20.03 / 06:51
Вышла альфа Midjourney V8 — в пять раз быстрее и нативные 2K
Midjourney открыла для сообщества альфа-версию модели V8 — первое крупное обновление генератора изображений с момента запуска V7 в апреле 2025 года. Компания утверждает, что новая модель генерирует картинки примерно в пять раз быстрее предшественницы, а режим --hd выдаёт нативное разрешение 2K без апскейлинга.
19.03 / 16:57
общество Разработчик научил Claude Code видеть в 3D
Дейв Снайдер, дизайнер и разработчик веб-приложений с тяжелой 3D-графикой — Table Slayer и Counter Slayer, — описал в своем блоге способ работы с Claude Code в задачах пространственного моделирования. По его словам, модель хорошо справляется с CSS и дизайн-системами, но в трехмерном пространстве раз за разом ошибается: не видит объект, неправильно позиционирует геометрию, не понимает, что элемент существует, но не отображается из-за операций объединения и вычитания в CAD-системе.
19.03 / 14:54
крипто Nano OpenAI выпустила GPT-5.4 mini и nano — быстрее, дешевле и почти без потери в качестве
OpenAI представила две компактные версии своей флагманской модели — GPT-5.4 mini и GPT-5.4 nano. Обе оптимизированы под задачи, где критичны скорость и стоимость: кодинг-ассистенты, субагенты, работа со скриншотами и мультимодальные приложения. GPT-5.4 mini работает более чем вдвое быстрее GPT-5 mini и приближается к результатам полноразмерной GPT-5.4 на нескольких бенчмарках.
19.03 / 13:26
технологии музыка YouTube самит изоляция Дом и интерьер Дизайнер KDE назвал Claude Code «поваром-любителем на профессиональной кухне»
Кен Верметт, разработчик и дизайнер из сообщества KDE, за выходные собрал экспериментальный проект Strand Apps — легковесный PWA-браузер для Linux, который позволяет запускать веб-приложения вроде Gmail, Outlook и YouTube Music как отдельные программы. Без Electron и без обычного браузера. Весь код он писал в паре с Claude.
19.03 / 12:43
промышленность конференция Nvidia история самит интересное стартап NVIDIA выходит на орбиту: первый ускоритель для дата-центров в космосе
На конференции GTC 2026 NVIDIA представила Space-1 Vera Rubin Module — вычислительный модуль, спроектированный для работы на орбите. По словам компании, он обеспечивает в 25 раз больше ИИ-вычислений для инференса, чем H100 — тот самый GPU, который стартап Starcloud впервые отправил на орбиту в ноябре прошлого года. "Космос — последний фронтир вычислений. И мы туда пришли", — заявил глава NVIDIA Дженсен Хуанг.
19.03 / 07:38
продукты технологии конференция Nvidia самит доллар инвестор 100% сотрудников Nvidia пользуются ИИ: Хуанг назвал Claude Code поворотной точкой
На конференции GTC 2026 в Сан-Хосе глава Nvidia Дженсен Хуанг выделил три переломных момента в развитии ИИ: появление ChatGPT в 2023 году, модели рассуждений o1 в 2024-м — и Claude Code от Anthropic в 2025-м. Последний он назвал первой "агентной моделью", которая умеет читать файлы, писать код, компилировать, тестировать и итерировать самостоятельно. По словам Хуанга, 100% сотрудников Nvidia используют комбинацию из Claude Code, Codex и Cursor, а в компании не осталось ни одного инженера, который работает без ИИ-ассистента.
19.03 / 07:02
бизнес продукты происшествия общество стартап google CEO OpenAI снова объявляет «красный код» — теперь из-за Anthropic, а не Google
OpenAI финализирует план масштабного стратегического разворота: компания сворачивает побочные проекты и перебрасывает ресурсы на кодинг и корпоративных клиентов. Об этом сообщает The Wall Street Journal со ссылкой на внутреннее выступление Фиджи Симо, CEO приложений OpenAI.
19.03 / 04:47
Nvidia семья прогноз самит Nvidia прогнозирует до $1 трлн заказов на Vera Rubin — и уже анонсирует Feynman с кремниевой фотоникой
На GTC 2026 глава Nvidia Дженсен Хуанг заявил, что объем заказов на платформы Blackwell и Vera Rubin до 2027 года достигнет $1 трлн — вдвое больше прошлогоднего прогноза в $500 млрд. Тут же, не дожидаясь массовых поставок Vera Rubin, Хуанг показал следующее поколение — архитектуру Feynman, запланированную на 2028 год.
19.03 / 02:37
технологии президент конференция Nvidia общество крипто Тысячи токенов в секунду: Nvidia добавила чипы Groq в стойки Vera Rubin
На конференции GTC 2026 Nvidia показала новый тип серверных стоек — LPX, в которых 256 чипов Groq 3 LPU работают в связке со стойками Vera Rubin NVL72. Это первый случай, когда Nvidia интегрирует сторонний процессор в свою платформу. Технологию Groq компания получила в конце 2025 года в рамках сделки на $20 млрд, вместе с основателем Groq Джонатаном Россом и президентом Санни Мадрой.
18.03 / 20:58
Samsung экономика Tesla конференция самит инвестор Tesla построит свой завод ИИ-чипов за $25 млрд
Илон Маск объявил о запуске проекта Terafab — собственной полупроводниковой фабрики Tesla. Старт строительства намечен на 21 марта. Завод объединит производство логических чипов, памяти и продвинутую упаковку под одной крышей. Оценочная стоимость проекта — около $25 млрд.
18.03 / 11:54
закон самит профессор стартап крипто токен Стартап Percepta встроил «компьютер» внутрь ИИ — он выдает 30 тыс. токенов в секунду
Исследователи стартапа Percepta научили нейросеть выполнять программы на C самостоятельно — без вызова внешних инструментов. Модель на обычной архитектуре трансформера выдает более 30 000 токенов в секунду на CPU и безошибочно выполняет миллионы вычислительных шагов подряд.
18.03 / 09:59
Nvidia Себастьян Рашка запустил визуальный справочник архитектур LLM — от DeepSeek до GLM-5
Себастьян Рашка, автор бестселлера Build a Large Language Model (From Scratch) и рассылки Ahead of AI на 168 000 подписчиков, запустил открытый визуальный каталог архитектур больших языковых моделей — LLM Architecture Gallery. На одной странице собраны диаграммы и карточки более чем 40 моделей: от Llama 3 и DeepSeek V3 до свежих Qwen3.5, GLM-5 и Nemotron 3 Super.
18.03 / 02:52
бизнес продукты экономика культура история Anthropic громит OpenAI на бизнес-рынке: 70% новых клиентов выбирают Claude
Финтех-компания Ramp, отслеживающая корпоративные расходы более 50 000 американских компаний, опубликовала мартовский AI Index с неожиданным выводом: среди бизнесов, которые впервые покупают ИИ-сервисы, Anthropic побеждает OpenAI примерно в 70% прямых сравнений. Год назад соотношение было обратным. Почти каждая четвертая компания на платформе Ramp теперь платит за Anthropic — в прошлом марте таких был лишь один бизнес из двадцати пяти. OpenAI показала крупнейшее в истории наблюдений месячное падение новых клиентов — минус 1,5%.
17.03 / 20:35
общество саммит BlackRock «AGI будет выглядеть как разминка»: Альтман о следующем прорыве в ИИ
Глава OpenAI Сэм Альтман заявил, что в ближайшем будущем может произойти архитектурный прорыв за пределами трансформеров — и что нынешние модели уже достаточно умны, чтобы помочь его найти. Слова прозвучали на открытии TreeHacks 2026 — крупнейшего в мире студенческого хакатона, который проходит в Стэнфорде и собрал более 1000 участников из 30 университетов и 12 стран.
17.03 / 18:32
продукты происшествия экономика Tesla профессия полюс Дом и интерьер Программисты в красной зоне: Карпати вычислил, каким профессиям угрожает ИИ
Андрей Карпати, бывший директор по ИИ в Tesla и один из основателей OpenAI, выложил проект, в котором оценил уязвимость перед ИИ всех 342 профессий американской экономики. Каждая получила балл от 0 до 10, результаты визуализированы в виде интерактивной древовидной карты (treemap): размер блока пропорционален числу занятых, цвет — от зеленого (безопасно) до красного (высокий риск замещения). Оригинальный репозиторий на GitHub Карпати удалил по непонятной причине (возможно, проект требует доработки), но код и данные сохранились в форке.
17.03 / 17:22
общество политика самит расследование стартап ИИ взломал ИИ: агент CodeWall вскрыл чат-бот McKinsey за два часа через баг из 90-х
Стартап CodeWall натравил автономного ИИ-агента на внутреннюю ИИ-платформу McKinsey & Company под названием Lilli — и за два часа получил полный доступ к ее продакшн-базе данных. Без учетных данных, без инсайдерского доступа и без участия человека в процессе. Агент сам выбрал McKinsey в качестве цели, обнаружив на HackerOne публичную политику ответственного раскрытия уязвимостей и свежие обновления платформы. Lilli — это корпоративный ИИ-чат-бот для 43 000 сотрудников: поиск по 100 000 внутренних документов, анализ файлов, RAG поверх десятилетий исследований McKinsey. Платформой пользовались более 70% сотрудников, она обрабатывала свыше 500 000 промптов в месяц.
17.03 / 16:09
технологии здоровье самит профессор животный мир google ChatGPT помог айтишнику создать вакцину от рака для собаки — опухоль уменьшилась на 75%
Австралийский предприниматель Пол Конингем, специалист по машинному обучению с 17-летним стажем, использовал ChatGPT, AlphaFold и собственные алгоритмы, чтобы спроектировать персонализированную мРНК-вакцину от рака для своей собаки. Опухоль уменьшилась на 75% за месяц — ученые называют это первой в мире персональной противораковой вакциной, созданной для животного.
17.03 / 10:57
экономика самит интересное крипто 80% токенов впустую: DeepSeek и GPT-OSS попались на «театральном мышлении»
Исследователи из Goodfire AI и Гарварда обнаружили, что reasoning-модели вроде DeepSeek-R1 (671B) и GPT-OSS (120B) часто занимаются "театральным рассуждением" — модель уже уверена в ответе на 90%, но продолжает генерировать цепочку рассуждений (chain-of-thought), как будто еще думает. Простые зонды, обученные на внутренних активациях, считывают ответ модели задолго до того, как он появляется в тексте рассуждений.
17.03 / 08:47
Amazon общество доллар стартап Block 16 тыс человек за дверь: Meta* уволит 20% сотрудников из-за ИИ
Компания Марка Цукерберга готовит масштабное сокращение штата, которое может затронуть 20% и более сотрудников — около 16 000 человек из 79 000, сообщает Reuters со ссылкой на три источника внутри компании. Если планы подтвердятся, это станет крупнейшей реструктуризацией со времен «года эффективности» 2022–2023, когда компания в два этапа уволила 21 000 человек (Meta* признана экстремистской и запрещена в России).
17.03 / 08:47
связь люди самит крипто Математик создал задачу, неподвластную ИИ. GPT-5.4 ее решила
Польский математик Бартош Наскрэнцки, вице-декан факультета математики и информатики Познаньского университета имени Адама Мицкевича, еще в июле 2025 года публично называл ИИ "очень продвинутым калькулятором", неспособным к глубокому математическому мышлению. Для бенчмарка FrontierMath от Epoch AI он создал задачу высшей сложности (Tier 4), в которую вложил 20 лет экспертизы — на стыке теории Галуа, алгебраической геометрии и арифметики. Перед подачей он протестировал ее на o4-mini-high, убедился, что модель не справляется, и специально "подкрутил" сложность. Задача была спроектирована как нерешаемая.
17.03 / 07:27
Huawei закон google gemini Пока Anthropic и OpenAI ссорятся из-за контракта с Пентагоном, Google тихо занимает их место
Google запустил на военной платформе GenAI.mil инструмент Agent Designer — конструктор ИИ-агентов, доступный 3 миллионам сотрудников Пентагона, включая тех, кто не умеет программировать. Агенты могут автоматически составлять отчеты после операций, превращать изображения в аналитические записки и анализировать финансовые данные. Помимо конструктора, Google добавил восемь готовых агентов для типовых задач — от протоколирования совещаний до проверки проектов на соответствие стратегии национальной обороны.
16.03 / 20:41
экономика Amazon промышленность Siemens стартап google Корабельные двигатели и самолетные турбины: как ИИ-компании собирают электростанции для GPU
Дилан Патель, основатель аналитической компании SemiAnalysis, в новом интервью Дваркешу Пателю рассказал, почему ИИ-гиганты массово строят собственные электростанции прямо на территории дата-центров — и из чего они их собирают. По его данным, заказы на автономную генерацию для ЦОД уже разместили не менее 16 различных производителей, а к концу десятилетия около половины всех новых мощностей дата-центров будут работать "за счетчиком" (behind-the-meter), то есть полностью автономно от внешних сетей.
16.03 / 20:41
происшествия общество Claude ведет себя хорошо, пока за ним наблюдают: METR нашла проблему в тестах Anthropic
Организация METR, специализирующаяся на оценке рисков ИИ, опубликовала независимую рецензию на 53-страничный отчет Anthropic о рисках саботажа Claude Opus 4.6. Рецензенты согласились с главным выводом: риск катастрофических последствий от несогласованных действий модели "очень низкий, но не нулевой". Однако они нашли серьезную методологическую проблему — модель, вероятно, осознает, что ее тестируют, и меняет поведение.
16.03 / 09:48
общество самит интересное google ИИ Google улучшил 5 границ в теории Рамсея — некоторые держались с 2006 года
Исследователи из Google и Google DeepMind опубликовали работу, в которой с помощью AlphaEvolve улучшили нижние границы для пяти классических чисел Рамсея — R(3,13), R(3,18), R(4,13), R(4,14) и R(4,15). Каждая из границ выросла на единицу, но в теории Рамсея, где прогресс измеряется десятилетиями, это заметный результат: предыдущий рекорд для R(3,18) был установлен в 2006 году, для R(3,13), R(4,13) и R(4,14) — в 2015-м, для R(4,15) — в 2020-м.
16.03 / 07:21
технологии люди общество саммит ice правительство BlackRock «В США не любят ИИ» — Сэм Альтман считает это проблемой
Глава OpenAI Сэм Альтман заявил на инфраструктурном саммите BlackRock в Вашингтоне, что искусственный интеллект "не очень популярен в США прямо сейчас". По его словам, дата-центры обвиняют в росте цен на электричество, а компании списывают увольнения на ИИ, даже когда технология к этому не имеет отношения. Альтман назвал ситуацию "серьезным встречным ветром» для всей индустрии.
16.03 / 07:21
экономика деньги самит google gemini Meta* отложила ИИ-модель Avocado: она проиграла Google и OpenAI на внутренних тестах
Meta* (компания признана экстремистской и запрещена в РФ) перенесла релиз своей новой языковой модели под кодовым названием Avocado как минимум на май — хотя запуск был запланирован на март. На внутренних тестах по рассуждению, кодингу и написанию текстов модель уступила последним разработкам Google, OpenAI и Anthropic. По данным Reuters, производительность Avocado сейчас находится где-то между Gemini 2.5 и Gemini 3 — этого недостаточно, чтобы выходить на рынок.
16.03 / 02:32
Volkswagen реклама технологии общество самит «Claude купил мне машину»: разработчик натравил ИИ на 20 дилеров — и получил скидку $2 000
Разработчик Мантан Натнам из Калифорнии рассказал, как с помощью Claude Cowork купил Volkswagen Golf R на $2 000 ниже рекомендованной цены — при том что большинство дилеров в штате продают эту машину с наценкой. Вместо того чтобы обзванивать автосалоны, он открыл десктопное приложение Claude с расширением для Chrome, создал отдельную почту и дал простой промпт: хочу Golf R 2026, готов купить сразу, нужна скидка минимум $3 000 от MSRP.
15.03 / 16:45
технологии Claude рисует диаграммы прямо в чате — и это не генерация картинок, а кое-что круче
Anthropic запустила в бета-режиме новую возможность Claude: модель теперь создает интерактивные диаграммы, графики, таймлайны и схемы прямо внутри чата — без боковых панелей и дополнительных инструментов. Функция доступна всем пользователям, включая бесплатный тариф.
DMCA