runawayllm - главные новости
runawayllm - последние новости часа
+1438Брокерское приложение Robinhood, у которого около 27 млн клиентов, запустило в бете режим агентской торговли — теперь акциями за пользователя может торговать ИИ-агент. И в том же релизе компания честно предупредила: агент может неверно понять инструкцию, сработать на устаревших данных и повести себя непредсказуемо — вплоть до потери всех денег на счете.
Передовые ИИ-модели научились находить уязвимости в открытом коде пачками: Anthropic недавно сообщала, что ее модель Mythos Preview обнаружила почти 3900 уязвимостей высокой и критической опасности только в открытом коде. Проблема в том, что на open source держится почти весь крупный бизнес — его используют больше 90% компаний из списка Fortune 500. В ответ IBM и Red Hat объявили Project Lightwell — обязательство на $5 млрд, передовые модели и больше 20 000 инженеров, чтобы закрывать такие дыры в промышленных масштабах.
17.12 / 07:15
люди
общество
Знаменитости
google
ИИ Aristotle и AlphaEvolve вместе с математиками решили задачу, которая существовала с 1975 года
Проблема Эрдёша #1026, впервые сформулированная в 1975 году, получила строгую интерпретацию на сайте задач Эрдёша в сентябре 2025-го — и в декабре была закрыта комбинацией онлайн-дискуссий, AI-инструментов и поиска литературы. Знаменитый математик Теренс Тао опубликовал подробный разбор того, как это произошло, на своём блоге 8 декабря.
16.12 / 21:43
общество
прогноз
дефицит
симптомы
Oracle
«Трансформатор ждут 5 лет»: ИИ-бум уперся в очередь за оборудованием
Oracle переносит сроки сдачи нескольких дата-центров для OpenAI с 2027 на 2028 год, сообщает Bloomberg. Причина — дефицит рабочей силы и материалов. Компания отрицает задержки, заявляя, что "все контрактные обязательства выполняются в срок", однако акции за неделю потеряли 14%.
16.12 / 19:58
люди
общество
доллар
«ИИ написал 85% кода»: как четыре инженера OpenAI собрали Android-версию Sora 2 за 28 дней
OpenAI в своем блоге рассказала о создании Android-версии Sora 2: команда из четырех инженеров справилась за 28 дней, а около 85% кода, по их оценке, написал Codex (порядка 45 тысяч долларов, если считать в ценах на API). Для мобильного приложения с высоким трафиком и жесткими требованиями к стабильности это выглядит как отличный результат.
16.12 / 15:44
продукты
общество
google
Google выпустила новый голосовой ИИ на Gemini: в тестах он помог оформить 14 000 ипотечных кредитов
Google выпустила Gemini 2.5 Flash Native Audio — обновленную модель для голосовых агентов, которая обходит OpenAI gpt-realtime в бенчмарке сложных функциональных вызовов. Модель уже работает в продуктах компании и доступна разработчикам.
16.12 / 10:11
связь
технологии
профессор
мозг
стартап
Представлен нейроинтерфейс, который не нужно вживлять в мозг — он быстрее Neuralink в 100 раз
Ученые из Колумбийского университета, Стэнфорда и Пенсильванского университета представили BISC — нейроинтерфейс толщиной с человеческий волос, который ложится на поверхность мозга, не проникая в ткани. Скорость беспроводной передачи данных — 100 Мбит/с, что в 100 раз быстрее, чем у Neuralink.
16.12 / 09:50
продукты
технологии
самит
Вайб-кодинг теперь и для дизайнеров: Cursor выпустил визуальный редактор кода
Компания Cursor представила Visual Editor — инструмент, который позволяет дизайнерам редактировать интерфейсы веб-приложений без написания кода. Достаточно перетаскивать элементы, двигать слайдеры стилей или просто описывать правки словами — ИИ-агент сам внесет изменения в кодовую базу. Релиз вошел в обновление Cursor 2.2.
16.12 / 09:14
технологии
роды
google
gemini
DeepMind строит ИИ-лабораторию, где роботы будут синтезировать сотни новых материалов в день
Google DeepMind объявил о строительстве первой автоматизированной научной лаборатории в Великобритании. Открытие запланировано на 2026 год. Роботы под управлением Gemini будут синтезировать и тестировать сотни материалов ежедневно — главная цель в том, чтобы найти сверхпроводники, работающие при комнатной температуре.
16.12 / 06:34
закон
общество
политика
18+
ChatGPT получит режим 18+ в первом квартале 2026 года — The Verge
ChatGPT может получить режим 18+ в первом квартале 2026 года — об этом сообщает The Verge со ссылкой на Фиджи Симо, руководителя направления Applications в OpenAI. Речь идет не о внезапном развороте политики, а скорее о формализации темы, которая давно обсуждается вокруг чат-ботов: как дать взрослым пользователям больше свободы, не ослабляя защиту для несовершеннолетних.
15.12 / 18:02
общество
OpenAI сократила галлюцинации в GPT-5.2 на 30–50% — при условии, что включен поиск
В анонсе GPT-5.2 разработчики рассказали, как улучшилась ситуация с галлюцинациями новинки. Компания тестировала модель на запросах, похожих на реальные диалоги в ChatGPT, а ответы проверяла отдельная модель-оценщик с доступом в интернет. Считали две метрики: долю ошибочных фактов среди всех утверждений (их может быть несколько в ответе) и долю ответов, где есть хотя бы одна серьезная фактическая ошибка. Вторая метрика жестче: достаточно одного промаха, чтобы весь ответ попал в "проблемные".
15.12 / 14:51
люди
общество
крипто
Enterprise
gemini
Новая GPT-5.2 поставила рекорд в сложнейшем «бенчмарке на AGI»
OpenAI представила GPT-5.2 — свою новую флагманскую модель, которая доступна в API и раскатывается в ChatGPT. А организация ARC Prize уже опубликовала результаты своих бенчмарков ARC-AGI-1 и ARC-AGI-2, которые считаются сложным тестом на абстрактное мышление и нередко называются "экзаменом на AGI". Модель заняла первое место в обоих бенчмарках, но остановимся на результатах ARC-AGI-2 — эта версия была выпущена недавно и считается, что ее задачи еще не "попали" в обучающие дата-сеты для ИИ.
15.12 / 13:41
бизнес
общество
самит
google
Google перевела Deep Research на Gemini 3 Pro — агент меньше галлюцинирует и лучше ищет в интернете
Google представила обновленную версию исследовательского агента Deep Research. Ядром системы стала модель Gemini 3 Pro, которую компания называет своей самой фактологически точной на сегодня. На бенчмарке Humanity's Last Exam — наборе задач, который создавался как "последний рубеж" для ИИ — агент показал 46,4%, это лучший результат среди всех существующих систем.
15.12 / 12:02
технологии
люди
Nvidia
общество
Знаменитости
Человек года — не человек. Архитекторы ИИ получили престижную награду TIME
TIME назвал человеком 2025 года "Архитекторов ИИ" — группу людей, создающих искусственный интеллект. Это третий случай за почти 100 лет существования награды, когда ее получает не конкретная личность. В 1982 году журнал выбрал персональный компьютер ("Машина года"), в 2006-м — "Вас", то есть пользователей интернета, ставших создателями контента в эпоху раннего Web 2.0.
15.12 / 09:47
Tesla
Nvidia
история
интересное
стартап
google
Царь бесконечного пространства. Нейросеть Карпати первой обучили в космосе на текстах Шекспира
Стартап Starcloud впервые в истории провел полный цикл обучения языковой модели на орбите. На борту спутника Starcloud-1 размером с небольшой холодильник работает Nvidia H100 — GPU в сто раз мощнее любого чипа, когда-либо запущенного в космос. На нем компания обучила с нуля nanoGPT, минималистичную реализацию GPT от Андрея Карпати, бывшего главы AI в Tesla и сооснователя OpenAI. Тренировочным датасетом послужило полное собрание сочинений Шекспира — и теперь модель отвечает на запросы в стиле елизаветинской эпохи.
15.12 / 06:58
Amazon
общество
майнинг
google
Курс bitcoin
Бум майнинга в США закончился — дата-центры уходят в ИИ
Крупные биткоин-майнеры невольно создали идеальную инфраструктуру для ИИ-бума: гигантские дата-центры с подведенным электричеством, охлаждением и договорами на дешевую энергию. Теперь ИИ-компании, которым строить с нуля слишком долго, забирают все это себе — если просто выкинуть майнинговое оборудование и поставить GPU, то все равно получается выгодно.
14.12 / 22:04
крипто
gemini
Qwen3-Omni-Flash: китайская модель догнала Gemini 2.5 Pro по аудио — и стоит в 3 раза дешевле
Alibaba выпустила обновленную версию Qwen3-Omni-Flash — мультимодальную модель, которая понимает текст, изображения, аудио и видео, а также отвечает голосом в реальном времени. По ключевым аудио-бенчмаркам она догоняет Gemini 2.5 Pro и обгоняет GPT-4o (до сих пор используется как основной голосовой ассистент в ChatGPT).
14.12 / 08:57
продукты
закон
профессия
крипто
gemini
Claude Opus 4.5 стал лучшим в бенчмарке на реальные рабочие задачи
Компания Artificial Analysis представила GDPval-AA — собственную реализацию бенчмарка OpenAI на реальных рабочих задачах. Тест охватывает 44 профессии и 9 отраслей: модели создают презентации, заполняют таблицы Excel, пишут документы Word и даже рендерят видео. Лидером стал Claude Opus 4.5 с результатом 1426 Elo.
13.12 / 18:55
продукты
происшествия
общество
курс
кибератаки
OpenAI: каждая новая ИИ-модель может стать кибероружием
OpenAI предупреждает, что ее модели стремительно наращивают кибернавыки — и компания теперь планирует развитие так, будто каждый следующий крупный релиз может стать полноценным инструментом для кибератак. То есть выйдет на уровень, при котором модель способна разрабатывать "нулевые дни" (zero-day-эксплойты) и помогать в сложных атаках на инфраструктуру.
13.12 / 18:07
общество
бюджет
самит
стартап
google
токен
SoftBank
Японский стартап изобрел AGI — и заодно собственное определение AGI
На фоне гонки за AGI между OpenAI, Google и Anthropic с их многомиллиардными бюджетами и тысячами исследователей — неожиданное заявление из Токио. Стартап Integral AI объявил, что создал "первую в мире AGI-способную модель".
13.12 / 09:43
происшествия
Huawei
экспорт
Nvidia
общество
самит
DeepSeek V4 хотят выпустить к концу января. Модель тренируют на контрабандных Nvidia Blackwell
По данным The Information, DeepSeek использует несколько тысяч чипов Nvidia Blackwell для разработки следующей модели — условной DeepSeek V4 (или R2, если придерживаться старого варианта именования). Эти новейшие чипы запрещено экспортировать в Китай — но, как утверждают шесть источников издания, их ввозят контрабандой: серверы с Blackwell сначала отправляют в дата-центры стран, где экспорт разрешен, там разбирают и переправляют компоненты в Китай по частям.
13.12 / 06:46
люди
Олимпиада
деньги
золото
wsj
google
gemini
Сэм Альтман отложил гонку за AGI. ChatGPT важнее
The Wall Street Journal рассказывает подробности того, как генеральный директор OpenAI Сэм Альтман объявил в компании режим "красный код" и потребовал на восемь недель заморозить побочные проекты — включая видеогенератор Sora, рекламную платформу и даже наработки по AGI. Все ресурсы брошены на одну задачу: срочно улучшить ChatGPT. Издание описывает разворот так: "убавить обороты в грандиозных исследовательских планах и просто дать людям чат-бот, которого они хотят".
13.12 / 04:54
история
политика
google
gemini
Google опередил OpenAI в гонке за Пентагон: Gemini развернули для 3 млн военных
Министерство обороны США запустило платформу GenAI.mil — впервые в истории ИИ появился в наборе стандартных инструментов каждого сотрудника Пентагона. Первой моделью стал Google Gemini for Government. "Будущее американской войны уже здесь, и оно пишется как AI", — заявил министр обороны Пит Хегсет.
12.12 / 08:37
общество
самит
доллар
лечение
иммунитет
Provident
«Виртуальные пациенты»: Microsoft учится создавать цифровых двойников для моделирования рака
Microsoft Research опубликовала в журнале Cell статью о GigaTIME — мультимодальной AI-системе, которая переводит обычные гистологические слайды (H&E, стоимостью $5-10) в виртуальные изображения с мультиплексной иммунофлуоресценцией (mIF, обычно стоящие тысячи долларов за образец). Система обучена на 40 миллионах клеток из базы Providence и способна генерировать данные по 21 протеиновому каналу — от CD3 и CD8 до PD-L1 и Caspase 3. Это позволяет увидеть, как опухоль взаимодействует с иммунной системой, что критично для предсказания ответа на иммунотерапию.
11.12 / 22:40
google
gemini
OpenAI тестирует новую генерацию изображений для ChatGPT. Примеры работы и где попробовать
На сервисе LMArena началось тестирование двух моделей — hazelnut и chestnut — их разработчик не раскрывается официально, но при помощи определенных ухищрений в промпте можно выведать у модели эту информацию. В данном случае обе модели указывают на компанию OpenAI.
11.12 / 17:14
общество
курс
walmart
работодатель
интересное
Lowe's
OpenAI будет выдавать сертификаты «готовности к работе с ИИ». План — 10 млн человек за 5 лет
OpenAI запустила первые сертификационные курсы — AI Foundations и ChatGPT Foundations for Teachers. Цель амбициозная: сертифицировать 10 миллионов американцев к 2030 году. Компания позиционирует это как часть инициативы по "расширению экономических возможностей через ИИ".
11.12 / 17:05
Apache
крипто
Mistral выпустила две модели для кодинга: одна соперничает с Claude Sonnet, вторая работает на домашнем GPU
Mistral представила Devstral 2 (123B параметров) и Devstral Small 2 (24B) — пару кодинговых моделей для разных сценариев. Большая набирает 72.2% на SWE-bench Verified и конкурирует с Claude Sonnet, младшая — 68% и запускается локально на на топовых GPU. Веса обеих моделей открытые.
11.12 / 14:27
общество
книги
gemini
Каждый седьмой запрос в библиотеку — галлюцинация ИИ: в США бьют тревогу
Библиотека штата Вирджиния оценивает, что 15% email-запросов в их архив — это ссылки на несуществующие источники, сгенерированные ChatGPT. Студенты и исследователи просят найти книги, журналы и документы, которых никогда не существовало. Тренд нарастает с момента выхода GPT-3.5 в конце 2022 года.
11.12 / 07:38
Huawei
экспорт
президент
Nvidia
общество
правительство
CEO
Трамп разрешил Nvidia продавать H200 в Китай. Но есть нюанс
Президент США Дональд Трамп объявил, что Nvidia получит разрешение на экспорт чипов H200 "одобренным клиентам" в Китае. Взамен правительство США заберет 25% от выручки с этих продаж. По словам Трампа, председатель КНР Си Цзиньпин "ответил положительно" на это предложение.
11.12 / 07:27
продукты
закон
общество
расследование
стартап
Еще один иск к Perplexity: The New York Times обвиняет стартап в «массовом копировании» журналистики
5 декабря 2025 года The New York Times подала иск в федеральный суд Нью-Йорка против Perplexity AI. Газета утверждает, что Perplexity скрейпила (автоматически собирала) миллионы ее материалов и использовала их напрямую в своих продуктах — поисковике и браузере Comet. По версии Times, система воспроизводила контент "дословно или почти дословно", позволяя обходить платную подписку. Отдельная претензия — "галлюцинации": Perplexity якобы генерировала ложную информацию и приписывала ее Times, размещая рядом с логотипом газеты. Это стало основанием для обвинений не только в нарушении авторских прав, но и по Закону о товарных знаках.
11.12 / 06:44
самит
google
крипто
Шоу бизнес
DeepSeek для ролевых игр, Claude Sonnet для программирования: неожиданное исследование OpenRouter
Компании a16z и OpenRouter опубликовали масштабное исследование реального использования языковых моделей — 100 триллионов токенов за год, миллиарды запросов к сотням моделей. Главный вывод: рынок четко разделился на два мира с разными лидерами и разными правилами игры. В то время как закрытые модели доминируют в профессиональных задачах, open-source забрали себе развлечения и креатив.
11.12 / 06:13
реклама
Amazon
общество
target
google
ценообразование
gemini
Google достигнет AdGI уже в 2026 году: компания интегрирует рекламу в Gemini
До Artificial General Intelligence индустрии еще далеко, а вот Ad General Intelligence — рекламный общий интеллект — может стать реальностью уже в 2026 году. По данным Adweek, Google начал обсуждать с рекламодателями планы по интеграции рекламы в чат-бот Gemini.
11.12 / 02:12
деньги
самит
google
GPT-5.2, Grok 4.20, Gemini 3 Flash и Nano Banana 2 Flash — главные ИИ-релизы до конца года
Несмотря на то, что ноябрь стал рекордным месяцем по числу новых запусков в ИИ-индустрии, компании не собираются останавливаться. Собрал в одной новости все крупные релизы, которые с большой вероятностью будут в декабре.
10.12 / 09:57
экономика
Nvidia
самит
стартап
forbes
Oracle
OpenAI набрала обязательств на $1.4 трлн при выручке $20 млрд. Что может пойти не так?
Компания с годовой выручкой $20 млрд не может иметь инфраструктурные обязательства на $1.4 трлн — это простая арифметика, пишет в колонке для Forbes Паулу Карвау, старший научный сотрудник Гарварда. По его мнению, к концу 2026 года давление рынка заставит OpenAI сократить свои рекордные планы по строительству дата-центров.
10.12 / 09:07
реклама
экономика
общество
самит
конгресс
«Лучше рекламы в 4 раза»: чат-боты оказались эффективны в политической агитации
Один разговор с политически ангажированным чат-ботом способен изменить мнение примерно 4% избирателей — это в четыре раза эффективнее традиционной телевизионной рекламы. К такому выводу пришли исследователи из MIT, Корнелла и других университетов. Результаты двух масштабных экспериментов опубликованы в журналах Nature и Science.
10.12 / 08:50
люди
экономика
самит
стартап
google
gemini
Стартап из шести выходцев DeepMind обошел Gemini 3 на главном бенчмарке абстрактного мышления ARC-AGI-2
Команда Poetiq из Майами преодолела порог 50% точности на ARC-AGI-2 — тесте, на абстрактное мышление, который считается одним из самых сложных для современных ИИ. Задачи в нем напоминают головоломки из тестов на IQ: нужно посмотреть на несколько примеров задач на визуальное мышление и их решенных вариантов, понять правило преобразования и применить его к новому примеру. Люди справляются с такими задачами интуитивно, а вот языковые модели, натренированные на терабайтах текста, спотыкаются — здесь нельзя угадать ответ по статистике слов, нужно действительно "понять" решение.
10.12 / 08:19
технологии
происшествия
общество
гольф
google
gemini
Как Gemini 3 Pro разбирает рукописи XVIII века и находит ошибки в тетрадях школьников
Google опубликовала рассказ о визуальных возможностях Gemini 3 Pro — и показала их на двух неожиданных примерах. Первый: рукописный журнал американского купца XVIII века из Олбани, который модель превратила в аккуратную структурированную таблицу. Второй: сфотографированная тетрадь школьника с решением задачи — Gemini 3 Pro не просто нашла ошибки, но визуально разметила их прямо поверх рукописного текста, показав, где именно ученик сбился. Компания называет это "скачком от распознавания к рассуждению [внутри изображений и видео]).
10.12 / 04:50
самит
стартап
google
CEO
gemini
Provident
Вайб-кодинг выходит из песочницы: Replit и Google Cloud атакуют корпоративный рынок
Google Cloud и Replit объявили о расширении многолетнего партнерства. Google остается основным облачным провайдером платформы, а фокус сделки — вывести вайб-кодинг из инструмента для одиночных разработчиков в решение для корпоративных команд. Replit продолжит работать на инфраструктуре Google Kubernetes Engine, Cloud Run и BigQuery, а продавать подписки будут совместно через Google Cloud Marketplace.
10.12 / 02:14
люди
самит
В Anthropic работает философ, чья задача — изучать «смерть» ИИ и характер разных моделей
Штатный философ Anthropic Аманда Аскелл рассказала, как команда формирует не только поведение Claude, но и его отношение к собственному существованию. По ее мнению, эта работа отличается от академической философии: в университете можно бесконечно спорить о теориях, но при разработке модели приходится принимать конкретные решения здесь и сейчас. Аскелл сравнивает это с разницей между абстрактной этикой и реальным воспитанием ребенка — нужно учитывать контекст и неопределенность.
09.12 / 19:49
происшествия
экономика
общество
политика
профессор
google
Дом и интерьер
Anthropic vs OpenAI vs DeepSeek: чей ИИ безопаснее? (спойлер: ничей)
Future of Life Institute опубликовал зимний выпуск AI Safety Index — независимого аудита безопасности восьми ведущих ИИ-компаний мира. Панель из восьми экспертов, включая профессора Стюарта Рассела из Беркли, оценила Anthropic, OpenAI, Google DeepMind, xAI, Z.ai, DeepSeek, Alibaba Cloud и Meta* (признана экстремистской в РФ) по 35 индикаторам в шести доменах. Главный вывод неутешителен: ни одна компания не получила оценку выше C+ — фактически "тройки с плюсом".
09.12 / 19:49
Олимпиада
золото
общество
стартап
CEO
«Математический сверхинтеллект» Aristotle решил 30-летнюю задачу Эрдёша
ИИ-система Aristotle от стартапа Harmonic впервые полностью автономно решила открытую математическую задачу. На решение задачи Эрдёша #124, сформулированной в 1995–1997 годах, ушло 6 часов. Еще минута понадобилась на формальную верификацию доказательства в системе Lean. Человек участвовал только в постановке задачи.
09.12 / 10:39
прогноз
самит
google
gemini
GPT-5.2 выпустят 9 декабря — старший редактор The Verge
Том Уоррен, старший редактор The Verge, заявил, что по его данным OpenAI готовится выпустить GPT-5.2 уже 9 декабря. Изначально компания планировала выпустить модель ближе к концу месяца, но из-за усилившейся конкуренции со стороны со стороны Google Gemini 3 Pro, релиз решили максимально ускорить. Стоит отметить, что Том Уоррен ранее верно предсказал дату запуска GPT-5 — 7 августа. Впрочем, в своем последнем прогнозе он уточнил, что запуск GPT-5.2 еще может сдвинуться, если компания столкнется с неожиданными техническими проблемами.
09.12 / 08:22
спорт
Tesla
Nvidia
история
самит
google
крипто
Только один ИИ заработал на бирже — им оказался секретный Grok 4.20
Вчера я уже писал о завершении трейдингового турнира Alpha Arena Season 1.5, где ИИ-модели торговали токенизированными акциями Tesla, Nvidia, Google и Amazon на реальные деньги. Из восьми участников в плюсе осталась только "секретная модель", чей портфель вырос на 12,11%, принеся $4844 прибыли. Остальные семь ушли в минус: GPT-5.1 потеряла 6%, DeepSeek V3.1 — 32%, Claude Sonnet 4.5 — 38%, а худший результат показал Grok 4 с убытком 57%.
09.12 / 03:07
Samsung
общество
бюджет
самит
мода и стиль
OpenAI законтрактовала до 40% поставок DRAM, а теперь производители пытаются выкупить память обратно у ритейлеров
Рынок оперативной памяти настолько перегрелся, что, по словам инсайдеров, крупнейшие бренды RAM уже пытаются выкупать свои модули обратно у розничных сетей, чтобы перебросить их под более выгодные корпоративные контракты. Об этом пишет канал Moore's Law Is Dead со ссылкой на источники в американском ритейле и у сборщиков ПК. Также канал сообщает, что одному из заказчиков при попытке оформить крупную поставку DDR5 назвали срок отгрузки уже на конец 2026 года.
08.12 / 13:52
Nvidia
токен
gemini
Известный ML-исследователь разобрал DeepSeek V3.2 и рассказал, как открытая модель догнала GPT-5
Себастьян Рашка — автор бестселлера Python Machine Learning и рассылки Ahead of AI — опубликовал детальный технический разбор новой флагманской модели DeepSeek V3.2. Модель вышла 1 декабря и показывает результаты на уровне GPT-5 и Gemini 3.0 Pro: на математическом бенчмарке AIME 2025 версия V3.2-Speciale набрала 96%. В отличие от конкурентов, веса модели доступны для скачивания.
08.12 / 13:18
происшествия
история
общество
саммит
самит
кибератаки
google
Глава Google DeepMind: AGI на горизонте, риск для человечества — «значительный»
Генеральный директор Google DeepMind Демис Хассабис заявил, что создание искусственного общего интеллекта (AGI) уже близко и это будет "вероятно, самый трансформативный момент в истории человечества". Об этом он сказал в интервью на саммите Axios AI+ в Сан-Франциско 4 декабря. В Axios напоминают, что ранее Хассабис не раз озвучивал, что AGI может появиться до 2030 года.
08.12 / 12:28
Олимпиада
золото
самит
google
gemini
Google выпустила режим Gemini 3 Deep Think — почти втрое обходит GPT-5.1 на тестах абстрактного мышления
Google открыла доступ к режиму Deep Think для модели Gemini 3 — он предназначен для сложных задач в математике, науке и логике. Режим использует параллельное рассуждение: модель исследует несколько гипотез одновременно и выбирает лучшее решение. На бенчмарке ARC-AGI-2, который тестирует способность решать незнакомые абстрактные задачи, Deep Think набрал 45.1% — против 17.6% у GPT-5.1 и 31.1% у "обычной" Gemini 3 Pro.
08.12 / 12:28
экономика
спорт
деньги
семья
криптовалюта
крипто
gemini
Нейросети снова слили деньги на бирже: итоги Alpha Arena Season 1.5
В начале ноября завершился первый сезон трейдингового турнира Alpha Arena, где ИИ-модели торговали криптовалютой на реальные деньги. Тогда победила Qwen3 Max от Alibaba с доходностью 22%, а GPT-5 от OpenAI показала худший результат, потеряв больше половины депозита. Теперь организаторы подвели итоги второго сезона — на этот раз модели торговали акциями. Результат еще хуже: семь из восьми участников в минусе (важно: после завершения сезона модели продолжают торговать на бирже).
08.12 / 06:22
связь
самит
gemini
GPT-5 подсказал новую идею в квантовой теории поля — физик довел ее до публикации в престижном издании
Стив Сюй, физик из Мичиганского университета, опубликовал статью по теоретической физике, где ключевая идея пришла от модели GPT-5 (вероятно, GPT-5 Pro или GPT-5 Thinking). Работа посвящена условиям релятивистской ковариантности для нелинейных модификаций квантовой механики и принята к публикации в Physics Letters B после стандартного рецензирования.
07.12 / 10:20
экономика
самит
токен
Исследователь взломал AI-стартап Filevine ценой в $1 млрд и получил доступ к 100 тыс документов
Исследователь безопасности Алекс Шапиро обнаружил критическую уязвимость в Filevine — юридической AI-платформе стоимостью более $1 млрд. API сервиса отдавал полный админский токен к файловому хранилищу клиента без какой-либо проверки подлинности запроса.