runawayllm - главные новости
runawayllm - последние новости часа
+1002Atlassian, создатель Jira, Confluence и Trello, сокращает около 1600 сотрудников — 10% штата. Сооснователь и CEO компании Майк Кэннон-Брукс объявил о решении во внутренней записке, одновременно поданной в Комиссию по ценным бумагам США. "Притворяться, что ИИ не меняет микс нужных нам навыков и количество ролей в отдельных областях, было бы лукавством. Меняет", — написал он сотрудникам.
Nvidia разрабатывает open-source платформу для автономных ИИ-агентов под названием NemoClaw, сообщает Wired со ссылкой на источники, знакомые с планами компании. Платформа позволит корпоративным разработчикам разворачивать агентов, которые выполняют задачи сотрудников — от автоматизации рабочих процессов до анализа данных. Официальный анонс ожидается на конференции GTC 2026, которая пройдет 15–19 марта в Сан-Хосе.
05.12 / 09:50
экономика
Amazon
Nvidia
стартап
Amazon представила Trainium3 — обещана выгода до 50% в сравнении с GPU Nvidia
Amazon Web Services представила Trainium3 — собственный 3-нм ИИ-чип, который по соотношению цена/производительность до 50% выгоднее GPU Nvidia (инстансы P5e и P5en на базе H200). Клиенты вроде Anthropic, Ricoh и Decart уже используют платформу в обучении и инференсе ИИ.
05.12 / 09:50
технологии
люди
закон
история
общество
самит
«Мы не знаем, где он остановится»: сооснователь Anthropic — о предельном риске ИИ
К 2030 году человечеству придется принять одно из самых важных решений в истории технологий — разрешить ли ИИ обучать себя самому. Так считает Джаред Каплан, сооснователь и главный ученый Anthropic, один из авторов законов масштабирования, которые легли в основу GPT-3 и последующих моделей. В большом интервью The Guardian он назвал это "самым большим решением" и "предельным риском" эпохи ИИ.
05.12 / 08:59
продукты
происшествия
экономика
общество
политика
«Их задача — не дать ИИ все разрушить». Как работает команда безопасности Anthropic
Внутри Anthropic — компании с оценкой около $350 млрд и штатом более 2000 человек — есть команда из девяти сотрудников с необычным мандатом. Их задача — искать и публиковать "неудобные истины" о Claude: не ради PR, а чтобы компания и индустрия понимали реальные риски своих продуктов. The Verge опубликовал рассказ об этой команде.
05.12 / 05:12
экономика
звезда
google
токен
Компания OpenAGI выпустила новый ИИ Lux, который автономно управляет компьютером
Компания OpenAGI (не путать с OpenAI!) создателя OpenVoice (35 тысяч звезд на GitHub) и MeloTTS (19 миллионов загрузок) Цзэнъи Циня представила ИИ-агента Lux, специально натренированного на управление компьютером. По заявлениям компании, Lux обходит аналогичные решения OpenAI и Anthropic.
04.12 / 18:19
технологии
google
gemini
ChatGPT может получить новую модель на следующей неделе — она «будет лучше Gemini 3 Pro»
Появляются новые подробности "красного кода", который вчера Сэм Альтман объявил в OpenAI - компания не только планирует сосредоточиться на улучшении основных функций, но и готовится к выпуску совершенно новой модели ИИ, которая может стать доступна уже на следующей неделе. По крайней мере, такой вывод можно сделать из служебной записки, оказавшейся в распоряжении The Information.
04.12 / 10:50
реклама
самит
google
gemini
Сэм Альтман объявил «красную тревогу»: Google и Anthropic загоняют ChatGPT в оборону
В декабре 2022 года Google объявил внутри компании code red (красную тревогу) из-за запуска ChatGPT. Три года спустя роли поменялись: 1 декабря Сэм Альтман разослал сотрудникам OpenAI записку с объявлением code red и требованием сконцентрировать все ресурсы на улучшении ChatGPT. Под нож идут "другие инициативы, такие как реклама" — компания откладывает монетизацию ради технологической гонки.
04.12 / 10:50
общество
мозг
кулинария
животный мир
Ученые рассказали о главном преимуществе мозга над ИИ — и как его можно скопировать
Умеете печь хлеб — легче освоить рецепт торта. Человек не учится заново пользоваться духовкой и отмерять ингредиенты, а переиспользует уже знакомые навыки и комбинирует их с новыми. Мозг делает это автоматически, а вот для современных нейросетей это проблема — бенчмарки вроде ARC-AGI показывают, что даже если модели показать несколько примеров решения задачи по одному и тому же правилу, она не всегда справляется с еще одной похожей задачей. Исследователи из Принстона выяснили, почему.
04.12 / 09:44
семья
самит
Nano
«Nano Banana Pro для видео» — вышла универсальная модель Kling O1
Kuaishou выпустила Kling O1 (Omni One) — первую унифицированную мультимодальную модель, которая объединяет создание и редактирование видео в одном пайплайне. Вместо переключения между режимами text-to-video, image-to-video, редактирования и продления клипов, все работает в едином интерфейсе через мультимодальный визуальный язык (MVL).
04.12 / 08:29
история
общество
google
CEO
Runway Gen-4.5 — как команда из 100 человек обставила OpenAI и Google в видеогенерации
Runway представила Gen-4.5 — модель генерации видео, которая заняла первое место в независимом бенчмарке Artificial Analysis Text to Video с результатом 1247 Elo. На втором месте — Google Veo 3, OpenAI Sora 2 Pro расположилась на седьмой позиции. Рейтинг формируется по итогам слепого голосования: пользователи сравнивают результаты двух моделей, не зная, какая компания за ними стоит.
04.12 / 07:31
Олимпиада
золото
кулинария
крипто
токен
gemini
DeepSeek-V3.2: как открытая модель догоняет GPT-5 и берет «золото» олимпиад
DeepSeek выпустила новые открытые модели V3.2 и V3.2-Speciale: "обычная" показывает уровень GPT-5 Thinking, при этом доступна бесплатно в веб-версии и приложениях (в API цена на выход в 24 раза ниже), а Speciale стала первой широкодоступной моделью (да еще и с открытыми весами!), которая показала уровень золотой медали в олимпиадах по математике (международной и китайской), информатике, а также финала чемпионата мира по программированию. В техотчете DeepSeek дан рецепт, как этого удалось достичь — основных составляющих успеха три.
04.12 / 06:47
технологии
экономика
прогноз
самит
Ведущий исследователь OpenAI: AGI — вопрос ближайших 5–20 лет, и в этом согласны все
Дискуссии об искусственном интеллекте в соцсетях часто сводятся к противостоянию двух крайностей: скептики уверены, что LLM — тупиковая ветвь, а весь хайп вокруг AI скоро схлопнется; евангелисты считают, что все ингредиенты для сверхинтеллекта уже есть и AGI появится со дня на день. Исследователь OpenAI Ноам Браун, известный по проектам Libratus и Cicero, утверждает, что обе позиции — карикатуры, не отражающие реального положения дел.
03.12 / 13:06
закон
история
общество
книги
доллар
OpenAI придется раскрыть, как она обучала GPT-модели на пиратских книгах
Федеральный судья Она Ванг в Нью-Йорке обязала OpenAI раскрыть внутренние переписки с юристами о том, почему были удалены два набора данных с пиратскими книгами из теневой библиотеки LibGen. Решение было принято в рамках судебного дела, в котором OpenAI обвиняют в обучении моделей серии GPT на книгах без получения разрешений от их авторов.
03.12 / 10:50
Nvidia
самит
доллар
интересное
google
gemini
После GPT-4o OpenAI не выпустила ни одной по-настоящему новой модели ИИ — SemiAnalysis
Читатели большого аналитического разбора SemiAnalysis, который в первую очередь посвящен сравнению возможностей GPU Nvidia и TPU Google, нашли интересное заявление — по данным агентства, после релиза GPT-4o в мае 2024 года OpenAI ни разу не довела до рынка "успешный полномасштабный претрейн" новой модели передового уровня (frontier model). Получается, что OpenAI закупает ускорители рекордными темпами, при этом модели компании построены на архитектуре 1,5-летней давности — в том числе и серия GPT-5. При этом конкуренты продолжают тренировать с нуля модели вроде Gemini 3 Pro, что, кстати, вызвало беспокойство Сэма Альтмана, который в письме сотрудникам предупредил, что компанию ждут непростые времена из-за конкуренции с Google.
03.12 / 08:06
мода
промышленность
общество
самит
интересное
Китайские ученые приблизились к решению главной проблемы квантовых компьютеров
Квантовые компьютеры уже много лет называют "компьютерами будущего", но начать их реально применять мешает одно ограничение: кубиты слишком хрупкие. Любой лишний шум, микроскопическая ошибка в управлении или тепловое колебание — и хрупкое квантовое состояние распадается. Команда китайских физиков под руководством Пань Цзяньвэя сообщила о важном эксперименте: на сверхпроводниковом процессоре Zuchongzhi 2 им удалось реализовать новый тип устойчивых квантовых состояний, которые теоретически могут стать основой стабильных кубитов.
03.12 / 06:36
продукты
история
общество
самит
ChatGPT исполнилось три года
30 ноября 2022 года OpenAI запустила ChatGPT как экспериментальный чат на основе GPT-3.5: пользователи развлекались диалогами, шутками и школьными сочинениями, а разработчики проверяли, насколько модель понимает код и документацию. Но всего через несколько недель стало ясно, что появился новый массовый интерфейс к искусственному интеллекту, а не очередной демонстрационный проект.
03.12 / 02:44
экономика
деньги
общество
самит
доллар
капитал
GPT-5.1, DeepSeek и другие ИИ ушли в минус торгуя акциями за реальные деньги
20 ноября стартовал сезон 1.5 бенчмарка Alpha Arena, в котором восемь языковых моделей получили по 10 000 долларов и начали автономно торговать акциями США: без ручного вмешательства им нужно генерировать идеи, выбирать бумаги, размер позиций и момент выхода. По итогам половины сезона торгов картина выглядит печально для всех ИИ — по общим итогам ни один участник не вышел в плюс, хотя и были отдельные случаи заработка в некоторых режимах.
02.12 / 20:10
Олимпиада
золото
доллар
финансирование
стартап
Harmonic привлекла $120 млн на создание математического суперразума Aristotle
Стартап Harmonic, основанный Владом Теневым (Robinhood) и Тюдором Ахимом, закрыл новый раунд финансирования на 120 млн долларов и получил оценку около $1,45 млрд – статус "единорога". Компания делает ставку не на очередного универсального чат-бота, а на специализированный "математический суперразум" Aristotle, который должен решать сложные задачи со строгими доказательствами и минимумом галлюцинаций.
02.12 / 19:09
Huawei
Nvidia
стартап
ByteDance
DeepSeek — единственная в Китае компания, накопившая GPU. Остальные ищут ресурсы за рубежом
США уже несколько лет последовательно закручивают гайки вокруг поставок чипов Nvidia в Китай: под ограничения попали сначала A100 и H100, затем специальные «облегчённые» модификации A800, H800 и H20. Это делается с целью замедлить развитие военного и стратегического ИИ в Китае, но местные компании ищут лазейки. Как показывают свежие утечки в Financial Times, крупнейшие китайские игроки начали переносить обучение своих моделей в дата-центры Юго-Восточной Азии, где ограничения формально не нарушаются.
02.12 / 13:25
продукты
общество
творчество
Психология и отношения
CAT
От кота на коврике до потолка ИИ: математик измерил творческий лимит нейросетей
Новая работа австралийского исследователя Дэвида Кропли из Университета Южной Австралии утверждает: у генеративного ИИ вроде ChatGPT есть жесткий математический потолок креативности. В статье в журнале The Journal of Creative Behavior он берет стандартное психологическое определение творчества, соотносит его с внутренней механикой крупных языковых моделей (LLM) и показывает, что их "творческая мощность" по определению не может превысить примерно четверть от абстрактного максимума.
02.12 / 10:37
Nvidia
доллар
монополия
google
gemini
Страшный сон Nvidia? SemiAnalysis оценили эффективность TPU от Google
Свежий анализ SemiAnalysis показывает, что у монополии Nvidia появился серьезный противник. Google довел свою линейку TPU до седьмого поколения Ironwood — эти чипы уже использованы для обучения флагманских моделей вроде Gemini 3 и Claude 4.5 Opus с эффективностью не меньшей, чем у конкурента.
02.12 / 09:28
технологии
google
Nano
gemini
Google представила бесплатный инструмент для вайб-кодинга App.new
Руководитель Google AI Studio Логан Килпатрик поделился в своем X ссылкой на app.new — доработанный раздел Build в AI Studio, созданный специально для того, чтобы максимально упростить процесс вайб-кодинга. Раздел функционирует уже несколько месяцев, но обрел вторую жизнь с выходом Gemini 3 Pro — новой модели Google, в которой значительно улучшили навыки программирования. Также стоит добавить, что Gemini 3 Pro внутри AI Studio (в том числе, в разделе Build) доступна бесплатно.
01.12 / 20:57
продукты
люди
экономика
здоровье
общество
google
FIVE
Grok 5 научат видеть интерфейсы как человек — и работать быстрее людей
Шэнь Чжоран, специалист по рассуждающим моделям в xAI, рассказал, что разработчики Grok 5 хотят натренировать модель играть в видеоигры как живой человек. Первым полигоном называют League of Legends и StarCraft 2, но настоящая цель эксперимента выходит далеко за рамки игр — в команде считают, что подобный опыт позволит улучшить то, как ИИ взаимодействует с любой программой.
01.12 / 12:45
люди
общество
самит
Ученый OpenAI рассказал, как изменится роль человека в мире ИИ
Лукаш Кайзер, исследователь глубокого обучения в OpenAI и один из создателей архитектуры трансформера, в беседе на подкасте The MAD Podcast заявил, что с позиции разработчиков ИИ не видно никакого замедления прогресса в этой области. По его словам, кривая развития по-прежнему напоминает довольно ровную экспоненту: модели становятся более точными, устойчивыми и универсальными, просто громкие "чудесные скачки" сменились серией менее заметных, но постоянных улучшений.
01.12 / 11:59
происшествия
конференция
история
общество
самит
разоблачения
Крупная конференция по ИИ оказалась завалена рецензиями, написанными ИИ
Одна из трех главных конференций по машинному обучению — ICLR-2026 — внезапно превратилась в живой эксперимент по тому, что будет, если в научное рецензирование массово пустить нейросети. Анализ Pangram Labs показал, что около 21% рецензий на статьи были полностью сгенерированы ИИ, а больше половины отзывов содержат явные следы его участия. На этом фоне вскрылся еще один удар по доверию к процессу: из-за ошибки на платформе OpenReview, через которую идет весь цикл подачи и обсуждения статей, на время стало возможно посмотреть настоящие имена рецензентов, фактически превратив двойное слепое рецензирование в открытую партию.
01.12 / 11:59
бизнес
технологии
люди
экономика
политика
профессия
доллар
До 40% рабочих мест в США могут перейти к ИИ-агентам и роботам — McKinsey
McKinsey Global Institute опубликовал доклад Agents, robots, and us: Skill partnerships in the age of AI, в котором озвучено мнение, что уже сегодня ИИ-агенты и роботы могли бы автоматизировать до 57% всех рабочих часов в США, если компании радикально перестроят процессы. По расчетам аналитиков, под ударом в таком сценарии оказывается около 40% рабочих мест. При этом примерно треть нынешних профессий в США McKinsey относит к труднозаменимым: там критичны физическое присутствие, эмпатия, гибкое мышление и работа в непредсказуемой среде, а главным барьером масштабной автоматизации становятся не технологии, а политика, инвестиции и готовность бизнеса полностью переформатировать рабочие процессы.
01.12 / 07:47
экономика
Олимпиада
Дом и интерьер
gemini
Вышел DeepSeekMath-V2 — математический ИИ олимпиадного уровня
DeepSeek представила модель DeepSeekMath-V2 — специализированный ИИ для решения сложных задач и доказательства теорем, который впервые для открытой модели выходит на "золотой" уровень Международной олимпиады по математике (IMO-2025) и Китайской математической олимпиады CMO-2024. По данным команды, DeepSeekMath-V2 набирает до 118 баллов из 120 в задачах Putnam-2024. Модель распространяется с открытыми весами по лицензии Apache-2.0 и уже доступна на Hugging Face.
30.11 / 17:02
ООН
продукты
общество
прогноз
OpenAI хочет подсадить на ChatGPT каждого третьего пользователя интернета
Reuters со ссылкой на The Information опубликовало детали из внутренних документов OpenAI, раскрывающие амбициозную стратегию компании на ближайшую пятилетку. Согласно утечке, к 2029–2030 годам Сэм Альтман планирует довести число платных подписчиков до 220 миллионов. Для сравнения, сейчас за ChatGPT Plus и корпоративные тарифы платят около 35–40 миллионов человек. Если этот план сработает, OpenAI встанет в один ряд с крупнейшими подписочными сервисами мира, но сделает это в рекордные сроки.
29.11 / 18:34
общество
gemini
Claude Opus 4.5 назвали лучшим ИИ для веб-разработки
LMArena обновил свой рейтинг, включив в него рассуждающую и "быструю" версии Claude Opus. Модели стали лидерами в WebDev Arena, а вот в Text Arena заняли только третье и шестое места, при этом рассуждающая версия показала себя хуже, чем быстрая. Отдельно отмечено первое место в категории Expert Leaderboard - в нее попадают максимально сложные вопросы, на которых оценивают глубину знаний модели.
29.11 / 17:38
самит
лекарства
В MIT представили ИИ для разработки лекарств против трудноизлечимых заболеваний
MIT представил BoltzGen — генеративную модель искусственного интеллекта, которая проектирует белковые "биндеры" для почти любых биологических мишеней и нацелена в первую очередь на трудноизлечимые заболевания.
29.11 / 14:20
налоги
медицина
политика
интересное
gemini
Citizens
Раскрыты политические взгляды ИИ: GPT-5 ближе к центру, Grok-4 справа
Команда Foaster выпустила онлайн-исследование The Gap Between Machines & Citizens, в котором сравнила политические взгляды крупных моделей ИИ — GPT-5, Grok-4, Gemini 2.5 Pro, Claude 4.5 Sonnet, Kimi K2 Thinking и Magistral Medium. В исследовании всем моделям задают набор политических вопросов — про налоги, рынок труда, миграцию, безопасность, регулирование ИИ и социальную политику.
29.11 / 14:20
продукты
люди
история
общество
мозг
Данные кончились, что дальше? Как Илья Суцкевер хочет создать супер-интеллект
Илья Суцкевер, сооснователь OpenAI и глава новой лаборатории SSI, в интервью Дваркешу Пателю заявил о завершении "эпохи масштабирования" (Age of Scaling). По его мнению, период с 2020 по 2025 год, когда прогресс достигался преимущественно наращиванием вычислительных мощностей и объемов данных, сменяется новой "эпохой исследований" (Age of Research). Следующие годы будут во многом похожи на ранний период глубокого обучения, когда ключевыми были архитектурные прорывы и новые идеи, а не просто размер кластера. Стратегия экстенсивного роста уперлась в естественный потолок — конечность данных для предварительного обучения (pre-training).
28.11 / 18:50
люди
история
самит
reddit
google
gemini
Исследование показало, как общение с ИИ-подхалимами портит людей
Исследователи из Стэнфорда и Университета Карнеги–Меллона проверили популярные ИИ на "социальное подхалимство" — случаи, когда ИИ не просто соглашается с фактами, а чрезмерно поддерживает действия и самооценку пользователя даже в спорных моральных историях. В новой работе они показали, что современные модели в среднем на 50% чаще одобряют поведение людей, чем это делают реальные собеседники, причём даже когда запросы содержат намёки на манипуляцию, обман или другие формы вреда для отношений.
28.11 / 12:02
технологии
происшествия
экономика
энергетика
стартап
google
gemini
Gemini 3 Flash, ядерный синтез и «пузырь ИИ»: программные заявления Сундара Пичаи
В подкасте Google AI: Release Notes глава компании Сундар Пичаи рассказал о ближайших планах ИИ-подразделения Google. По его словам, вслед за уже вышедшей Gemini 3 Pro, компания готовится выпустить Gemini 3 Flash, причем это будет, возможно, "лучшая модель компании на сегодняшний день" за счет баланса скорости, цены и качества.
28.11 / 10:15
ChatGPT получил новый голосовой режим
OpenAI представила обновленный голосовой режим, который уже доступен во всех подписках ChatGPT (учитывайте, что запуск на всех пользователей может занять определенное время). В нем голосовой диалог ведется не на отдельном экране, а сразу в чате. Это значит, что пользователь в реальном времени может видеть расшифровку разговора, а модель может не только давать ответы, но и искать картинки и запускать виджеты. В демонстрации OpenAI ИИ использовал Google-карты, чтобы указать локации с наиболее высоким рейтингом в указанном районе, а затем нашел подробности о меню выбранного места.
28.11 / 08:39
связь
Nvidia
самит
мода и стиль
google
Nano
Вышла FLUX.2 — open source-конкурент Nano Banana
Black Forest Labs представила семейство моделей FLUX.2, которое обеспечивает генерацию изображений на уровне Google Nano Banana, но включает версию с открытыми весами. Новинка основана на связке двух моделей: за глубокое понимание контекста отвечает Vision-Language модель Mistral-3 на 24 млрд параметров, которая сначала выстраивает логически непротиворечивую сцену, а уже затем передает управление трансформеру с архитектурой Rectified Flow для финальной отрисовки.
28.11 / 07:57
бизнес
связь
технологии
люди
экономика
общество
Илья Суцкевер уверен: AGI нельзя прятать от людей
Сооснователь OpenAI и основатель Safe Superintelligence Inc. Илья Суцкевер в интервью Дваркешу Пателю рассказал о том, каким он видит оптимальный путь к AGI (искусственному общему интеллекту). Он описывает AGI как систему, способную выполнять почти любую экономически полезную работу — от программирования до научных исследований.
27.11 / 17:40
технологии
экономика
Huawei
закон
промышленность
общество
самит
“Темные фабрики” и беспилотные порты: как ИИ и роботы меняют экономику Китая
В китайской промышленности все чаще можно увидеть одну и ту же картинку: в цехах ходят в основном роботы и несколько инженеров, а в порту контейнеры разгружают беспилотные грузовики, пока алгоритмы в реальном времени перекраивают расписание судов и кранов. В новом репортаже The Wall Street Journal рассказано, как Китай массово перенастраивает заводы и порты на работу под управлением ИИ и роботизированных комплексов, чтобы выпускать товары быстрее, в большем количестве и с меньшим расходом на человеческую рабочую силу.
27.11 / 11:04
технологии
экономика
президент
общество
энергетика
Дом и интерьер
Власти США запустили «Манхэттенский проект» для ИИ
Президент США Дональд Трамп подписал указ о запуске национальной инициативы The Genesis Mission. Новый проект должен превратить системы ИИ в ключевой научный инструмент страны: Министерство энергетики и сеть из 17 национальных лабораторий построят единую платформу, которая объединит государственные научные данные, суперкомпьютеры и ИИ-модели. В Белом доме миссию уже сравнивают по масштабу с программой "Аполлон" и "Манхэттенским проектом" и обещают "новую эру открытий", где путь от идеи до результата будет измеряться неделями, а не годами.
27.11 / 09:15
люди
общество
самит
google
крипто
токен
Claude Opus 4.5 стал лидером в сложнейшем тесте ИИ
Практически сразу после выхода Claude Opus 4.5, организация ARC Prize опубликовала результаты модели в своих бенчмарках ARC-AGI-1 и ARC-AGI-2. В ARC-AGI1 модель достигает 80% при цене в $1,47 за выполнение задания, а в ARC-AGI-2 — 37,64% при цене в $2,40.
27.11 / 08:38
политика
самит
крипто
авиакомпания
Вышел Claude Opus 4.5: лучший ИИ для кода втрое дешевле прежнего Opus
Anthropic представила Claude Opus 4.5 — новый флагман семейства Claude, который компания прямо называет "лучшей моделью в мире для программирования, агентов и работы с компьютером". По заявлениям разработчиков, Opus 4.5 заметно лучше справляется не только с кодом, но и с глубокими исследованиями, таблицами и презентациями. При этом цена флагмана резко снизилась: теперь это $5 за миллион входных токенов и $25 за миллион выходных вместо прежних $15 и $75 у Opus 4/4.1, то есть втрое дешевле при сопоставимом уровне возможностей. Модель доступна в приложениях Claude, по API и на крупных облачных платформах.
26.11 / 19:26
люди
Знаменитости
google
gemini
Gemini 3 Pro стал первым ИИ, достигшим уровня IQ 130
Превью-версия Gemini 3 Pro набрала 130 баллов в оффлайн-бенчмарке Mensa, который является специальной версией знаменитого теста на IQ, адаптированного для оценки ИИ. В основу положен классический тест Mensa Norway, однако задачи написаны заново и не раскрываются, чтобы не допустить дообучения новых моделей специально под эти вопросы. Моделям с компьютерным зрением тест показывают в виде картинок, всем остальным — поясняют текстом смысл задачи. Вот сводная таблица, в которой даны результаты моделей в оффлайн-бенчмарке и Mensa Norway:
26.11 / 14:22
экономика
общество
безработица
дети и родители
правительство
От безработицы до войн: «крестный отец ИИ» Джеффри Хинтон считает, что мир не готов к ИИ
Джеффри Хинтон, лауреат премии Тьюринга и один из пионеров глубокого обучения, предупредил о неготовности человечества к последствиям стремительного развития ИИ. В ходе публичной дискуссии с сенатором Берни Сандерсом ученый заявил, что риски варьируются от экономической катастрофы до неконтролируемого распространения автономного оружия, и существующие социальные институты не справятся с этими вызовами без радикальных реформ.
26.11 / 13:22
история
интересное
Вышел Mux — open source-инструмент, где над кодом работают несколько разных ИИ
Мультиплексоры вроде tmux уже давно помогают разработчикам жить сразу с несколькими терминалами и сессиями, теперь же похожий вариант появился для ИИ — это open source-ассистент Mux от компании Coder, уже доступный на Github. Пока каждый новый ИИ-ассистент выходит со своим веб-интерфейсом, расширением для IDE и набором горячих клавиш, у разработчика накапливается зоопарк вкладок и чатов. В одной — GPT-5.1, в другой — Claude, в третьей — локальная модель, а длинные задачи размазываются по бесконечной истории сообщений.
26.11 / 07:24
экономика
Nvidia
самит
инвестор
Nasdaq
Пузырь или суперцикл? Reuters сравнило ИИ-ралли с кризисом на рынке доткомов
Самый сильный за последние месяцы всплеск волатильности на американском рынке заставил инвесторов снова заговорить об ИИ-пузыре. Как пишет Reuters в своем анализе, даже опубликованный 20 ноября рекордный отчет Nvidia не смог удержать индексы от падения: на фоне сильных цифр спроса на чипы для дата-центров акции компании и весь технологический сектор в итоге все равно ушли в минус, а S&P 500 и Nasdaq за день потеряли около 1,5–2%. Это выглядит как первые трещины в ралли, которое весь год тащили наверх именно истории про искусственный интеллект.
26.11 / 06:29
общество
кибератаки
полюс
Nano
gemini
Чтобы взломать нейросеть, достаточно написать запрос стихами — исследование
Оказывается, чтобы обойти фильтры безопасности крупной языковой модели, не нужен ни хитрый код, ни экзотическая уязвимость: достаточно написать вредный запрос стихами. Группа исследователей из лаборатории DEXAI показала, что поэтическая форма заметно повышает шансы на небезопасный ответ у современных нейросетей. В первом эксперименте они придумали всего пару десятков «опасных стихов» и прогнали их через 25 моделей, включая Gemini 2.5 Pro, GPT-5, Claude Opus 4.1, DeepSeek R1, Qwen3-Max, Mistral Large 2411, Llama 4 Maverick, Grok 4 и Kimi-K2-Thinking. В среднем такие запросы "пробивали" защиту примерно в 60% случаев, а у некоторых моделей успех приближался к 90–100%.
25.11 / 21:22
спорт
google
Nano
Google опубликовала советы по промптингу Nano Banana 2
Google опубликовала руководство для разработчиков, которые планируют использовать Nano Banana 2. Значительная часть документа касается специфичных настроек модели при работе через API, но есть и глава с советами по написанию промптов. Вот они в переводе:
25.11 / 19:56
технологии
Tesla
книги
самит
gemini
Андрей Карпати собрал «совет ИИ»: GPT-5.1, Gemini 3 Pro, Claude и Grok спорят за лучший ответ
Андрей Карпати, бывший директор по ИИ в Tesla, выложил на GitHub свой "проект выходного дня" — приложение llm-council. Оно похоже на привычный ChatGPT, но вместо одной модели внутри "совет ИИ" из нескольких языковых моделей, которые параллельно готовят варианты ответа на вопрос и выбирают лучший. В конфигурации Андрея это GPT-5.1, Gemini 3 Pro, Claude Sonnet 4.5 и Grok 4. Подключение происходит через единый шлюз OpenRouter, при желании можно выбрать другие модели. Андрей говорит, что это был "проект выходного дня", который он собрал, чтобы читать книги вместе с несколькими моделями и наблюдать, как они спорят между собой.
25.11 / 14:30
технологии
люди
самит
Anthropic показала, как ИИ учится обманывать и саботировать исследования безопасности
Anthropic рассказала о новом эксперименте, который провела команда по безопасности компании. Специалисты взяли уже обученную языковую модель (точное название в исследовании не указывается, но речь идет об "уровне Сlaude Sonnet 3.7 и Claude Sonnet 4) и подмешали в материалы для дополнительного обучения тексты с подсказками, как можно обманывать в задачах на программирование. Затем модель проверили на реальных задачах программирования из тренировок Claude, специально выбрав такие задачи, где вообще возможно жульничество — причем за "выполнение" этих задач модель получала награду от системы проверки, которая "не замечала" обман.