Вышел инструмент, который снимает цензуру с языковых моделей

habr.com

habr.com:

Появился новый инструмент Heretic, который даёт возможность расцеплять языковые модели, снимая встроенные ограничения, известные как alignment, без изменения самих весов модели.

Система работает как чёрный ящик. Она получает ответы модели через API, анализирует их и обучает специальный дискриминатор на примерах безопасных и опасных запросов.

Читать на habr.com Все новости от habr.com

Anthropic подписала $200 млн сделку с Snowflake — её ИИ‑модели станут доступны тысячам компаний

OpenAI представила технику Confessions которая учит модели честно сообщать о собственных ошибках

AWS открывает путь к корпоративному ИИ: создавайте свои модели на облаке

Китайские открытые AI-модели впервые обошли по популярности американские

Anthropic подписала $200 млн сделку с Snowflake — её ИИ‑модели станут доступны тысячам компаний

OpenAI представила технику Confessions которая учит модели честно сообщать о собственных ошибках

AWS открывает путь к корпоративному ИИ: создавайте свои модели на облаке

Китайские открытые AI-модели впервые обошли по популярности американские

Alibaba показала AgentEvolver, который делает ИИ-агентов умнее на 30 процентов

OpenAI готовит устройство, которое изменит наше представление о смартфонах и ИИ

ИИ взял золото на Международной олимпиаде по физике — и это была открытая модель…

Экс-сотрудник MrBeast запускает ИИ, который создаёт вирусные видео

ИИ без галлюцинаций: как Lean 4 заставляет модели доказывать правду

Google раскрывает секрет вечной памяти ИИ и обещает, что модели больше ничего не забудут

Tencent открыла модель, которая делает создание видео доступным каждому

Manus представила Browser Operator — ИИ-агенты, которые работают с браузером

NVIDIA представила открытые модели Apollo для научных расчетов и симуляций

Вышел Grok 4.1

Sakana AI привлекает $135 млн на создание моделей, оптимизированных под Японию

Вышла мультимодальная модель, разработанная для понимания интерфейсов

ByteDance выпустила ИИ-агента, который часами проходит 3D-игры

Новая парадигма ИИ от Google позволяет моделям учиться бесконечно

Cognition представила ИИ, который помогает понимать код

150 бывших консультантов McKinsey обучают AI-модели

Исследователи показали систему, которая способна создавать реалистичные 3D-модели городов

IBM выпустила семейство компактных моделей Granite 4.0 Nano

Meituan представила открытую модель, которая умеет вести диалог в реальном времени

Kimi представили новую модель — Kimi-Linear-48B-A3B-Base

Microsoft раскрыла цифры, которые показывают масштабы расходов OpenAI

Вышла новая масштабная мультимодальная world-модель

OpenAI выпустила бесплатные модели для модерации контента

Сколько глаз у пауков и слышат ли они: неожиданные открытия ученых

Частые перепады настроения могут скрывать опасное заболевание

Вместе с серией Galaxy S26 компания Samsung выпустит 25-ваттную беспроводную зарядную станцию

Критическая уязвимость позволяет выполнить произвольный код на серверных компонентах React 19.0.0/19.1.0/19.1.1/19.2.0

Запуск российско‑китайского мессенджера «Молния» перенесли на начало 2026 года

Кит проснулся после 14 лет неактивности и перевел 1000 BTC

Никогда не подключайте эти приборы к роутеру: последствия будут ужасны

Хищник из Tinder: как 20 минут свидания стали началом кошмара

Microsoft предостерегла IT-администраторов от использования неподдерживаемых сред выполнения .NET

Nubia выпустила игровые TWS-наушники CyberBuds

Какие функции телевизора нужно изучить до покупки - советы эксперта

Вышла новая версия B2B CRM SimpleOne с автоматической генерацией контента через ИИ

Сахар и сладкие напитки убивают наши волосы

На TGA 2025 будет раскрыта дата релиза и новые подробности геймплея брутального экшена Phantom Blade Zero

В Coinbase спрогнозировали восстановление крипторынка в декабре

Weekly: обновление Ethereum Fusaka, рынок прогнозов на BNB Chain и проблемы Strategy

Ayaneo выпустила консоль Pocket DMG в цвете Silver Limited Edition

Мужчина прожил 30 лет с зажигалкой в желудке

Яндекс Вебмастер обновил раздел «Диагностика сайта»

Фотофлагман Xiaomi 17 Ultra получит лимитированную серию Leica Leitzphone — на это указывает упоминание в базе данных GSMA

Крупные игроки накопили 47 000 BTC в декабре — Santiment

Анонсировано новое поколение смартфона Jolla Phone

Майкл де Санта снова в деле: крупное обновление GTA Online введет в игру культового персонажа GTA V

Самые разрушающие привычки для нашего мозга

Вебинары декабря для маркетологов и бизнеса

Правительство Южной Кореи приравняет криптобиржи к банкам по ответственности

Не только Mac и iPad: в 2028 году Apple подключит Intel к производству процессоров для iPhone

Исследователь взломал AI-стартап Filevine ценой в $1 млрд и получил доступ к 100 тыс документов

Искусственный интеллект перешел "на сторону зла" и хакнул собственные тесты: ученые взволнованы

Голуби летают на большие расстояния благодаря "компасу" - исследование

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA