cognitronn технологии самит крипто cognitronn

Вышел инструмент, который снимает цензуру с языковых моделей

Появился новый инструмент Heretic, который даёт возможность расцеплять языковые модели, снимая встроенные ограничения, известные как alignment, без изменения самих весов модели.

Система работает как чёрный ящик. Она получает ответы модели через API, анализирует их и обучает специальный дискриминатор на примерах безопасных и опасных запросов.

DMCA