Вышел инструмент, который снимает цензуру с языковых моделей
Появился новый инструмент Heretic, который даёт возможность расцеплять языковые модели, снимая встроенные ограничения, известные как alignment, без изменения самих весов модели.
Система работает как чёрный ящик. Она получает ответы модели через API, анализирует их и обучает специальный дискриминатор на примерах безопасных и опасных запросов.
Вышел открытый кроссплатформенный проект AltSendme для конфиденциальной одноранговой передачи файлов
habr.com