FlexOlmo позволяет организациям совместно обучать языковые модели без обмена данными

habr.com

habr.com:

FlexOlmo, разработанный в Институте искусственного интеллекта Аллена, демонстрирует возможность совместной работы организаций над языковыми моделями на основе локальных наборов данных без передачи конфиденциальных данных.FlexOlmo основан на архитектуре Mixture-of-Experts (MoE), где каждый эксперт соответствует модулю прямой передачи (FFN), обученному независимо.

Фиксированная общедоступная модель (обозначается как Mpub) служит общим якорем. Каждый владелец данных обучает эксперта Mi на своём частном наборе данных D_i, в то время как все слои внимания и другие параметры, не относящиеся к экспертам, остаются замороженными.

Читать на habr.com Все новости от habr.com

ByteDance разогнала языковую модель в 5.4 раза с помощью дискретной диффузии

Skild Brain: единая модель для управления любыми роботами

Mistral AI публикует первую комплексную оценку жизненного цикла большой языковой модели

Компания Tencent выпустила открытую 3D-модель HunyuanWorld-1.0

ByteDance разогнала языковую модель в 5.4 раза с помощью дискретной диффузии

Skild Brain: единая модель для управления любыми роботами

Mistral AI публикует первую комплексную оценку жизненного цикла большой языковой модели

Компания Tencent выпустила открытую 3D-модель HunyuanWorld-1.0

Yandex B2B Tech открыла доступ к крупнейшей языковой модели Qwen3

Hierarchical Reasoning Model: иерархическая модель рассуждений, имитирующая работу мозга человека

Qwen3-MT — Alibaba выпускает еще одну модель для машинного перевода

Alibaba выпустила «самую мощную» ИИ-модель для программирования — Qwen3-Coder

Перегрузка языковых моделей информацией приводит к нерелевантным ответам

SoftBank и OpenAI разошлись во мнениях, похоже, теперь Stargate больше не совместный проект

OpenAI тестирует новую модель o3 Alpha для программирования на WebArena

Т-Банк представил ИИ-модель T-Pro 2.0 с гибридными рассуждениями, которая вдвое экономнее DeepSeek R1-Distil

Decart запустил MirageLSD — модель искусственного интеллекта, которая преобразует видео в реальном времени

DuckDuckGo теперь позволяет скрывать ИИ-изображения из результатов поиска

Google запустили модель для создания видео Veo 3 на Gemini API по высокой цене

Adobe представила обновления для Firefly: новые звуковые эффекты и интеграция моделей ИИ

Исследователи использовали видео c YouTube, чтобы показать, как модели ИИ справляются с неожиданными ситуациями

OpenAI откладывает выпуск модели с открытым исходным кодом на неопределённый срок из соображений безопасности

Архитектура New Energy-Based Transformer призвана улучшить «системное мышление» в моделях ИИ

Google представляет MedGemma — набор моделей ИИ с открытым исходным кодом для медицинских приложений

«Кошачья атака» на модель рассуждений показывает, насколько важна контекстная инженерия

OpenAI усиливает меры безопасности, чтобы не дать конкурентам скопировать свои передовые модели ИИ

Новый алгоритм Sakana AI позволяет большим языковым моделям работать сообща для решения сложных задач

Компания Huawei опровергла обвинения в плагиате моделей ИИ

Искусственный интеллект возрождает успешную модель Александра Дюма

Hunyuan-A13B от Tencent: языковая модель с динамическим подходом к рассуждению

Заявления Apple о больших моделях обработки данных стали предметом нового исследования

Белые акулы умеют менять цвет тела: зачем им это нужно

Три потенциально опасных пищевых добавки, с которыми врачи рекомендуют быть осторожными

Как уснуть в жару – эксперты назвали эффективные способы

Врачи назвали самый главный суперфуд для сердца

Seiko выпустила три лимитированные версии часов Prospex Speedtimer

Google представляет новых ИИ-агентов для анализа данных и научных исследований

10 слов, которые стоит прекратить употреблять, если хотите выглядеть умным человеком

Что почерк может рассказать о человеке и его характере - проверьте себя

Поддержка интернет-сервиса Dial-up будет полностью прекращена 30 сентября

Астронавты NASA SpaceX Crew-10 возвращаются на Землю

OnePlus будет использовать 165 Гц дисплеи в смартфонах среднего бюджета

10 000 мАч для смартфона уже не фантастика: Honor выводит автономность своих гаджетов на новый уровень

Вредно ли хрустеть пальцами – ответ израильского врача

Поставки Xiaomi YU7 достигли 6042 единиц за первый месяц

Топ-9 признаков действительно хороших отношений назвал психолог

Red Dead Redemption 2 и Metal Gear Solid 3: Snake Eater стали лучшими игровыми приквелами по версии IGN

В Китае сертифицировали версию гиперкара Yangwang U9 мощностью 3019 л.с.

В Англии заметили редкую акулу-призрака: чем уникальна

Новейший Snapdragon и аккумулятор на 7000 мАч — стали известны новые подробности смартфонов линейки Realme GT 8

Авто для коллекционеров: на продажу выставили реплику «Бэтмобиля» 60-х годов

OpenAI предложила ChatGPT федеральным агентствам США за $1 в год

В УрФУ разработали нейросеть, снижающую риск аварий и экономящую на обслуживании городской инфраструктуры

VK заявил, что RuStore установили на 300 тысяч машин

Как в разных странах борются с жарой: 11 нетипичных советов для израильтян

Samsung увеличит инвестиции в производство чипов в США

Что означает, когда ваше веко дергается - врачи предупредили о сигналах организма

Секреты привлекательности: ТОП-5 вещей, которые заставят обратить на вас внимание

Apple отказывается от бренда HomeKit - на смену приходит "Apple Home"

AMD прекращает поставки Ryzen 7 5700X3D - завершение эпохи AM4 с 3D V-Cache

В Москве откроется новое городское пространство «Яндекса» — «Яндекс-01»

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2025. Все права защищены.

DMCA