Cohere выпустила новую мультимодальную модель Command A Vision

habr.com:

Command A Vision предназначена для анализа изображений, диаграмм, PDF-файлов и других визуальных данных. По заявлению разработчиков, на стандартных бенчмарках для компьютерного зрения она превосходит GPT-4.1, Llama 4 и Mistral Medium 3.Модель способна не только считывать текст с документов, но и понимать их структуру, выдавая результат в формате JSON.

Кроме того, Command A Vision может анализировать и реальные изображения, например, для выявления потенциальных рисков на промышленных объектах.Обратите внимание, что использование этого инструмента не поддерживается в модели.

Читать на habr.com Все новости от habr.com

Baidu до конца месяца выпустит новую ризонинг-модель

OpenAI выпустила GPT-5

Anthropic выпустила опенсорсный инструмент для автоматической проверки кода на уязвимости

Xiaomi выложила в опенсорс SOTA-модель для универсального понимания аудио

Baidu до конца месяца выпустит новую ризонинг-модель

OpenAI выпустила GPT-5

Anthropic выпустила опенсорсный инструмент для автоматической проверки кода на уязвимости

Xiaomi выложила в опенсорс SOTA-модель для универсального понимания аудио

Qwen выпустил генератор изображений с открытым кодом Qwen‑Image

Nvidia представит на SIGGRAPH 2025 ИИ-модель Queen для создания 3D-видео

ByteDance разогнала языковую модель в 5.4 раза с помощью дискретной диффузии

Horizon Alpha: загадочная модель, которую уже считают «младшим GPT-5»

Появилась новая опенсорсная модель FLUX.1-Krea-dev

Google DeepMind представила Gemini 2.5 Deep Think — новую мультиагентную модель ИИ

DeepMind показала модель для создания цифрового двойника Земли

Skild Brain: единая модель для управления любыми роботами

Компания Tencent выпустила открытую 3D-модель HunyuanWorld-1.0

Hierarchical Reasoning Model: иерархическая модель рассуждений, имитирующая работу мозга человека

Qwen3-MT — Alibaba выпускает еще одну модель для машинного перевода

Windows 11 получила обновлённый Copilot Vision и другие свежие ИИ-функции

Alibaba выпустила «самую мощную» ИИ-модель для программирования — Qwen3-Coder

OpenAI тестирует новую модель o3 Alpha для программирования на WebArena

Т-Банк представил ИИ-модель T-Pro 2.0 с гибридными рассуждениями, которая вдвое экономнее DeepSeek R1-Distil

Decart запустил MirageLSD — модель искусственного интеллекта, которая преобразует видео в реальном времени

«Не спешите целиком и полностью доверять новому агенту ChatGPT», — предупреждает Альтман

Google запустили модель для создания видео Veo 3 на Gemini API по высокой цене

Adobe представила обновления для Firefly: новые звуковые эффекты и интеграция моделей ИИ

Google Cloud Platform становится новым партнером для ChatGPT

Thinking Machines Lab пока не выпустила ни одного продукта, но уже привлекла $2 млрд венчурного капитала

Anthropic расширяет присутствие на корпоративном рынке: новые ИИ-решения и инвестиции

Voxtral — новая модель распознавания речи от Mistral, которая дешевле проприетарных аналогов

Expedition 33 — это только начало: Clair Obscur получит продолжение и станет масштабной франшизой

Умные часы Huawei Watch D2 будут мерить давление по расписанию

Как стартап Anduril завоевывает оборонный рынок США

Исследователи представили технологию прослушки смартфонов с помощью радаров автопилотов

Разработчик ИИ предупредил о новых схемах банковского мошенничества

Hisense представила телевизоры UX ULED с диагоналями 100 и 116 дюймов

Семь преимуществ ходьбы после еды, о которых мало кто знает

Медведь решил "превратиться" в собаку ради еды (ВИДЕО)

Три страны мира, где люди стареют медленнее всего

Tesla предложила владельцам Cybertruck трейд-ин по цене выше покупки

Camunda признана лидером в оркестрации в отчете Forrester Wave 2025 for DPA

«Вместо лонглиста на 25 человек собрали всего восемь». КАИ выбрал постоянную руководительницу. Как это происходило и почему конкурс чуть не остановили из-за суда

Цифровой детокс сложнее, чем ледяное испытание: что показал мировой эксперимент

Grok подсказывает как делать взрывчатку и наркотики, а также дает советы как убить Илона Маска

15 детских привычек, которые делают людей счастливее во взрослой жизни

«Буффало Билл» — новое эссе Артура Хейса. Краткий пересказ

Gemini запустила стейкинг Ethereum и Solana в Великобритании

OpenLedger: Ethereum и Solana способны открыть цифровому евро путь за пределы Европы

Китайская фирма похвалила сотрудников за переработки, которые достигают 100+ часов в месяц и не оплачиваются

Ваша печень переполнена токсинами - медики назвали три необычных признака

Пять продуктов, которые запрещено хранить в дверце холодильника - могут стать опасными

Вода с лимоном может навредить организму - врачи развенчали миф о "магическом" напитке

iPhone могут получить дисплеи с tandem OLED, как в iPad Pro

Пользователи YouTube заметили самопроизвольное редактирование видео после загрузки