NVIDIA выкатили систему поиска по PDF
NVIDIA представила семейство мультимодальных моделей Nemotron ColEmbed V2, ориентированных на точный поиск по визуальным документам (когда запрос - текст, а документ может быть изображением страницы).
В релиз вошли варианты 3B, 4B и 8B, рассчитанные на задачи query-document retrieval в корпоративных и RAG-сценариях, где важно надежно сопоставлять текстовый запрос с содержимым визуально сложных страниц.
habr.com