
Mistral AI представила Mistral OCR 3 — новую модель оптического распознавания символов. Компания заявляет, что модель показывает общий прирост эффективности в 74% по сравнению с предшественницей Mistral OCR 2 при извлечении данных из форм, отсканированных документов, сложных таблиц и рукописных записей.
Mistral OCR 3 интегрирована в Document AI Playground в Mistral AI Studio и позволяет перетаскивать PDF и изображения для конвертации в чистый текст или структурированный JSON. Модель доступна разработчикам через API, поддерживает выход в формате markdown с восстановлением таблиц на основе HTML и предлагается по цене $2 за 1 000 страниц с 50% скидкой при пакетной обработке.
Релиз стал доступен глобально для разработчиков и корпоративных клиентов через интерфейс Mistral AI Studio и API. Продукт ориентирован на организации, которым требуется массовая и точная обработка документов, например для обработки счетов, форм на соответствие требованиям, научных отчётов и оцифровки рукописных архивов.
Технические улучшения включают устойчивую работу с низкокачественными сканами, плотными макетами и сложными рукописными аннотациями. По сравнению с ведущими корпоративными и «AI-native» OCR‑решениями Mistral OCR 3 обеспечивает более высокую точность при меньшем размере модели, что приводит к снижению эксплуатационных расходов.
Ранние пользователи применяют инструмент для масштабной оцифровки и извлечения информации, а отраслевые аналитики отмечают потенциал повышения ценности данных. Mistral AI продолжает расширять набор продуктов для решения практических задач обработки документов в бизнесе.
Mistral AI известна фокусом на продвинутых моделях для понимания языка и документов и стремится обеспечить бесшовную интеграцию своих решений в существующие корпоративные конвейеры и системы знаний.


Комментариев