Únase a boletines diarios y semanales para obtener las últimas actualizaciones y contenido exclusivo para cubrir la inteligencia artificial líder en la industria. Obtenga más información


La IA financiada por francés está comenzando error Es el contenido de ir a su manera.

En un mar de modelos de pensamiento competidor, la compañía presentó Mal OCRY una nueva interfaz de programación de aplicaciones (OCR) está diseñada para proporcionar las posibilidades de comprender los documentos avanzados.

El contenido de API extrae el contenido, incluidas las notas escritas a mano, el texto escrito, las fotos, las tablas y las ecuaciones, de las imágenes de PDF no organizadas y las imágenes de alta precisión, y se presentan en coordinación organizada.

Los datos estructurales son información que se organiza de antemano con anticipación, las filas y columnas generalmente se usan, lo que facilita la búsqueda y analización. Los ejemplos comunes incluyen nombres, direcciones y transacciones financieras almacenadas en bases de datos o bases de datos.

Por el contrario, los datos no estructurados carecen de un formato o estructura específica, lo que dificulta el procesamiento y analización. Esta categoría incluye una amplia gama de tipos de datos, como correos electrónicos, redes sociales, videos, fotos y archivos de audio. Dado que los datos no estructurados no son cuidadosamente adecuados para bases de datos tradicionales, y las herramientas y tecnologías especializadas, como el procesamiento del lenguaje natural (PNL) y el aprendizaje automático (ML), a menudo se usan para extraer visiones significativas.

Comprender este tipo de datos es esencial para las empresas que buscan administrar los activos de información de manera efectiva.

Con soporte de lenguaje múltiple, velocidades de procesamiento rápidas e integración con grandes modelos de idiomas (LLM) para comprender los documentos, se coloca en Mistral OCR para ayudar a las organizaciones a preparar sus documentos.

Dado que, según Mistral Post Post, que anuncia la nueva interfaz de programación de aplicaciones, el 90 % de toda la información comercial no está organizada, la nueva interfaz de programación de aplicaciones debe ser una gran bendición para las instituciones que buscan numerar sus datos y clasificarlos para su uso en aplicaciones de inteligencia artificial o reglas de conocimiento internas/externas.

Mistral establece un nuevo estándar de oro para OCR

Mistral OCR tiene como objetivo mejorar la forma en que las instituciones procesan y analizan documentos complejos.

A diferencia de las soluciones OCR tradicionales que se centran principalmente en la extracción de texto, Mistral OCR está diseñado para explicar diferentes elementos y letras tipográficas, incluidas tablas, expresiones matemáticas e imágenes entrelazadas, mientras mantiene salidas estructuradas.

Según Mistral Guillaume Lample, esta tecnología es un paso importante para adoptar la inteligencia artificial más amplia en las instituciones, especialmente para las empresas que buscan simplificar el acceso a sus documentos internos.

La interfaz de programación de aplicaciones ya se ha combinado en el LE CAT, en el que millones de usuarios dependen para procesar documentos.

Ahora, los desarrolladores y empresas pueden acceder al modelo a través de La Platiforme, desarrollador de Mistral.

Se espera que la interfaz de programación de aplicaciones también esté disponible a través de socios e inferencia en la nube y proporcionará una publicación local de instituciones con altos requisitos de seguridad.

Progreso en la tecnología informática temprana (70 años)

La tecnología OCR jugó un papel importante en la automatización de la extracción de datos y los documentos durante décadas. La primera máquina comercial OCR fue desarrollada en los años cincuenta por David Shipbard y sus colegas Harvey y William Lux Junior, quienes establecieron la Smart Machinery Research Company (IMR) para proporcionar tecnología al mercado.

El sistema ganó tracción cuando Digest’s Digest se convirtió en su primer agente principal, seguido de bancos y compañías de telecomunicaciones como AT&T y las principales compañías petroleras.

En 1959, IBM autorizó patentes IMR y proporcionó la máquina de reconocimiento óptico en sus cartas, lo que indica el término como el estándar de la industria.

Desde entonces, la técnica de fotosíntesis en las letras ha seguido desarrollándose, ya que fusionó la IA y ML para mejorar la precisión y expandir el soporte del idioma y tratar con formatos de documentos Adobe Acrobat.

OCR Mistral representa el siguiente paso en este desarrollo, ya que mejora la Amnistía Internacional para mejorar la comprensión del documento más allá de identificar el texto simple.

Los criterios muestran el poder OCR incorrecto

Mistral destaca la ventaja de competir con OCR en las herramientas actuales, citando las pruebas estándar, ya que superó las alternativas importantes, incluidas Google Document AI, Azure OCR y el GPT-4O de Openai.

El modelo ha logrado la mayor precisión al identificar las matemáticas y los documentos escaneados y el procesamiento de textos de lenguaje múltiple.

Mistral OCR también está diseñado para funcionar más rápido que los modelos competidores y es capaz de procesar hasta 2000 páginas por minuto en un nudo.

Esta característica de velocidad lo hace adecuado para tratar documentos de gran tamaño en industrias como investigación, servicio al cliente y conservación histórica.

Sofia Yang, jefe de las relaciones de los desarrolladores en Mistral, fue Activamente Capacidades de OCR en su cuenta X. Vale la pena señalar, destacando los estándares de rendimiento más altos, el soporte de lenguaje múltiple y la capacidad de extraer ecuaciones matemáticas con precisión de los PDF.

en Trabajo modernoParticipó en un ejemplo de expresiones matemáticas complejas en expresiones matemáticas complejas y coordinándolas con éxito, lo que mejora su efectividad para aplicaciones científicas y académicas.

Las principales características y casos de uso

Mistral OCR ofrece muchas características que lo convierten en una herramienta de uso múltiple para empresas e instituciones que se ocupan de grandes almacenes de documentos:

  • Procesamiento de lenguaje múltiple: El modelo admite una amplia gama de idiomas, programas textuales y diseños de documentos, lo que lo hace útil para las instituciones internacionales. Yang enfatizó esta posibilidad, describiéndola como un cambio en el juego de documentos de lenguaje múltiple.
  • Salidas estructurales y la jerarquía del documento: A diferencia de los modelos básicos de conocimiento óptico, OCR Mistral mantiene elementos de coordinación como cabezas, vértebras, menús y tablas, y garantizar que el texto extraído sea más útil para aplicaciones estuaric.
  • El documento es como dirigir salidas estructuradasLos usuarios pueden extraer y coordinar contenido específico en salidas estructuradas, como JSON o Markdown, lo que permite la integración con otras tareas de flujo de trabajo que dependen de la IA.
  • Opción de autohostadoLas instituciones con estrictos requisitos de seguridad de datos y cumplimiento pueden propagar el OCR incorrecto dentro de su infraestructura.

Desarrollador de inteligencia artificial Documentos en línea También destaca las posibilidades de comprender documentos que exceden el OCR. Después de extraer el texto y la estructura, OCR Mistral se integra con LLMS, lo que permite a los usuarios interactuar con el contenido del documento utilizando consultas de lenguaje natural. Esta característica permite:

  • Responda preguntas a un contenido de documento específico;
  • Extracción de información y resumen automatizados;
  • Análisis comparativo a través de múltiples documentos;
  • Respuestas al contexto que analiza el documento completo.

¿Qué deben saber a los tomadores de decisiones en la institución sobre el error de OCR?

Para ejecutivos, gerentes de servicios, gerentes de CTO, gerentes de tecnología de la información y líderes de equipo, Mistral OCR ofrece grandes oportunidades de eficiencia, seguridad y la expansión del flujo de trabajo basado en documentos.

1. Aumentar la eficiencia y ahorrar costos

Al automatizar el procesamiento de documentos y la reducción de la entrada de datos manuales, OCR reduce los procesos administrativos y simplifica las operaciones. Las organizaciones pueden procesar grandes cantidades de documentos cada vez más rápido, lo que reduce la necesidad de intervención humana. Este es un valor especial para industrias como finanzas, salud y atención legal y cumplimiento, donde las anchas hojas son el cuello de botella.

2. Mejora de la toma de decisiones con visiones de IA

Las capacidades de comprensión de Mistral OCR permiten a los tomadores de decisiones extraer visiones implementables de informes, contratos, documentos financieros y trabajos de investigación. Los líderes de TI pueden integrar la interfaz de programación de aplicaciones en plataformas de inteligencia empresarial, lo que permite el análisis de documentos con la ayuda de IA que admite decisiones más rápidas que dependen de los datos.

3. Mejora de la seguridad y el cumplimiento de los datos

A través de la opción de publicación local, Mistral OCR satisface las necesidades de seguridad y cumplimiento de las instituciones que se ocupan de datos confidenciales o clasificados. Los Centros de Coordinación Genital y los empleados de cumplimiento pueden garantizar que la información de propiedad permanezca dentro de la infraestructura interna al tiempo que aprovecha la inteligencia artificial para procesar documentos.

4. Integración suave con el funcionamiento de la institución

Los CTO y los gerentes de tecnología de la información pueden integrar OCR Mistral con los sistemas de instituciones actuales, incluidas las plataformas de gestión de contenido, los programas de CRM, las soluciones de tecnología legal y los asistentes de inteligencia artificial. Las aplicaciones de la interfaz de programación de aplicaciones para salidas estructurales (JSON, Marmdown) hacen que sea fácil automatizar el flujo de trabajo basado en documentos, lo que mejora la productividad total.

5. Una ventaja competitiva a través de la innovación que se mueve por la inteligencia artificial

Para las instituciones que esperan mantenerse en la transformación digital, Mistral OCR ofrece una solución de desarrollo de inteligencia artificial para facilitar los almacenes documentales amplios. Al aprovechar la inteligencia artificial para extraer información, las instituciones pueden mejorar las experiencias del cliente, mejorar las reglas de conocimiento interno y reducir la ineficiencia operativa.

Precios y disponibilidad

El OCR Mistral tiene un precio de 1000 páginas por un dólar, con la inclusión de pagos que ofrecen 2000 páginas por un dólar.

La interfaz de programación de aplicaciones ahora está disponible en La PlateForme, Mistral planea expandir socios en la nube e inferencia en el futuro cercano. El modelo también es gratuito en la experiencia de Mistral GatoLa conversación de chatbot es compatible con LLMS, similar a ChatGpt de OpenAI, lo que permite a los usuarios probar sus habilidades antes de combinarlas en su flujo de trabajo. Mistral AI espera mejoras continuas en el modelo basados ​​en las notas del usuario en las próximas semanas.

Cuando probé por un corto tiempo en una breve nota escrita a mano (y caótica) en un trozo de papel, presenté una línea de texto delicada y organizada en menos de un segundo.

¿Qué sigue?

Con OCR Mistral, Mistral AI continúa expandiendo su ala de herramientas impulsadas por inteligencia artificial, dirigiendo instituciones que requieren soluciones de procesamiento de documentos de alto rendimiento.

Al integrar el OCR con la comprensión de los documentos que funcionan con materiales de inteligencia artificial, Mistral permite a las empresas extraer e interactuar con ellos de manera más inteligente.

Los líderes de las instituciones, desarrolladores y equipos de tecnología de la información pueden explorar OCR Mistral a través de La Platifife o la solicitud de publicación local de casos de uso especializados.

Los desarrolladores también pueden verificar Documentación de mala inteligencia artificial Para comenzar con Mistral-Ar-Latest.


Enlace de origen