Únase a boletines diarios y semanales para obtener las últimas actualizaciones y contenido exclusivo para cubrir la inteligencia artificial líder en la industria. Obtenga más información


Tienes un errorLa empresa europea de startups artificiales reveló el ascenso rápidamente, que reveló un nuevo modelo lingüístico hoy que afirma que coincida con el rendimiento de los modelos de tres veces con una reducción significativa en los costos informáticos, un desarrollo que puede remodelar las economías de inteligencia artificial avanzada.

El nuevo modelo se llama Pequeño mistra 3Tiene 24 mil millones de maestros y logra el 81 % con precisión en los estándares estándar con 150 símbolos por segundo. La empresa lo emite bajo clemencia Licencia Apache 2.0Permitir que las empresas modifiquen y difundirlo libremente.

«Creemos que es el mejor modelo entre todos los modelos con menos de 70 mil millones de maestros», dijo Guillaume Lample, un importante empleado científico de Mistral. «Nos aprecia un pie igual con Llama 3.3 70b meta, que se lanzó hace dos meses, que es un modelo de tres veces».

Este anuncio viene en el medio Auditoría intensiva Uno de los costos de desarrollar inteligencia artificial después del inicio chino, las demandas de DeepSeek han capacitado a un modelo competitivo Solo 5.6 millones de dólares – Las garantías que fueron limpiadas Casi 600 mil millones de dólares Desde el valor de mercado de Nvidia esta semana, los inversores se preguntaron sobre las enormes inversiones realizadas por los gigantes de la tecnología estadounidense.

Mistral Small 3 logra el rendimiento más similar mientras trabaja con un tiempo de transición mucho más bajo, según los estándares de la compañía. El modelo procesa un mensaje de texto casi un 30 % más rápido que el GPT-4O Mini con una precisión coincidente o superior. (Crédito: Mistral)

Cómo una startup francesa construyó un modelo internacional de amnistía que compite con una gran tecnología en una pequeña parte del tamaño

El enfoque Mistral se centra en la eficiencia en lugar del rango. La compañía logró sus ganancias de rendimiento principalmente a través de técnicas de entrenamiento mejoradas en lugar de arrojar más potencia informática en el problema.

«Lo que cambió es básicamente técnicas de mejora de entrenamiento», dijo Lampard a VentureBeat. «La forma en que entrenamos el modelo era un poco diferente, lo cual es una forma diferente de mejorarlo».

El modelo fue entrenado en 8 billones de símbolos, en comparación con 15 billones de modelos similares, según Landard. Esta eficiencia puede hacer las capacidades avanzadas de AI al alcance de las empresas relacionadas con los costos informáticos.

Vale la pena señalar Pequeño mistra 3 Se ha desarrollado sin refuerzo de aprendizaje o datos de capacitación artificial, y tecnologías que generalmente utilizan los competidores. Lample dijo que este enfoque «en bruto» ayuda a evitar la inclusión de sesgos no deseados que pueden ser difíciles de descubrir más adelante.

En las pruebas a través de la evaluación humana y las tareas de educación deportiva, Mistral Small 3 (Orange) funciona de manera competitiva contra modelos más grandes que Meta, Google y OpenAI, aunque hay menos parámetros. (Crédito: Mistral)

Privacidad y base: ¿Por qué las empresas esperan modelos más pequeños de inteligencia artificial?

El modelo en particular se dirige a instituciones que requieren una publicación local por los motivos de la privacidad y la confiabilidad, incluidos los servicios financieros, la atención médica y la fabricación. Se puede operar en una única unidad de procesamiento de gráficos y tratar con el 80-90 % de los casos de uso del modelo, según la compañía.

«Muchos de nuestros clientes quieren una solución interna porque les preocupa la privacidad y la confiabilidad», dijo Lambel. «No quieren servicios críticos que se basen en sistemas que no están completamente controlados».

Los residentes humanos clasificaron las pequeñas 3 resultados de Mistral 3 contra aquellos en modelos competidores. En tareas generales, los residentes prefirieron las respuestas de Mestal a Gemma-2 27B y QWEN-2.5 32B con grandes márgenes. (Crédito: Mistral)

El campeón de IA en Europa allana el camino para la dominación de código abierto, donde está agitando la suscripción pública

La versión es tan mala $ 6 mil millonesSe colocó como un campeón europeo en la carrera de inteligencia artificial global. La compañía recientemente tomó las inversiones de Microsoft mientras se estaba preparando para Suscripción pública al finalSegún el CEO Arthur Minche.

Los observadores de la industria dicen que la concentración de Mestral en modelos más pequeños y más eficientes puede demostrar que madura la industria de la inteligencia artificial. El enfoque contradice a empresas como Opadai y hombre Se centró en desarrollar modelos grandes y cada vez más caros.

«Es probable que veamos lo mismo que vimos en 2024, pero quizás más que esto, es básicamente muchos modelos de código abierto con licencias muy permitidas», predijo Lamples. «Creemos que es muy probable que este modelo condicional se convierta en una especie de mercancía».

Con la intensificación de la competencia y las ganancias de la eficiencia, la estrategia Mistral puede ayudar a mejorar los modelos más pequeños para lograr la democracia en alcanzar las capacidades avanzadas de inteligencia artificial, lo que puede acelerar la adopción a través de las industrias al tiempo que reduce los costos de infraestructura informática.

La compañía dice que emitirá modelos adicionales con capacidades de pensamiento mejoradas en las próximas semanas, lo que lleva a una prueba interesante sobre si su enfoque de eficiencia puede continuar coincidiendo con las capacidades de sistemas mucho más grandes.

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí