El modelo ACRE-AI-AI-4.5B abre en nuevas instituciones que se centran en las instituciones.

¿Quieres visiones más inteligentes de tu bandeja de entrada? Suscríbase a nuestros boletines semanales para obtener lo que se refiere solo a la IA de las instituciones, los líderes de datos y seguridad. Suscríbete ahora


Arcee.aiEs una empresa emergente que se centra en desarrollar pequeños modelos de inteligencia artificial para uso comercial e instituciones, es Franqueza Su formulario AFM-4.5B para uso gratuito por parte de pequeñas empresas publicadas Pesas Y permiten instituciones que alcancen menos de $ 1.75 millones en ingresos anuales para usar sin tarifas bajo un Licencia de acrees personalizada.«

El modelo de parámetros de 4,5 mil millones de parámetros, que fue diseñado para usar instituciones en el mundo real, está diseñado mucho más pequeño que decenas de miles de millones para billones de modelos fronterizos pioneros entre rentabilidad, cumplimiento organizacional y un rendimiento fuerte en una huella digital comprimida.

AFM-4.5B fue Una de las dos dos partes emitidas por Acre el mes pasadoY ya está «instrucciones atrapadas», o modelo de «instrucciones», diseñado para chatear, recuperar y escribir creación y puede publicarse de inmediato para estos casos de uso en instituciones. Otro modelo básico también se ha lanzado en un momento en que no se ha incautado en las instrucciones, solo pre -entrenada, lo que permite más personalización por parte de los clientes. Sin embargo, ambos solo estaban disponibles a través de los términos de licencias comerciales, hasta ahora.

Acree (CTO) También tenga en cuenta Después de x Esto es mas «Modelos dedicados a pensar y usar herramientas en la carretera».


La serie AI Impact regresa a San Francisco – 5 de agosto

La siguiente etapa de inteligencia artificial aquí: ¿estás listo? Únase a los líderes de Block, GSK y SAP para analizar exclusivos sobre cómo reiniciar a los agentes independientes de las tareas de flujo de trabajo de la Fundación, desde las decisiones en un momento real para la automatización integral.

Asegurar su lugar ahora: el espacio es limitado: https://bit.ly/3gulf


«El edificio AFM-4.5B fue un gran esfuerzo, y estamos muy agradecidos con todos los que nos apoyaron, no pueden esperar para saber lo que está construyendo», es Escribió en otra publicación. «Acabamos de comenzar. Si tiene notas o ideas, no dude en comunicarse en ningún momento».

El modelo ahora está disponible para su publicación a través de una variedad de entornos, desde la nube hasta los teléfonos inteligentes y los dispositivos.

También está dirigido a la creciente lista de acres de instituciones, necesidades y deseos, específicamente, un modelo que ha sido capacitado sin violar la propiedad intelectual.

como Acre escribió en el primer anuncio AFM-4.5B el mes pasado«Se ha hecho un gran esfuerzo para excluir los libros protegidos por derechos de autor y materiales con una licencia poco clara».

ACRE señala que ha trabajado con la compañía de regulación de datos de terceros Datologíai Para aplicar técnicas, como una fuente de mezcla, basada integral, control de calidad y todos los objetivos para reducir las alucinaciones y los riesgos de IP.

Centrarse en las necesidades de los clientes de la institución

AFM -4.5B es una respuesta de Arcee.ai cuando ve los principales puntos débiles en la adopción de instituciones de la inteligencia improvisada: alto costo, asignación limitada y preocupaciones organizativas sobre los grandes modelos de idiomas reales (LLM).

Durante el año pasado, el equipo de Arcee realizó discusiones con más de 150 organizaciones, desde nuevas empresas hasta compañías Fortune 100, para comprender las restricciones actuales de LLMS y establecer sus objetivos típicos.

Según la compañía, muchas empresas LLMS predominantes, como las de OpenAi, antrópica o de profundidad, costosas y difíciles de personalizar las necesidades de la industria. Mientras tanto, mientras que los modelos son más pequeños que el peso abierto como Llama, Mistral y Qwen han proporcionado más flexibilidad, temores sobre la licencia, la fuente de IP y los riesgos geopolíticos.

AFM-4.5B se ha desarrollado como una alternativa de «no comercio»: personalizable, compatible y costoso efectivo sin sacrificar la calidad de la forma o la capacidad de usar.

AFM-4.5B está diseñado con la elasticidad de la publicación en mente. Puede funcionar en entornos de nubes, locales, híbridos o incluso de borde, gracias a su eficiencia y compatibilidad con marcos de trabajo abiertos, como la desactivación de transformadores faciales, llama.cpp y (versión suspendida) VLLM.

El formulario admite formatos cuánticos, lo que le permite operar en unidades de procesamiento de gráficos más bajos o incluso unidades de procesamiento central, lo que lo hace práctico para aplicaciones con recursos restringidos.

La visión de la compañía asegura apoyo

La estrategia más amplia de Arcee.ai se centra en construir modelos de lenguaje pequeños y adaptables Muchos casos se utilizan dentro de la misma organización.

«No necesita ser en gran medida en uso comercial», dijo el CEO Mark McCadad en una entrevista en el proyecto VentureBeat el año pasado. La compañía enfatiza la rápida repetición y la personalización típica como la esencia de su exhibición.

Esta visión recibió el apoyo del inversor con la serie A de 24 millones de la Serie A de 24 millones en 2024.

Dentro del proceso de arquitectura y capacitación en AFM-4.5B

El AFM-4.5B es utilizado por la estructura del transformador del decodificador solo con muchas mejoras en el rendimiento y la elasticidad de la publicación.

Incluye un interés ensamblado para investigar para inferir más rápido y activar el Relu² en lugar de Swiglu para apoyar el contraste sin insultar la precisión.

El entrenamiento sigue un enfoque de tres etapas:

  • Premium Pre -Symbols 6.5 billones de datos generales
  • La capacitación sobre 1.5 billones de símbolo se centra en las matemáticas y el símbolo
  • Ajuste de las instrucciones utilizando grupos de datos de alta calidad, seguimiento de instrucciones y aprendizaje para reforzar con comentarios de verificación y preferencia

Para cumplir con los estrictos criterios de cumplimiento y los estándares de propiedad intelectual, el modelo ha sido capacitado en aproximadamente 7 billones de datos de datos organizados por seguridad de la seguridad de higiene y licencia.

Un modelo competitivo, pero no un líder

A pesar de su tamaño más pequeño, AFM-4.5B funciona de manera competitiva a través de una amplia gama de estándares. La versión promedio establecida en las instrucciones es de 50.13 a través de las alas de evaluación como MMLU, Mixeval, Triviaqa, Agival, que sobresale en modelos similares como Gemma-3 4B-IT, QWEN3-4B y SmallM3-3b.

La prueba de lenguaje múltiple muestra que el modelo ofrece un fuerte rendimiento en más de 10 idiomas, incluidos árabe, mandarín, alemán y portugués.

Según ARCEE, agregar soporte de dialectos adicionales es claro y directo debido a su estructura normativa.

AFM-4.5B también mostró un frasco temprano fuerte en los entornos de evaluación general. En la placa de primer plano de la parte superior a través de las voces del usuario y la tasa de victoria, el modelo es en general, ya que solo se encuentra detrás de Claude Obus 4 y Gemini 2.5 Pro.

Se caracteriza por una tasa de victoria del 59.2 % y el tiempo más rápido en cualquier modelo más alto a 0.2 segundos, asociado con una velocidad de generación de 179 símbolos por segundo.

Apoyo claro para los agentes

Además de las capacidades generales, AFM-4.5B viene con soporte compacto para conectarse a trabajos y pensar en el agente.

estos Las características tienen como objetivo simplificar el proceso de construcción de agentes y herramientas de inteligencia artificial para automatizar el flujo de trabajoReducción de la necesidad de ingeniería compleja o capas de coincidencia.

Esta función corresponde a la estrategia de Arcee más amplia para permitir a las empresas construir modelos de producción personalizados más rápido, con una disminución en el costo de propiedad (TCO) y la integración más fácil en las operaciones comerciales.

¿Cuál es el siguiente para acre?

AFM-4.5B representa Arcee.ai lote para determinar una nueva categoría de modelos de idiomas listos para instituciones: pequeño, rendimiento y totalmente personalizado, Sin asentamientos que a menudo vienen con Royal LLMS o SLMS abiertos.

Con estándares competitivos, soporte de lenguaje múltiple, sólidos estándares de cumplimiento y opciones de publicación flexibles, el modelo tiene como objetivo satisfacer las necesidades de velocidad, soberanía y escala de la institución.

Si Arcee puede publicar siempre en la escena de la inteligencia artificial cambiante dependiendo rápidamente de su capacidad para cumplir esta promesa. Pero con AFM-4.5B, la compañía dio un primer paso seguro.


Enlace de origen

Publicaciones relacionadas

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Botón volver arriba