Únase a boletines diarios y semanales para obtener las últimas actualizaciones y contenido exclusivo para cubrir la inteligencia artificial líder en la industria. Obtenga más información


Un equipo de investigadores en Ampliación de comunicación Una técnica de hackers puede reducir significativamente el costo y los recursos matemáticos necesarios para los sistemas de inteligencia artificial para abordar problemas de pensamiento complejos, lo que transforma cómo se publican ampliamente las instituciones de IA.

Se llama al método Cadena de draft (COD), los modelos LLMS permiten problemas con palabras mínimas, utilizando menos del 7.6 % del texto requerido en los métodos actuales mientras mantienen la precisión o incluso mejoranlas. Los resultados se publicaron en el artículo la semana pasada en el almacén de investigación de Arxiv.

«Al reducir el verbo y centrarse en ideas críticas, el COD corresponde o excede a la cuna (la cadena de ideas) en precisión con solo el 7.6 % de los símbolos, lo que reduce en gran medida los costos y el comino a través de diferentes tareas de pensamiento», los autores, liderados por Silei Xu, escribieron, investigador en Zoom.

La cadena roja conserva o excede la precisión de la cadena de emoción (amarilla) con el uso de símbolos significativamente menos menos a través de cuatro tareas de pensamiento, lo que indica cómo piensa la inteligencia artificial sin sacrificar el rendimiento. (Crédito: arxiv.org)

Cómo «menos es más» convierte el pensamiento de la inteligencia artificial sin sacrificar la precisión

COD se inspira en cómo los humanos resuelven problemas complejos. En lugar de expresar todos los detalles cuando se trabaja en un problema en matemáticas o un rompecabezas lógico, solo las personas generalmente incluyen información básica en una forma breve.

«Al resolver tareas complejas, ya sea problemas matemáticos, formulación de artículos o codificación, a menudo escribimos las partes importantes de la información que nos ayuda a progresar», explican los investigadores. «Al simular este comportamiento, los LLM pueden centrarse en progresar hacia soluciones sin los gastos generales de pensamiento prolongado».

El equipo probó su enfoque de muchos criterios, incluido el pensamiento aritmético (GSM8K), Lógica lógica (comprensión de la historia, comprensión del deporte) y el pensamiento simbólico (tareas de cara moneda).

En un ejemplo sorprendente para mirar Claude 3.5 Sonata Preguntas deportivas relacionadas, enfoque de COD desde la salida promedio de 189.4 icono de símbolos a solo 14.3 símbolos reducido del 92.4 %, con un tiempo mejorado a la vez de 93.2 %a 97.3 %.

Los costos reductores de IA para las instituciones: el estado del trabajo para la lógica, el dispositivo breve

«Para el procesamiento de instituciones, un millón de consultas por mes, COD puede reducir los costos de $ 3800 (cot) a $ 760, ahorrando más de $ 3,000 por mes». Ajith Valth Brabhakar Está escrito en el análisis en papel.

La búsqueda llega en un momento crítico para publicar AI Enterprise. Con las empresas que integran cada vez más los sistemas avanzados de inteligencia artificial en sus operaciones, los costos matemáticos y los tiempos de respuesta aparecieron como grandes barreras para la adopción a gran escala.

Técnicas de pensamiento moderna como (cama,, que se presentaron en 2022, mejoraron en gran medida la capacidad de la inteligencia artificial para resolver problemas complejos dividiéndolos en un pensamiento de paso por paso. Pero este enfoque genera largas explicaciones que consumen recursos matemáticos significativos y aumentan el tiempo de respuesta.

«La naturaleza prolongada de la COT captura conduce a grandes gastos matemáticos generales, aumento de comino y mayores gastos operativos», escribe Brabhakar.

Que hace Bacalao Para las instituciones, es su simplicidad para la implementación. A diferencia de muchos desarrollos de inteligencia artificial que requieren volver a entrenar modelos costosos o cambios arquitectónicos, el COD se puede implementar inmediatamente con los modelos actuales modificando un enrutador simple.

«Las instituciones que ya se usan Cot pueden cambiar a COD con una modificación simple del enrutador», explica Prabhakar.

Esta tecnología puede tener un valor especial para aplicaciones confidenciales para el progreso, como la atención al cliente en tiempo real, IA para un teléfono móvil, herramientas educativas y servicios financieros, donde los pequeños retrasos pueden afectar significativamente la experiencia del usuario.

Los expertos de la industria sugieren que sus efectos excedan los ahorros de costos. Al hacer que el pensamiento avanzado en la inteligencia artificial sea más fácil y asequible, el COD puede debilitar el acceso a capacidades avanzadas de inteligencia artificial para instituciones más pequeñas y entornos de recursos.

Con el desarrollo continuo de los sistemas de inteligencia artificial, las técnicas como COD están destacando la creciente concentración de eficiencia junto con la capacidad bruta. Para las instituciones que se mueven en el paisaje que cambian rápidamente, estas mejoras pueden ser valiosas como mejoras en los mismos modelos básicos.

«Con el desarrollo continuo de modelos de inteligencia artificial, mejorar la eficiencia del pensamiento será muy importante como mejorar sus capacidades en bruto».

Se realizó el código de búsqueda y datos Disponible para el público En GitHub, permita a las instituciones implementar y probar el enfoque con sus sistemas de inteligencia artificial.


Enlace de origen