OpenAI ha dado un gran paso en el campo de la inteligencia artificial con el lanzamiento de un nuevo modelo conocido como OpenAI o1, también conocido como ‘Strawberry’. Este modelo representa un cambio de enfoque en el desarrollo de la IA, enfatizando que el tamaño no es el único factor determinante para el avance de esta tecnología.
El año pasado, OpenAI presentó GPT-4, un modelo que amplió significativamente el tamaño de sus redes neuronales. Sin embargo, la llegada de OpenAI o1 indica una evolución en las habilidades de razonamiento lógico. A diferencia de otros modelos, que tienden a generar respuestas de inmediato, o1 puede razonar y pensar en voz alta, de manera similar a como lo haría un humano, antes de llegar a una conclusión.
Mira Murati, directora de tecnología de OpenAI, explica que este modelo no pretende sustituir al GPT-4, sino complementarlo. Actualmente, la compañía está trabajando en GPT-5, que será significativamente más grande que su predecesor. Murati aclara que hay dos paradigmas en juego: el de la escala y este nuevo enfoque del razonamiento, y la idea es integrarlos.
Los modelos de lenguaje, como LLM (Large Language Models), operan a partir de redes neuronales masivas entrenadas con cantidades masivas de datos. Aunque son expertos en tareas lingüísticas y lógicas, a menudo enfrentan dificultades con problemas aparentemente simples, como operaciones matemáticas básicas. OpenAI o1 utiliza el aprendizaje por refuerzo para mejorar sus habilidades de razonamiento, brindando retroalimentación positiva o negativa según la precisión de sus respuestas. Este tipo de aprendizaje ha demostrado ser eficaz en aplicaciones como el diseño de chips y la creación de chatbots más avanzados.
Mark Chen, vicepresidente de investigación de OpenAI, demostró el potencial de o1 al resolver problemas complejos que GPT-4 no podía resolver, incluidas preguntas de química y acertijos matemáticos complejos. Chen enfatiza que el nuevo modelo aprende a razonar de forma autónoma, en lugar de simplemente imitar el pensamiento humano, como lo hacen los modelos anteriores.
En términos de rendimiento, OpenAI o1 ha demostrado ser superior en varias áreas como codificación, matemáticas, física, biología y química. Por ejemplo, en un examen de matemáticas para estudiantes, GPT-4 resolvió el 12% de los problemas, mientras que o1 logró un impresionante 83%.
Sin embargo, el nuevo modelo también tiene desventajas. Es más lento que GPT-4 y no puede realizar búsquedas web, lo que limita sus capacidades para determinadas tareas. Mejorar el razonamiento en los LLM es un tema de creciente interés en la investigación, y competidores como Google están explorando enfoques similares.
OpenAI cree que su nuevo modelo puede contribuir a un comportamiento más seguro y acorde con las normas sociales. Murati señala que al razonar sobre las consecuencias de sus acciones, o1 puede evitar causar resultados dañinos, lo que podría conducir a una IA menos peligrosa.
Expertos en inteligencia artificial como Oren Etzioni destacan la importancia de entrenar modelos para resolver problemas complejos y utilizar las herramientas adecuadas. A pesar de los avances, persisten desafíos como las “alucinaciones” y la veracidad de la información generada.
Chen concluye que el enfoque de razonamiento no sólo es emocionante, sino que también promete hacer que la IA sea más accesible y asequible, en línea con la misión de OpenAI de democratizar el acceso a la IA.
https://sympozion.com/ – Últimas notícias