Geek

OpenAI lanza el modelo ChatGPT o1: un salto en la inteligencia artificial

A pesar de estos desafíos, ChatGPT o1 tiene un gran potencial en el análisis de literatura científica y sugerencia de nuevas áreas

Carlos Ortiz

octubre 06, 2024 6:16 pm

La evolución de los chatbots de OpenAI ha alcanzado un nuevo hito con la introducción de ChatGPT o1, un modelo avanzado que promete revolucionar áreas como la ciencia, las matemáticas y la codificación. Este nuevo modelo, que se caracteriza por una mayor capacidad de razonamiento y procesamiento, ha mostrado un desempeño superior a versiones anteriores en pruebas estandarizadas y complejas.

ChatGPT o1 destaca por su habilidad para “pensar” de manera más profunda, lo que, aunque lo hace más lento, le permite resolver problemas complejos con mayor precisión.

Pruebas científicas

Según OpenAI, o1 es capaz de superar desafíos en áreas donde las respuestas correctas e incorrectas son claras, logrando un 78% en la prueba GPQA (Graduate-Level Google-Proof Q&A Benchmark), superando incluso a académicos con nivel de doctorado. En física, su rendimiento fue excepcional, alcanzando un 93%.

Meta lanza Movie Gen, un avanzado generador de videos y audios con IA

El científico de datos Kyle Kabasares, del Instituto de Investigación Ambiental del Área de la Bahía, destacó el potencial de o1 al utilizarlo para replicar un cálculo complejo sobre la masa de agujeros negros, tarea que al modelo le tomó solo una hora, mientras que a él le llevó meses.

En matemáticas, o1 fue probado en el examen de la Olimpiada Internacional de Matemáticas, obteniendo un 83% de aciertos, frente al 13% de su predecesor, GPT-4. Sin embargo, OpenAI reconoce que el modelo aún presenta fallas, como alucinaciones o la omisión de detalles importantes en tareas de seguridad física, lo que limita su uso en entornos de alto riesgo.

A pesar de estos desafíos, ChatGPT o1 tiene un gran potencial en el análisis de literatura científica y sugerencia de nuevas áreas de investigación. Actualmente, las versiones o1-preview y o1-mini están disponibles para usuarios de pago y desarrolladores en fase de prueba.

Este avance coloca a OpenAI a la vanguardia de la inteligencia artificial, marcando un nuevo estándar en el desarrollo de modelos avanzados.