Open AI presenta su modelo o3
Evolución del número de parámetros usados para entrenar a los diferentes modelos de IA
1. OpenAI: Pioneros de la inteligencia artificial
Fundada en 2015 por un grupo de visionarios liderados por Sam
Altman y Elon Musk, OpenAI tiene su sede en San Francisco,
California. La compañía comenzó con la misión de garantizar que
la inteligencia artificial avanzada beneficie a toda la humanidad.
Hoy, cuenta con más de 1,000 empleados, incluidos algunos de los
investigadores y desarrolladores más destacados del mundo en el
campo de la IA.
En términos financieros, OpenAI ha demostrado ser una entidad
clave en el sector tecnológico. Aunque inicialmente fue una
organización sin fines de lucro, ahora opera como una empresa con
fines de lucro "limitados" bajo el modelo OpenAI LP. En
2023, reportó ingresos de más de 1,000 millones de dólares,
impulsados por sus colaboraciones con Microsoft y la popularidad de
sus herramientas como ChatGPT. Su impacto social se refleja también
en la cantidad de proyectos abiertos y su compromiso con la
transparencia en el desarrollo de IA segura y alineada.
2. ¿Qué es un LLM?
La inteligencia artificial de OpenAI, como la de otras empresas que están generando una verdadera revolución tecnológica en la última década, se fundamenta entre otros componentes, en los Modelos
de Lenguaje de Gran Escala (LLMs, por sus siglas en inglés). Estos
sistemas son el núcleo de herramientas como ChatGPT, que han
redefinido cómo las personas interactúan con la tecnología.
Gracias a los LLM, OpenAI ha podido desarrollar modelos capaces de
entender y generar texto con una precisión y naturalidad
sorprendentes.
Un Modelo de Lenguaje de Gran Escala (LLM) es un sistema entrenado
para entender y generar texto. Utilizando miles de millones de
parámetros y grandes conjuntos de datos, los LLM son capaces de
responder preguntas, crear historias y analizar información con
niveles impresionantes de precisión. ChatGPT, uno de los productos
estrella de OpenAI, utiliza un LLM para mantener conversaciones y
ayudar en tareas como escritura creativa o soporte técnico.
Además de los modelos de OpenAI, otras empresas han desarrollado
Modelos de Lenguaje de Gran Escala que destacan en el ámbito de la
inteligencia artificial. Entre ellos se encuentran LLaMA de Meta,
conocido por su enfoque eficiente en términos de parámetros y
recursos computacionales; Claude de Anthropic, diseñado con un
énfasis especial en la seguridad y alineación de la IA; y Gemini de
Google, un modelo avanzado que integra capacidades multitarea y
razonamiento lógico, lo que lo posiciona como un competidor directo
de O3 en ciertas aplicaciones.
3. La evolución de los modelos de OpenAI
Desde sus inicios, OpenAI ha desarrollado una serie de modelos que
han marcado hitos en el ámbito de la inteligencia artificial. Una
breve cronología nos ayuda a entender cómo ha evolucionado su
tecnología:
GPT-1 (2018): El
primer modelo de la serie, que ya demostraba capacidades
sorprendentes para generar texto coherente. Contaba con 117 millones
de parámetros.
GPT-2 (2019):
Amplió significativamente sus capacidades con 1,500 millones de
parámetros. Este modelo generó controversia por su potencial para
crear contenido falso con gran realismo, lo que llevó a OpenAI a
limitar inicialmente su distribución.
GPT-3 (2020): Una
revolución con 175,000 millones de parámetros, permitiendo
aplicaciones como ChatGPT. Este modelo estableció un estándar en
la generación de texto y marcó el inicio de la adopción masiva de
los LLM.
GPT-4 (2023): Con
1 billón de parámetros, este modelo amplió significativamente la
capacidad para comprender y generar texto complejo, introduciendo
mejoras en razonamiento y comprensión contextual. Introdujo mejoras
significativas en razonamiento y comprensión contextual, aunque sus
detalles técnicos completos permanecen menos divulgados.
GPT-4-turbo (2024): Una versión optimizada del
GPT-4 que combinó mayor eficiencia con una reducción de los costos
computacionales, haciendo accesible un rendimiento avanzado a un
público más amplio.
O1 (2024, segundo
semestre): Representó un hito importante en la evolución
hacia modelos más conscientes de su rendimiento. Este modelo
introdujo la capacidad de "auto-verificación", evaluando
y depurando sus propias respuestas para mejorar la precisión.
GPT-4-turbo (2024): Una versión optimizada del
GPT-4 que combinó mayor eficiencia con una reducción de los costos
computacionales, haciendo accesible un rendimiento avanzado a un
público más amplio.
O3 (2024): El último avance, enfocado en el
razonamiento lógico paso a paso y la resolución de problemas
complejos, abriendo nuevas posibilidades en tareas que antes eran
exclusivas de los humanos.
La capacidad de auto-verificación, introducida en O1, marcó un
cambio notable, ya que permitió que los modelos revisaran y
ajustaran sus respuestas de manera autónoma, minimizando errores y
maximizando la fiabilidad en tareas complejas. Esto sentó las bases
para los avances que vemos reflejados en O3.
Con cada generación, los modelos de OpenAI han incrementado su
capacidad no solo en términos de parámetros, sino también en su
habilidad para realizar tareas cada vez más complejas, acercándose
más a una interacción verdaderamente humana.
4. O3: Un cambio de paradigma
Cuando aún estábamos asimilando las virtudes de la nueva familia de modelos o1 (los últimos disponibles a día de hoy), que presentó hace solo un par de meses OpenAI, se ha hecho público el anuncio de o3, que a pesar de estar sustentado por principios tecnológicos smilares; supone una transformación más que relevante.
Lo que hace único a O3 es su capacidad para razonar paso a paso y
resolver problemas complejos que antes estaban fuera del alcance de
los modelos de IA. Por ejemplo, tareas como resolver problemas
avanzados de matemáticas simbólicas, que requieren múltiples pasos
lógicos y verificaciones intermedias, eran casi imposibles para los
modelos anteriores. O3 puede descomponer estas tareas en pasos
individuales, verificar cada uno de ellos y ajustarse en tiempo real
si detecta inconsistencias.
Esto supone un avance significativo, ya que permite que los
modelos de IA aborden desafíos que antes dependían exclusivamente
de la intervención humana. Esta capacidad no solo amplía el rango
de aplicaciones posibles, desde la educación avanzada hasta la
investigación científica, sino que también mejora la confianza en
el uso de estos sistemas en entornos críticos.
Veamos algunas diferencias entre o1 y o3 porque son ciertamente más relevantes de lo que podría parecer a primera vista.
Comparación modelo o1 y o3
Introdujo la capacidad de
auto-verificación, un avance clave que permitía al modelo
revisar y corregir sus propias respuestas en tiempo real.
Este sistema mejoró la precisión
en tareas como generación de texto y resolución de problemas
básicos al identificar incoherencias.
Sin embargo, O1 estaba limitado en su capacidad para abordar
tareas que requerían razonamientos más complejos y extensos.
Lleva la auto-verificación a un
nivel más avanzado, descomponiendo problemas complejos
en pasos más pequeños, verificando cada uno de ellos y ajustándose
en caso de inconsistencias.
Permite trabajar en dominios más
desafiantes, como problemas matemáticos simbólicos avanzados,
donde múltiples pasos interdependientes son necesarios.
Introduce mejoras en alineación
con la seguridad y valores humanos, reduciendo
significativamente los riesgos asociados a respuestas no éticas o
problemáticas.
Su capacidad para manejar tareas de razonamiento paso a paso
marca un cambio de paradigma en comparación con O1, que era más
limitado en este aspecto.
5. Métricas impresionantes...sobre el papel
O3 ha superado a sus predecesores y a otros modelos en pruebas
exigentes. Por ejemplo, obtuvo un 96,7% en el American Invitational
Mathematics Exam de 2024 y resolvió el 25,2% de los problemas del
benchmark Frontier Math de EpochAI, donde otros modelos apenas
alcanzaron el 2%.
Adicionalmente, O3 destacó en el benchmark GPQA Diamond con una
puntuación del 87,7%, enfrentándose a preguntas complejas de nivel
experto en física, biología y química. En el MATHQA, que evalúa
la capacidad de resolución de problemas matemáticos en múltiples
pasos, logró una precisión del 94%, demostrando su habilidad para
descomponer problemas complejos en pasos manejables y coherentes.
Estas métricas evalúan diferentes aspectos de las capacidades
del modelo:
American Invitational
Mathematics Exam (AIME): Mide la capacidad del modelo para
resolver problemas matemáticos de alta dificultad que requieren
razonamiento lógico avanzado.
Frontier Math:
Evalúa la capacidad de la IA para abordar problemas matemáticos
abiertos y de frontera, desafiando incluso a humanos expertos.
GPQA Diamond:
Examina el conocimiento general en disciplinas científicas
avanzadas y su capacidad de aplicarlo.
MATHQA: Prueba la habilidad de
descomposición lógica y ejecución paso a paso en matemáticas
complejas.
Estas cifras no solo subrayan la potencia de O3, sino que también
muestran cómo redefine los estándares de rendimiento en
inteligencia artificial. Además, su capacidad de razonamiento y
procesamiento lógico representa un paso crucial hacia la evolución
de sistemas más avanzados que podrían sentar las bases para el
desarrollo de la AGI, un objetivo largamente perseguido en el ámbito
de la inteligencia artificial.
6. ¿Qué es la AGI?
La Inteligencia Artificial de propósito general (AGI, por sus siglas en inglés),
es un concepto que describe una IA capaz de realizar cualquier tarea
intelectual que un ser humano pueda llevar a cabo. A diferencia de
los sistemas actuales, que son especializados, una AGI podría
aprender y adaptarse de manera generalizada, marcando un cambio
fundamental en la relación entre los humanos y la tecnología.
Un dominio de conocimiento se refiere a un área específica de
habilidades o información, como matemáticas, química, lenguaje
natural o programación. En el contexto de la inteligencia
artificial, los dominios de conocimiento son fundamentales porque
determinan las capacidades y limitaciones de los modelos actuales.
Los sistemas como O3 están diseñados para destacar en tareas dentro
de ciertos dominios, mientras que una AGI tendría la capacidad de
cruzar y combinar diferentes dominios sin necesidad de entrenamiento
adicional, lo que ampliaría significativamente sus aplicaciones y su
impacto potencial.
Por ejemplo, mientras que un modelo como O3 puede resolver
problemas matemáticos avanzados o generar texto convincente, una AGI
sería capaz de combinar ese conocimiento con habilidades
completamente diferentes, como diseñar un experimento científico
desde cero, enseñar una nueva disciplina académica o incluso
coordinar misiones espaciales. Además, una AGI tendría la capacidad
de transferir aprendizaje entre dominios muy distintos, algo que las
IA actuales no pueden hacer.
Este nivel de flexibilidad y entendimiento humano-similar todavía
está fuera del alcance de los modelos actuales. Aunque O3 representa
un gran avance hacia la AGI, aún estamos en una etapa en la que los
sistemas de IA requieren entrenamiento y programación específicos
para cada tarea.
7. O3: Rumbo hacia la AGI
Aunque O3 no es una AGI, representa un paso significativo hacia su
desarrollo. Su capacidad para razonar, alinearse con principios de
seguridad y aprender de manera eficiente lo posicionan como una de
las piezas clave en este camino. Al resolver problemas complejos y
mostrar una comprensión más profunda, O3 pone en evidencia que la
AGI no es una utopía, sino una meta alcanzable con avances
constantes.
¿Significa eso que ya estén aquí las "máquinas conscientes" o que se haya alcanzado una verdadera AGI?. Obviamente la respuesta es un contundente NO, sin embargo este tipo de avances guiados por cambios en la forma en la que los sistemas de IA están "aprendiendo" a evaluar las partes clave de cualquier problema, a tratarlos de forma organizada y su capacidad de establecer paralelismos con otras situaciones conceptualmente similares, abren la puerta al razonamiento inductivo o lo que es lo mismo, a la capacidad de realizar suposiciones que siguen secuencias que para nosotros de forma intuitiva resultan "lógicas". Esta sin duda, es un de esas cualidades que identificamos de forma instintiva como... muy humanas.
8. Estado actual de O3
A pesar de sus impresionantes capacidades, O3 todavía no está
disponible para su uso generalizado. Actualmente, el modelo se
encuentra en fase de revisión y pruebas internas, en las que
participan colaboradores estratégicos y organizaciones académicas.
Estas evaluaciones no solo buscan optimizar el rendimiento técnico
del modelo, sino también garantizar su seguridad y alineación
ética, aspectos fundamentales en la implementación de sistemas de
IA avanzados.
OpenAI ha establecido un marco de colaboración restringido para
permitir que ciertos investigadores y socios prueben O3 en entornos
controlados, aportando retroalimentación clave que determinará el
futuro del modelo. Este proceso es esencial para abordar cualquier
posible riesgo asociado a sus capacidades avanzadas antes de su
despliegue público.
Este aspecto, el de la seguridad, es una de las múltiples aristas que el panorama de la evolución de las IAs está revelando como críticas en cuanto al futuro desarrollo de servicios y tecnologías que hacen uso de las capacidades de este tipo de modelos. En este sentido, asegurar que son confiables, que no sufren "alucinaciones" y que son capaces de alinearse con el propósito en el que se están aplicando (sanidad, transporte, educación, etc) se está convirtiendo cada vez más en un área específica de trabajo dentro del mundo de las IAs
Conclusión: Lejos de la visión fantasiosa con la que a menudo se nos presenta el mundo de la inteligencia artificial, el lanzamiento de O3 no
solo reafirma a OpenAI en su posición como una de las empresas líderes en
inteligencia artificial donde otros actores como Google con su flamante modelo Gemini 2, Meta con LLaMa, Anthropic con su nuevo Sonet y la inminente irrupción en escena de Amazon; están realizando avances muy significativos; sino que también abre nuevas puertas hacia
un futuro en el que la tecnología y la inteligencia humana puedan
complementarse de manera única abirendo puertas hacia la extensión
del conocimiento humano que hasta ahora permanecen vetadas por
limitaciones inherentes a las propias limitaciones físicas de la
mente humana y al estado embrionario de las tecnologías de inteligencia artificial. La carrera hacia la AGI está en marcha, y O3 es un
recordatorio de cuán cerca estamos de redefinir los límites de lo
posible, así como de la necesidad de que la sociedad en su conjunto reaccione ante la profunda transformación, más allá de lo imaginable; que estamos a punto de presenciar.
Comparte la noticia
Categorías de la noticia