Google ha anunciado el lanzamiento de Gemini 2.5, un modelo de razonamiento de IA que Google describe como la nueva generación de «modelos pensantes», los que analizan recursivamente sus respuestas antes de proporcionar el resultado final.
La batalla por la IA se intensifica por momentos y no hay semana que no tengamos modelos nuevos que superen en capacidad a los anteriores. Solo han pasado dos meses desde que Google lanzó el Gemini 2.0 y ya tenemos nueva versión que debe competir con los modelos de OpenAI, Meta o el mismo DeepSeek R1 que puso sobre aviso a las empresas estadounidenses de IA de lo que se está cociendo en China, como ejemplo de modelo de razonamiento gratuito, de código abierto y más eficientes que los occidentales.
Gemini 2.5, avances
Lo más relevante de esta versión es que se trata del primer modelo completo de «cadena de pensamiento» de Google. Hablando en cristiano, este tipo de modelos realizan un razonamiento multipaso y verifican la precisión de sus respuestas antes de generarlas. Puede ser que tarde algo más en responder, pero las respuestas serán más precisas y tendrá menos alucinaciones. Este fenómeno se produce cuando un modelo o chatbot de IA generativa percibe patrones u objetos inexistentes o imperceptibles para los humanos, creando respuestas que no tienen sentido o son completamente inexactos. Esta cuestión sigue siendo un gran problema a resolver, incluso con el avance de los modelos de lenguaje de gran tamaño.
Otra ventaja de Gemini 2.5 sobre la competencia, que ya hemos visto en modelos de IA de Google anteriores, es su alta tasa de tokens o la capacidad de comprender o producir conjuntos de datos complejos. Google siempre ha promocionado Gemini como la IA capaz de gestionar grandes ventanas de contexto con una alta tasa de tokens y la nueva versión avanza aún más.
Google asegura que la nueva versión de Gemini tiene un rendimiento notable en aplicaciones como la generación de aplicaciones web, código agéntico (código diseñado para realizar tareas de forma autónoma), transformación y edición de código. La compañía asegura que el modelo es capaz de generar código ejecutable para un videojuego a partir de una sola línea de comandos y como demostración, ha publicado un vídeo que muestra a Gemini 2.5 creando un sencillo videojuego de carrera infinita en segundos.
En las primera pruebas realizadas con el test de referencia LMArena, Gemini 2.5 (versión Pro que es la que se ha publicado) lidera la puntuación en razonamiento, ciencias, matemáticas y codificación agencial, aunque en otros test sintéticos como LiveCodeBench v5, el o3-mini de OpenAI sigue liderando. Si hablamos de modelos «sin razonamiento», el nuevo DeepSeek V3 supera a las soluciones de OpenAI, Grok y Google. La batalla por la IA sigue en todo lo alto y a este ritmo de lanzamientos las puntuaciones irán variando.
Gemini 2.5 versión ‘Pro’ ya está disponible en fase experimental para los suscriptores del programa ‘Advanced’. Se espera que Google lance pronto un modelo más pequeño y gratuito, Gemini 2.5 Flash, para todos los usuarios.
La entrada Google presenta Gemini 2.5 intensificando la batalla por la IA se publicó primero en MuyComputer.