Principales destaques
- Gemini 3 Pro alcanza resultados de estado del arte en múltiples benchmarks de razonamiento, matemáticas, multimodalidad y precisión factual, superando a Gemini 2.5 Pro.
- El modo Gemini 3 Deep Think mejora aún más el rendimiento en pruebas como Humanity’s Last Exam, GPQA Diamond y ARC-AGI-2, orientado a problemas especialmente complejos.
- El modelo impulsa casos de uso para aprender, construir y planificar: desde análisis de papers y videos hasta generación de interfaces web, agentes de desarrollo y flujos automatizados de tareas.
- Google lanza Gemini 3 de forma integrada en Search (AI Mode), app Gemini, Vertex AI, Gemini Enterprise, Google Antigravity y plataformas de terceros, con un fuerte énfasis en seguridad y evaluación externa.
Google presentó Gemini 3, su modelo de inteligencia artificial más avanzado hasta la fecha (Añadir enlace a la fuente original aquí), como el siguiente gran paso en la “era Gemini” iniciada hace casi dos años. Este lanzamiento consolida la evolución desde Gemini 1 (multimodalidad nativa y ventanas de contexto extensas) y Gemini 2 / 2.5 (capacidades “agénticas” y razonamiento mejorado) hacia un modelo que combina razonamiento de frontera, comprensión multimodal profunda y uso de herramientas para operar como un verdadero socio cognitivo en productos de consumo, herramientas para desarrolladores y soluciones empresariales.
Gemini 3 se define como “el modelo más inteligente” de Google, diseñado para captar matices, contexto e intención del usuario con menos indicaciones (“prompts”), y para abordar problemas complejos con múltiples capas. A nivel de despliegue, desde el día uno se integra en AI Mode en Search, en la app Gemini, en herramientas para desarrolladores como Google AI Studio, Vertex AI, Gemini CLI y en la nueva plataforma de desarrollo agéntico Google Antigravity. También se anuncia su disponibilidad en plataformas de terceros como Cursor, GitHub, JetBrains, Manus y Replit, así como en soluciones empresariales mediante Vertex AI y Gemini Enterprise.
Rendimiento y benchmarks de estado del arte
Gemini 3 Pro muestra mejoras significativas frente a Gemini 2.5 Pro en todos los benchmarks principales reportados. En el ranking LMArena lidera con una puntuación de 1501 Elo. En pruebas avanzadas de razonamiento tipo PhD, el modelo alcanza 37,5% en Humanity’s Last Exam (sin uso de herramientas) y 91,9% en GPQA Diamond. En matemáticas, logra un nuevo estado del arte de 23,4% en MathArena Apex.
En capacidades multimodales, Gemini 3 Pro obtiene 81% en MMMU-Pro y 87,6% en Video-MMMU, lo que refleja su habilidad para razonar sobre información compleja en imágenes y video. En precisión factual, alcanza 72,1% en SimpleQA Verified, reforzando su confiabilidad para temas de conocimiento general y especializado. En conjunto, estos resultados indican una capacidad elevada para resolver problemas complejos en ciencia, matemáticas y otros dominios con un grado alto de consistencia.
El modo Gemini 3 Deep Think lleva estas capacidades un paso más allá. En pruebas internas, mejora los resultados de Gemini 3 Pro en Humanity’s Last Exam (41,0%, sin herramientas) y GPQA Diamond (93,8%). Además, obtiene 45,1% en ARC-AGI-2 (con ejecución de código, ARC Prize Verified), lo que demuestra un desempeño fuerte en desafíos novedosos que requieren generalización y razonamiento abstracto. Este modo está previsto inicialmente para testers de seguridad y posteriormente para suscriptores de Google AI Ultra.
Aprender “cualquier cosa”: multimodalidad y contexto extendido
Desde su diseño, Gemini 3 integra texto, imágenes, video, audio y código, y se apoya en una ventana de contexto de hasta 1 millón de tokens. Esto le permite sintetizar información extensa y heterogénea: por ejemplo, traducir y estructurar recetas manuscritas familiares en distintos idiomas para convertirlas en un recetario compartible; o tomar papers académicos, videos largos de clases y tutoriales para generar código que produzca tarjetas interactivas de estudio, visualizaciones y otros recursos didácticos.
El modelo también puede analizar videos de actividades deportivas —como partidos de pickleball—, identificar oportunidades de mejora técnica y proponer planes de entrenamiento enfocados en la forma general del jugador. En la capa de producto, AI Mode en Search usa Gemini 3 para habilitar nuevas experiencias de interfaz generativa, incluyendo layouts visuales inmersivos y herramientas o simulaciones interactivas generadas dinámicamente según la consulta, por ejemplo para explicar procesos biológicos complejos como la acción de la ARN polimerasa.
Construir “cualquier cosa”: código, UI y desarrollo agéntico
En el ámbito de desarrollo, Gemini 3 se posiciona como el mejor modelo de “vibe coding” y programación agéntica de Google hasta ahora. Destaca por su capacidad de generación en cero-shot, manejo de prompts complejos y generación de interfaces web más ricas e interactivas. Encabeza el leaderboard WebDev Arena con 1487 Elo y consigue 54,2% en Terminal-Bench 2.0, que evalúa el uso de herramientas para operar una computadora vía terminal. En SWE-bench Verified, un benchmark orientado a agentes de programación, supera ampliamente a 2.5 Pro con un 76,2%.
Los casos de uso demostrados incluyen la creación de videojuegos retro 3D con visualizaciones más ricas, construcción y manipulación de arte 3D tipo vóxeles mediante código y generación de mundos jugables con shaders. Gemini 3 puede “vibe codear” interfaces y aplicaciones web complejas, enfocándose en la experiencia y la interactividad.
Google Antigravity: plataforma de desarrollo centrada en agentes
Con el aumento de inteligencia de los modelos, Google replantea la experiencia de desarrollo lanzando Google Antigravity, una plataforma de desarrollo agéntico donde los agentes pasan de ser una herramienta puntual a un socio activo. Basada en el razonamiento avanzado, uso de herramientas y capacidades de programación agéntica de Gemini 3, Antigravity integra a los agentes directamente con el editor, el terminal y el navegador.
En esta plataforma, los agentes pueden planificar y ejecutar tareas de software complejas de extremo a extremo de manera autónoma, validando su propio código mientras trabajan. Además de Gemini 3 Pro, Antigravity incorpora el modelo Gemini 2.5 Computer Use para control del navegador y el modelo de edición de imágenes Nano Banana (Gemini 2.5 Image), lo que permite flujos integrales que combinan backend, frontend, pruebas, navegación web y edición visual en un mismo entorno.
Planificar “cualquier cosa”: agentes y planificación de largo plazo
En planificación de largo horizonte, Gemini 3 Pro lidera la tabla en Vending-Bench 2, un benchmark que simula la gestión de un negocio de máquinas expendedoras durante un año. El modelo mantiene un uso consistente de herramientas y decisiones estables a lo largo de la simulación, generando retornos superiores sin desviarse de la tarea.
Estas capacidades se traducen en agentes más útiles para tareas cotidianas y empresariales: Gemini 3 puede ejecutar flujos complejos de múltiples pasos —como reservar servicios locales o organizar el correo— combinando razonamiento profundo con uso de herramientas de manera confiable, siempre bajo el control y guía del usuario. En la app Gemini, los suscriptores de Google AI Ultra pueden probar estas capacidades agénticas con Gemini Agent, incluyendo tareas como organizar la bandeja de entrada de Gmail.
Desarrollo responsable y seguridad
Gemini 3 es presentado como el modelo más seguro de Google hasta ahora, sometido al conjunto de evaluaciones de seguridad más amplio que la compañía ha realizado en un modelo de IA propio. Los resultados reportados muestran menor “sicofiancia” (tendencia a decir lo que el usuario quiere oír), mayor resistencia frente a inyecciones de prompt y mejores protecciones contra usos maliciosos, como ciberataques.
El modelo ha sido evaluado en dominios críticos dentro del Frontier Safety Framework de Google, complementando las pruebas internas con evaluaciones de expertos externos. Se menciona la colaboración con entidades como el UK AISI, así como evaluaciones independientes realizadas por organizaciones como Apollo, Vaultis y Dreadnode. Google también pone a disposición una “model card” específica para Gemini 3 como referencia de transparencia técnica y de seguridad.
Despliegue y hoja de ruta
A partir de la fecha del anuncio, Gemini 3 comienza a desplegarse en varias capas del ecosistema Google:
- Para usuarios finales, en la app Gemini y para suscriptores de Google AI Pro y Ultra en AI Mode en Search.
- Para desarrolladores, vía la API de Gemini en AI Studio, la nueva plataforma Google Antigravity y Gemini CLI.
- Para empresas, mediante Vertex AI y Gemini Enterprise.
El modo Gemini 3 Deep Think se mantiene inicialmente en fase de pruebas adicionales de seguridad con testers especializados, con la intención de lanzarlo a suscriptores de Google AI Ultra en las siguientes semanas. La compañía adelanta que planea liberar modelos adicionales en la serie Gemini 3 para habilitar más casos de uso, y expresa su interés en recibir retroalimentación sobre lo que los usuarios aprendan, construyan y planifiquen con esta nueva generación.
Marlom de Souza Pinto
Es profesional de trading desde 2017 y de marketing digital desde 2018. Actúa en el portal Trading Latam, donde analiza mercados, tecnología y negocios con foco en los impactos para inversionistas. En su tiempo libre, le gusta viajar, leer y profundizar en estudios continuos.