Bienvenido al resumen semanal de IA del 16 al 23 de febrero de 2026. Esta semana estuvo cargada: Anthropic lanzó dos modelos en menos de dos semanas, OpenAI retiró GPT-4o, Google Gemini lideró benchmarks, y China sorprendió con Seedance 2.0.
Anthropic: Dos Lanzamientos en Una Semana
Claude Opus 4.6 (5 de Febrero)
El 5 de febrero, Anthropic lanzó Claude Opus 4.6, su modelo más potente hasta la fecha. Las novedades principales:
- 1M Context Window (Beta): primera vez en un modelo clase Opus
- 128K Output: permite tareas de generación larga
- Autonomous Agent Teams: múltiples instancias dividen el trabajo y lo completan en paralelo
Con Autonomous Agent Teams, en lugar de un solo modelo procesando todo, Opus 4.6 coordina equipos de agentes que trabajan simultáneamente en diferentes partes de una tarea.
Claude Sonnet 4.6 (17 de Febrero)
Apenas 12 días después, Anthropic lanzó Claude Sonnet 4.6 con mejoras en:
- Computer Use (control de interfaces de usuario)
- Coding con mejor comprensión de contextos grandes
- Design y knowledge work
- Procesamiento de grandes volúmenes de datos
Dos modelos mayores en menos de dos semanas es un ritmo inusual incluso para Anthropic.
Claude Code: $2.5 Mil Millones en Revenue Anual
Claude Code alcanzó $1 mil millones en revenue anualizado en sus primeros 6 meses, y actualmente está en $2.5 mil millones (duplicó en ~6 meses). El 80% de los clientes son enterprise.
Lanzado públicamente hace un año, Claude Code lidera el mercado de programación asistida por IA.
Claude Code Security (20 de Febrero)
Anthropic lanzó Claude Code Security, una nueva capacidad que escanea repositorios en busca de vulnerabilidades y sugiere parches para revisión humana. Disponible en preview en Claude Code web.
Las acciones de varias empresas de ciberseguridad cayeron tras el anuncio.
Tensiones con el Pentágono
La semana también trajo controversia: el Pentágono amenaza con designar a Anthropic como “supply chain risk” si no elimina restricciones de uso militar.
El conflicto escaló tras el 3 de enero, cuando fuerzas especiales de EE.UU. capturaron a Nicolás Maduro en Venezuela, y reportes indican que usaron Claude durante la operación vía Palantir (partner de Anthropic).
Financiamiento: Anthropic cerró una ronda de $30 mil millones con valuación de $380 mil millones.
OpenAI: Adiós a GPT-4o, Hola GPT-5.2
Retiro de Modelos Antiguos (13 de Febrero)
El 13 de febrero, OpenAI retiró oficialmente GPT-4o, GPT-4.1, GPT-4.1 mini, OpenAI o4-mini, y GPT-5 (Instant y Thinking). Todas las conversaciones y proyectos ahora usan GPT-5.2 por defecto.
Nuevas Características de ChatGPT
ChatGPT recibió varias mejoras:
- Context Window ampliado: 256K tokens totales (128K input + 128K output) en modo Thinking, antes 196K
- Más archivos: hasta 20 simultáneos (antes 10)
- Deep Research mejorado: enfoque en sitios específicos como fuentes confiables, sidebar rediseñado y vista fullscreen
- Voice mejorado: mejor seguimiento de instrucciones y uso de herramientas como búsqueda web
- Code Blocks interactivos: escribe, edita y previsualiza código en un solo lugar
ChatGPT Agent (Para Pro Users)
ChatGPT Agent empezó a rodar para usuarios Pro, con acceso para Plus y Team “en los próximos días”. Es la respuesta de OpenAI a los Autonomous Agents de Claude Opus 4.6.
Seguridad y Ads
OpenAI agregó Lockdown Mode para usuarios de alta seguridad y etiquetas de “Elevated Risk” en toda la plataforma. También está testeando publicidad para usuarios Free y Go en EE.UU. Los planes pagos (Plus, Pro, Business, Enterprise, Education) no muestran ads.
Google Gemini: Líder en Benchmarks
Gemini 3.1 Pro (19 de Febrero)
El 19 de febrero, Google lanzó Gemini 3.1 Pro con resultados destacados en benchmarks: lidera 13 de 16 tests y obtuvo 77.1% en ARC-AGI-2, el puntaje más alto registrado en ese benchmark de razonamiento abstracto.
Gemini 3 Flash - Nuevo Default
Gemini 3 Flash es ahora el modelo default en la app Gemini. Según Google, es un upgrade significativo vs Gemini 2.5 Flash en velocidad e inteligencia.
Gemini 3 Deep Think (AI Ultra)
Suscriptores de Google AI Ultra tienen acceso a Gemini 3 Deep Think, el modo de razonamiento extendido de Gemini. Disponible en la app Gemini y via API (con solicitud para empresas).
Personal Intelligence (Beta)
Personal Intelligence está disponible para suscriptores AI Pro y AI Ultra en EE.UU. Conecta datos de Gmail, Google Photos, YouTube y Search. Es opt-in (el usuario decide si activar) y funciona en web, Android e iOS.
Gemini en Chrome
Disponible para suscriptores AI Pro/Ultra en EE.UU. con Chrome en inglés.
Workspace y Educación
Google agregó un add-on de AI Expanded Access para uso aumentado en Workspace apps, y capacidades generativas para usuarios 18+ con Education Plus o Teaching & Learning.
xAI: Grok 4.2 Beta con 4 Agentes
xAI lanzó Grok 4.2 beta con una arquitectura de cuatro agentes especializados que colaboran, debaten conclusiones y sintetizan respuestas antes de presentarlas. Según xAI, esto resultó en una reducción del 65% en alucinaciones comparado con versiones previas.
El enfoque multi-agente es similar al de Claude Opus 4.6.
China: Modelos que Compiten con Occidente
Seedance 2.0 - ByteDance
Seedance 2.0 de ByteDance se volvió viral esta semana con videos cinematográficos de celebridades en situaciones absurdas. El modelo genera videos realistas en minutos y fue descrito como uno de los más avanzados en su tipo. El lanzamiento “asustó a Hollywood” según CNN.
Doubao 2.0 - ByteDance
ByteDance también lanzó Doubao 2.0, orientado a la ejecución de tareas complejas y multistep (no solo respuestas a preguntas).
Kimi K2.5 - Moonshot AI
Moonshot AI presentó Kimi K2.5 con capacidades de generación de video y manejo autónomo de tareas.
MiniMax: M2.5 y M2.5 Lightning
La startup MiniMax lanzó M2.5 y M2.5 Lightning con rendimiento cercano a los modelos líderes a una fracción del costo, usando arquitectura Mixture of Experts.
Mistral AI: Voxtral Transcribe 2
El 5 de febrero, Mistral AI lanzó Voxtral Transcribe 2 con un modelo compacto (Voxtral Mini Transcribe), una versión open-source en tiempo real (Voxtral Realtime), menos de 200ms de latencia, soporte para 13 idiomas y la posibilidad de correr localmente en teléfonos y laptops.
Tavus: Phoenix-4
Tavus lanzó Phoenix-4, un modelo generativo de video basado en Gaussian-diffusion. Renderiza avatares completos (cabeza y hombros) a 40 fps en 1080p, con control emocional explícito, comportamiento de escucha activa y movimiento facial continuo. Orientado a customer service, presentaciones virtuales y asistentes digitales.
Financiamiento y Movimientos Estratégicos
Fei-Fei Li’s World Labs: $1 Mil Millones
World Labs, la startup de Fei-Fei Li, cerró $1 mil millones en financiamiento de AMD, NVIDIA y Fidelity. El objetivo es avanzar en inteligencia espacial con productos como MARBLE, que genera mundos 3D coherentes desde imágenes, video o texto.
Tech Corps - Casa Blanca
La Casa Blanca anunció el “Tech Corps”, una iniciativa dentro del Peace Corps para promover IA americana en el extranjero, ayudar a naciones partner a adoptar tecnología americana y contrarrestar la influencia china en IA.
Empresariales
Databricks: Agent Bricks GA
Databricks hizo Agent Bricks Custom Agents generalmente disponible. Permite construir, testear y desplegar agentes de IA de calidad producción, con apps de Databricks gestionadas y serverless compute.
Apple: Push a IA Visual
Según Bloomberg, Apple está trabajando en un avance de inteligencia artificial visual. Se espera más información en el evento del 4 de marzo.
Lo Que Viene en 2026
Según TechCrunch, 2026 es el año en que la IA pasa de hype a pragmatismo: adopción empresarial real (no solo POCs), ROI medible en implementaciones, consolidación de proveedores y regulación más clara.
Comparativa de Modelos Actuales
| Modelo | Empresa | Context | Destacado |
|---|---|---|---|
| Claude Opus 4.6 | Anthropic | 1M tokens | Autonomous agents |
| GPT-5.2 | OpenAI | 256K tokens | Default en ChatGPT |
| Gemini 3.1 Pro | N/A | Líder benchmarks | |
| Grok 4.2 | xAI | N/A | 4-agent architecture |
| Kimi K2.5 | Moonshot | N/A | Video + agents |
Preguntas Frecuentes
¿Por qué OpenAI retiró GPT-4o si era el modelo flagship?
OpenAI mantiene una estrategia de “retire fast, iterate faster”. Al retirar GPT-4o y modelos antiguos, fuerzan la adopción de GPT-5.2 (su modelo más avanzado) y simplifican mantenimiento de infraestructura. Es similar a como Apple descontinúa iPhones viejos para impulsar nuevos modelos.
¿Vale la pena el upgrade a Claude Opus 4.6 desde Sonnet?
Depende de tu caso de uso. Opus 4.6 es significativamente más caro pero ofrece 1M context window y autonomous agents. Si trabajas con documentos masivos (legal, research) o necesitas tareas complejas multi-paso, sí. Para coding general y tareas cotidianas, Sonnet 4.6 es más cost-effective.
¿Gemini 3.1 Pro es realmente mejor que GPT-5.2 y Claude Opus 4.6?
En benchmarks específicos, sí - Gemini 3.1 Pro lidera 13 de 16 tests y tiene el récord en ARC-AGI-2. Pero benchmarks no siempre se traducen a mejor experiencia de usuario. GPT-5.2 tiene mejor integración (ChatGPT ecosystem), y Claude tiene mejor coding según desarrolladores. La “mejor” IA depende de tu flujo de trabajo.
¿Los modelos chinos realmente compiten con OpenAI y Anthropic?
Sí, especialmente en generación de video (Seedance 2.0 rivaliza con Sora) y cost-effectiveness (MiniMax M2.5). China está cerrando la brecha rápidamente. Sin embargo, modelos occidentales aún lideran en reasoning, code, y safety. La distancia se está acortando más rápido de lo esperado.
¿Qué significa “autonomous agents” en práctica?
En lugar de hacer una solicitud y esperar una respuesta, autonomous agents dividen tareas complejas en sub-tareas, las ejecutan en paralelo, y sintetizan resultados. Ejemplo: “Analiza estos 50 PDFs y crea un reporte ejecutivo” - un agente tradicional procesa secuencialmente; autonomous agents asignan 5 sub-agentes procesando 10 PDFs cada uno simultáneamente.
¿ChatGPT con ads afectará la experiencia?
Solo para usuarios Free y Go en EE.UU. (test). Si pagas Plus, Pro, Business, Enterprise o Education, no verás ads. Es el modelo freemium estándar: producto gratuito con ads, pago sin ads. Similar a Spotify, YouTube Premium, etc.
Conclusión
Una semana con mucha actividad: Anthropic lanzó 2 modelos en 12 días, OpenAI retiró GPT-4o forzando la adopción de GPT-5.2, Google lideró benchmarks con Gemini 3.1 Pro, xAI redujo alucinaciones un 65% con Grok 4.2, y China sorprendió con Seedance 2.0 y modelos más accesibles en precio.
¿Qué novedad te impactó más? ¿Estás usando alguno de estos modelos? Déjame saber en los comentarios.
Fuentes: