Bienvenido al resumen semanal de IA del 16 al 23 de febrero de 2026. Esta semana fue absolutamente épica: Anthropic lanzó dos modelos en menos de dos semanas, OpenAI retiró GPT-4o, Google Gemini rompió benchmarks, y China sorprendió con Seedance 2.0. Prepárate, porque hay MUCHO que cubrir.
Anthropic: Semana de Dos Lanzamientos Históricos
Claude Opus 4.6 (5 de Febrero) - El Más Poderoso Hasta Ahora
El 5 de febrero, Anthropic lanzó Claude Opus 4.6, su modelo más potente hasta la fecha, con características que rompen límites:
Características Principales:
1M Context Window (Beta) - Primera vez en un modelo clase Opus 128K Output - Permite tareas complejas de generación larga Autonomous Agent Teams - Múltiples AIs dividen el trabajo y lo completan en paralelo
Esta última característica es revolucionaria: en lugar de un solo modelo procesando todo, Opus 4.6 coordina equipos de agentes autónomos que trabajan simultáneamente en diferentes partes de una tarea.
Claude Sonnet 4.6 (17 de Febrero) - Solo 12 Días Después
Apenas 12 días después del lanzamiento de Opus 4.6, Anthropic sorprendió al mercado con Claude Sonnet 4.6, mejorando en:
Computer Use mejorado (control de interfaces de usuario) Coding avanzado (mejor comprensión de contextos grandes) Design y knowledge work Procesamiento de grandes volúmenes de datos
Este ritmo de lanzamiento es sin precedentes - dos modelos mayores en menos de dos semanas.
Claude Code: $2.5 Mil Millones en Revenue Anual
Claude Code continúa su crecimiento explosivo:
$1 mil millones en revenue anualizado en los primeros 6 meses $2.5 mil millones actualmente (duplicó en ~6 meses) 80% de clientes enterprise (alta adopción corporativa)
Lanzado públicamente hace un año, Claude Code se ha consolidado como líder en el mercado de “vibe coding” (programación asistida por IA).
Claude Code Security (20 de Febrero)
Anthropic lanzó Claude Code Security, una nueva capacidad que:
Escanea repositorios en busca de vulnerabilidades Sugiere parches dirigidos para revisión humana Disponible en preview en Claude Code web
La noticia impactó al mercado: acciones de empresas de ciberseguridad cayeron tras el anuncio, señal de que Claude Code Security es percibido como una amenaza competitiva real.
Tensiones con el Pentágono
La semana también trajo controversia: el Pentágono amenaza con designar a Anthropic como “supply chain risk” si no elimina restricciones de uso militar.
El conflicto escaló tras el 3 de enero, cuando fuerzas especiales de EE.UU. capturaron a Nicolás Maduro en Venezuela, y reportes indican que usaron Claude durante la operación vía Palantir (partner de Anthropic).
Financiamiento: Anthropic cerró una ronda de $30 mil millones con valuación de $380 mil millones.
OpenAI: Adiós a GPT-4o, Hola GPT-5.2
Retiro de Modelos Antiguos (13 de Febrero)
El 13 de febrero, OpenAI retiró oficialmente:
GPT-4o (el modelo flagship del año pasado) GPT-4.1 y GPT-4.1 mini OpenAI o4-mini GPT-5 (Instant y Thinking)
Todas las conversaciones y proyectos ahora usan GPT-5.2 por defecto.
Nuevas Características de ChatGPT
ChatGPT recibió mejoras importantes:
Context Window Ampliado: 256K tokens totales (128K input + 128K output) en modo Thinking Anteriormente era 196K tokens totales
Más Archivos: Hasta 20 archivos simultáneos (antes 10) Facilita análisis de sets de documentos
Deep Research Mejorado: Enfoque en sitios específicos como fuentes confiables Sidebar rediseñado y vista fullscreen Reportes más precisos y creíbles
Voice Mejorado: Mejor seguimiento de instrucciones Uso mejorado de herramientas como búsqueda web
Code Blocks Interactivos: Escribe, edita y previsualiza código en un solo lugar
ChatGPT Agent (Para Pro Users)
ChatGPT Agent empezó a rodar para usuarios Pro, con acceso para Plus y Team “en los próximos días”.
Esta es la respuesta de OpenAI a Claude Opus 4.6 Autonomous Agents.
Seguridad y Ads
Lockdown Mode: Para usuarios de alta seguridad “Elevated Risk” labels en toda la plataforma Ads en ChatGPT: Test de publicidad para usuarios Free y Go en EE.UU. Planes pagos (Plus, Pro, Business, Enterprise, Education) permanecen sin ads
Google Gemini: Líder en Benchmarks
Gemini 3.1 Pro (19 de Febrero) - Nuevo Campeón
El 19 de febrero, Google lanzó Gemini 3.1 Pro que dominó benchmarks:
13 de 16 benchmarks liderados 77.1% en ARC-AGI-2 (test de lógica pura y resolución de problemas)
Este es el puntaje más alto registrado en ARC-AGI-2, un benchmark notoriamente difícil que mide razonamiento abstracto.
Gemini 3 Flash - Nuevo Default
Gemini 3 Flash ahora es el modelo default en la app Gemini, ofreciendo:
Inteligencia de próxima generación Velocidad ultrarrápida Upgrade mayor vs Gemini 2.5 Flash
Gemini 3 Deep Think (AI Ultra)
Suscriptores de Google AI Ultra ahora tienen acceso a Gemini 3 Deep Think, el modo de razonamiento más avanzado de Gemini.
Disponible: App Gemini, API (con aplicación para empresas)
Personal Intelligence (Beta)
Personal Intelligence está rodando para suscriptores AI Pro y AI Ultra en EE.UU.:
Conecta datos de Gmail, Google Photos, YouTube, Search Opt-in: El usuario decide si activar Plataformas: Web, Android, iOS
Gemini en Chrome
Para suscriptores AI Pro/Ultra en EE.UU. con Chrome en inglés.
Workspace y Educación
AI Expanded Access add-on: Uso aumentado de IA en Workspace apps Education: Capacidades generativas para usuarios 18+ con Education Plus o Teaching & Learning
xAI: Grok 4.2 Beta con 4 Agentes
xAI lanzó Grok 4.2 beta con una arquitectura de cuatro agentes donde agentes especializados:
Colaboran Debaten conclusiones Sintetizan respuestas antes de presentarlas
Resultado: 65% de reducción en alucinaciones comparado con versiones previas.
Este enfoque multi-agente es similar al de Claude Opus 4.6, señalando una tendencia clara en la industria.
China Sorprende: Modelos que Compiten con Occidente
Seedance 2.0 - El “Sora de China”
Seedance 2.0 de ByteDance se volvió viral esta semana con videos cinematográficos de celebridades en situaciones absurdas.
Características:
Entre los más avanzados de su tipo Facilidad de uso excepcional Realismo impresionante - videos generados en minutos
El lanzamiento “asustó a Hollywood” según CNN, y genera preguntas sobre si el sector tech chino frenará o acelerará ante esta capacidad.
Doubao 2.0 - ByteDance
ByteDance también lanzó Doubao 2.0, posicionándolo para la “era de agentes” donde los sistemas de IA ejecutan tareas complejas y multistep (no solo responden preguntas).
Kimi K2.5 - Moonshot AI
Moonshot AI presentó Kimi K2.5 con:
Capacidades de video-generación Manejo autónomo de tareas sin precedentes
MiniMax: M2.5 y M2.5 Lightning
La startup china MiniMax lanzó M2.5 y M2.5 Lightning con:
Rendimiento casi state-of-the-art Fracción del costo de modelos líderes Arquitectura Mixture of Experts
Mistral AI: Voxtral Transcribe 2
El 5 de febrero, Mistral AI lanzó Voxtral Transcribe 2 con:
Voxtral Mini Transcribe (modelo compacto) Voxtral Realtime (open-source) <200ms de latencia - traducción en vivo 13 idiomas soportados Funciona localmente en phones/laptops
Este es un cambio de juego para aplicaciones de traducción en tiempo real sin depender de la nube.
Tavus: Phoenix-4
Tavus lanzó Phoenix-4, un modelo generativo de video basado en Gaussian-diffusion que:
Renderiza avatares completos (cabeza y hombros) 40 fps a 1080p - tiempo real Control emocional explícito Active listening behavior (comportamiento de escucha activa) Movimiento facial continuo
Perfecto para customer service, presentaciones virtuales, y asistentes digitales.
Financiamiento y Movimientos Estratégicos
Fei-Fei Li’s World Labs: $1 Mil Millones
World Labs, la startup de Fei-Fei Li (la “Madrina de IA”), cerró $1 mil millones en financiamiento de AMD, NVIDIA, y Fidelity.
Objetivo: Avanzar inteligencia espacial con productos como MARBLE, que crea mundos 3D coherentes desde imágenes, video, o texto.
Tech Corps - Casa Blanca
La Casa Blanca anunció el “Tech Corps”, una iniciativa dentro del Peace Corps para:
Promover IA americana en el extranjero Ayudar a naciones partner a adoptar sistemas de punta Contrarrestar influencia china en IA
Empresariales
Databricks: Agent Bricks GA
Databricks hizo Agent Bricks Custom Agents generalmente disponible:
Build, test, deploy agentes de IA de calidad producción Apps de Databricks completamente gestionadas Serverless compute
Apple: Push a IA Visual
Según Bloomberg, el “próximo gran thing” de Apple es un push en inteligencia artificial visual.
Se espera más información en el evento del 4 de marzo.
Lo Que Viene en 2026
Según expertos, 2026 es el año en que la IA pasa de hype a pragmatismo:
Adopción empresarial real (no solo POCs) ROI medible en implementaciones Consolidación de proveedores Regulación más clara
Comparativa de Modelos Actuales
| Modelo | Empresa | Context | Destacado |
|---|---|---|---|
| Claude Opus 4.6 | Anthropic | 1M tokens | Autonomous agents |
| GPT-5.2 | OpenAI | 256K tokens | Default en ChatGPT |
| Gemini 3.1 Pro | N/A | Líder benchmarks | |
| Grok 4.2 | xAI | N/A | 4-agent architecture |
| Kimi K2.5 | Moonshot | N/A | Video + agents |
Preguntas Frecuentes
¿Por qué OpenAI retiró GPT-4o si era el modelo flagship?
OpenAI mantiene una estrategia de “retire fast, iterate faster”. Al retirar GPT-4o y modelos antiguos, fuerzan la adopción de GPT-5.2 (su modelo más avanzado) y simplifican mantenimiento de infraestructura. Es similar a como Apple descontinúa iPhones viejos para impulsar nuevos modelos.
¿Vale la pena el upgrade a Claude Opus 4.6 desde Sonnet?
Depende de tu caso de uso. Opus 4.6 es significativamente más caro pero ofrece 1M context window y autonomous agents. Si trabajas con documentos masivos (legal, research) o necesitas tareas complejas multi-paso, sí. Para coding general y tareas cotidianas, Sonnet 4.6 es más cost-effective.
¿Gemini 3.1 Pro es realmente mejor que GPT-5.2 y Claude Opus 4.6?
En benchmarks específicos, sí - Gemini 3.1 Pro lidera 13 de 16 tests y tiene el récord en ARC-AGI-2. Pero benchmarks no siempre se traducen a mejor experiencia de usuario. GPT-5.2 tiene mejor integración (ChatGPT ecosystem), y Claude tiene mejor coding según desarrolladores. La “mejor” IA depende de tu flujo de trabajo.
¿Los modelos chinos realmente compiten con OpenAI y Anthropic?
Sí, especialmente en generación de video (Seedance 2.0 rivaliza con Sora) y cost-effectiveness (MiniMax M2.5). China está cerrando la brecha rápidamente. Sin embargo, modelos occidentales aún lideran en reasoning, code, y safety. La distancia se está acortando más rápido de lo esperado.
¿Qué significa “autonomous agents” en práctica?
En lugar de hacer una solicitud y esperar una respuesta, autonomous agents dividen tareas complejas en sub-tareas, las ejecutan en paralelo, y sintetizan resultados. Ejemplo: “Analiza estos 50 PDFs y crea un reporte ejecutivo” - un agente tradicional procesa secuencialmente; autonomous agents asignan 5 sub-agentes procesando 10 PDFs cada uno simultáneamente.
¿ChatGPT con ads afectará la experiencia?
Solo para usuarios Free y Go en EE.UU. (test). Si pagas Plus, Pro, Business, Enterprise o Education, no verás ads. Es el modelo freemium estándar: producto gratuito con ads, pago sin ads. Similar a Spotify, YouTube Premium, etc.
Conclusión
Esta semana demostró que la carrera de IA está en su punto más intenso:
Anthropic lanza 2 modelos en 12 días OpenAI fuerza adopción de GPT-5.2 retirando GPT-4o Google domina benchmarks con Gemini 3.1 Pro xAI reduce alucinaciones 65% con Grok 4.2 China sorprende con Seedance 2.0 y modelos cost-effective
El ritmo de innovación es imparable. Si sientes que no puedes seguir el paso… nadie puede. Esta industria se mueve a velocidad sin precedentes.
¿Qué novedad te impactó más? ¿Estás usando alguno de estos modelos? Déjame saber en los comentarios.
Fuentes:
