Andrej Karpathy se une a Anthropic para liderar el preentrenamiento de Claude

19 may 2026

8 min de lectura

TempMail Ninja

Andrej Karpathy se une a Anthropic para liderar el preentrenamiento de Claude

Contenido del artículo

El tablero global de la inteligencia artificial de frontera acaba de sufrir uno de sus movimientos tectónicos más trascendentales. El 19 de mayo de 2026, Andrej Karpathy, uno de los investigadores y educadores en computación más respetados del mundo, cofundador de OpenAI y exdirector de Tesla Autopilot, anunció oficialmente su incorporación a las filas de Anthropic. Tras un periodo dedicado al desarrollo de su startup educativa Eureka Labs, el regreso de Karpathy a la investigación y desarrollo (I+D) de frontera no es un fichaje ordinario: representa una de las victorias estratégicas más contundentes para Anthropic frente a OpenAI y Google DeepMind en la encarnizada guerra de talento de Silicon Valley.

La incorporación de Andrej Karpathy no busca simplemente sumar un nombre célebre al organigrama de la firma. Su misión es sumamente específica y de un calado técnico revolucionario: liderar un nuevo subequipo dentro del departamento de preentrenamiento (pretraining) de Anthropic. El mandato consiste en orquestar el llamado “Claude-in-the-Loop Pretraining”, un enfoque donde el propio modelo Claude se convierte en el agente principal para automatizar, optimizar y acelerar los procesos de entrenamiento de la próxima generación de modelos de lenguaje (LLM). Este paso marca un alejamiento decisivo del paradigma de la “fuerza bruta” (basado puramente en escalar cómputo y hardware) para dar paso a la era del desarrollo asistido y recursivo de la IA.

La fuga de cerebros definitiva: El golpe estratégico de Anthropic contra OpenAI

Para comprender el impacto del fichaje de Andrej Karpathy, es necesario analizar el panorama geopolítico y corporativo de Silicon Valley en mayo de 2026. Este suceso ocurre en un momento crítico de transición en la industria, coincidiendo estrechamente con hitos legales y estratégicos de gran envergadura, como la resolución judicial del juicio de Elon Musk contra OpenAI. En lugar de regresar a OpenAI o aceptar ofertas masivas del ecosistema de Google o xAI, Karpathy optó por sumarse al gran rival dirigido por los hermanos Dario y Daniela Amodei.

Con esta incorporación, Anthropic consolida una preocupante tendencia de fugas de perfiles de altísimo nivel técnico procedentes de OpenAI. En un lapso de apenas dos años, figuras clave de la arquitectura original y la alineación de OpenAI han migrado de forma sistemática hacia el mismo destino:

Jan Leike: Quien lideraba el equipo de alineación (Superalignment) en OpenAI y renunció en mayo de 2024 para unirse a Anthropic.
John Schulman: Cofundador de OpenAI y una de las mentes maestras detrás del entrenamiento por refuerzo a partir de retroalimentación humana (RLHF), quien abandonó la compañía en agosto de 2024.
Andrej Karpathy: Cofundador de OpenAI, quien tras su salida definitiva y un paso por Eureka Labs, sella este trío de deserciones históricas en mayo de 2026.

La concentración de estos perfiles en Anthropic consolida su reputación no solo como un bastión de seguridad y alineación técnica de IA, sino como un laboratorio de ingeniería aplicada extremadamente ágil. Para los ingenieros más brillantes del planeta, la marca OpenAI ya no representa el destino indiscutible por defecto. En su lugar, Anthropic se posiciona como el ecosistema idóneo para aquellos que buscan resolver los desafíos de frontera sin las ataduras de la hipercomercialización apresurada.

El mandato de Andrej Karpathy: Claude en el bucle de preentrenamiento

El trabajo de Karpathy se desarrollará bajo la supervisión de Nicholas Joseph (conocido en el sector como Nick Joseph), otro exingeniero de OpenAI y actual director de preentrenamiento en Anthropic. El preentrenamiento es la etapa más costosa, compleja y crítica en el ciclo de vida de un modelo de inteligencia artificial. Es aquí donde el sistema ingiere billones de tokens de datos brutos para asimilar las estructuras del lenguaje, la lógica matemática, la programación y las bases del razonamiento general. Tradicionalmente, este proceso se gestiona mediante un software de infraestructura masivo que distribuye cargas de trabajo sobre miles de GPUs y TPUs interconectadas, un entorno plagado de errores de hardware y problemas sutiles de optimización.

El enfoque tradicional de preentrenamiento presenta severos cuellos de botella humanos. Los investigadores deben monitorizar continuamente las métricas de pérdida (loss curves), ajustar hiperparámetros de manera intuitiva, identificar datos corruptos dentro de los conjuntos de datos de entrenamiento y depurar fallos de infraestructura a gran escala.

La propuesta de Andrej Karpathy y el equipo de Nick Joseph consiste en subvertir este flujo de trabajo manual introduciendo a Claude de forma profunda y directa en el bucle de experimentación (Claude-in-the-Loop). En la práctica, esto implica:

Curaduría automatizada de datos a escala: El uso de agentes basados en Claude para filtrar, etiquetar, clasificar y limpiar la inmensa cantidad de información web que alimenta el preentrenamiento, elevando la calidad de los tokens de entrenamiento por encima de la mera cantidad.
Orquestación autónoma de experimentos: Implementar flujos de trabajo agénticos donde Claude evalúe los resultados de ejecuciones de entrenamiento a pequeña escala, sugiera modificaciones en la arquitectura de la red o en la tasa de aprendizaje (learning rate) y despliegue las siguientes iteraciones sin intervención humana constante.
Análisis y depuración de telemetría: Los sistemas de frontera generan petabytes de logs durante su entrenamiento. Un agente Claude dedicado puede analizar de manera quirúrgica anomalías en el rendimiento de los clústeres de GPU y proponer parches de código en tiempo real para optimizar la eficiencia del clúster.

Este viraje metodológico es crucial. En lugar de limitarse a esperar que los chips de hardware de última generación resuelvan mágicamente la escala del modelo, Anthropic está apostando por un multiplicador de productividad interna: hacer que la IA de frontera optimice y construya de manera iterativa a su propio sucesor.

De “Vibe Coding” a la Ingeniería Agéntica: La filosofía de Karpathy aplicada

El nuevo rol de Karpathy es la evolución natural de su propia filosofía técnica, expresada con vehemencia a lo largo de los últimos meses en sus canales de divulgación y repositorios públicos. Karpathy ha sido un promotor constante del fin de lo que él denomina “vibe coding” (el desarrollo de software informal e intuitivo donde el programador simplemente pide código básico a un chatbot de manera desestructurada). En su lugar, defiende la transición formal hacia la “ingeniería agéntica” (agentic engineering).

La ingeniería agéntica es una disciplina estricta de desarrollo de software donde los ingenieros humanos no se limitan a usar la IA como un copiloto pasivo, sino que diseñan, supervisan e integran complejos sistemas de agentes autónomos multifase. Para demostrar este concepto, Karpathy popularizó soluciones avanzadas utilizando herramientas como Claude Code y arquitecturas personalizadas como los archivos CLAUDE.md. Estos sistemas se basan en cuatro principios fundamentales que ahora se trasladarán a la I+D de preentrenamiento en Anthropic:

Pensar antes de codificar (Think Before Coding): Obligar al agente a esquematizar su lógica conceptualmente y analizar las dependencias antes de generar cualquier línea de código o configuración experimental.
Simplicidad ante todo (Simplicity First): Minimizar la complejidad de los entornos de ejecución para evitar fallos en cascada dentro de los sistemas distribuidos de IA.
Cambios quirúrgicos (Surgical Changes): En lugar de sobreescribir bloques masivos de infraestructura, el sistema realiza ediciones precisas y modulares sobre las bases de código y los hiperparámetros de entrenamiento.
Enfoque orientado a objetivos (Goal Driven): Toda acción de los agentes de software debe estar firmemente anclada en la optimización de métricas concretas y medibles, evaluadas continuamente por un bucle de retroalimentación cerrada.

Al aplicar este riguroso marco al proceso de entrenamiento inicial del modelo, el subequipo de Karpathy buscará que las herramientas agénticas de Claude gestionen de forma autónoma bases de conocimiento dinámicas (estilo wikis autoevolutivas) sobre qué configuraciones y arquitecturas producen los mejores resultados. Esto creará un sistema que capitalizará cada experimento fallido o exitoso de manera exponencial.

Infraestructura de vanguardia y seguridad férrea: El ecosistema que acoge a Karpathy

La llegada de Karpathy coincide con una fase de expansión sin precedentes en la infraestructura de Anthropic. Recientemente, la compañía anunció una alianza estratégica de gran envergadura con SpaceX para utilizar la capacidad de cómputo del gigantesco centro de datos Colossus 1 en Memphis, Tennessee. Esta infraestructura proveerá a Anthropic con más de 300 megavatios de energía dedicados exclusivamente a entrenar sus modelos de nueva generación. Gestionar este monstruo de cómputo requiere precisamente del tipo de automatización inteligente y agéntica que Karpathy propone liderar.

A la par de este músculo físico, Anthropic continúa blindando su estructura organizacional. Junto con Karpathy, la compañía anunció la contratación de Chris Rohlf, un veterano de la ciberseguridad con más de 20 años de experiencia, incluyendo posiciones clave en Meta, la división de seguridad de Yahoo (“The Paranoids”) y una distinguida posición como investigador en el Center for Security and Emerging Technology (CSET) de Georgetown.

Rohlf se unirá al prestigioso equipo de Frontier Red Teaming de Anthropic. Su enfoque principal estará alineado con uno de los grandes desafíos de la IA de frontera: la protección de los pesos de los modelos (model weights) y la simulación ofensiva frente a amenazas cibernéticas emergentes. Esta combinación de fichajes subraya una visión holística muy clara por parte de Anthropic:

La aceleración del preentrenamiento mediante IA recursiva (liderada por Andrej Karpathy y Nick Joseph).
La garantía de que estos modelos superpotentes se mantengan seguros frente a actores estatales y amenazas complejas (liderada por perfiles como Chris Rohlf).
La adquisición estratégica de talento proveniente de sus rivales directos, incluyendo a Ross Nordeen (exmiembro fundador de xAI) para consolidar su equipo de sistemas de gran escala.

La hipótesis de la autorrecuperación recursiva

El movimiento de Karpathy hacia Anthropic encapsula perfectamente el estado de la tecnología de inteligencia artificial en 2026. La atención de la mayoría de los inversores y del público general sigue concentrada en las interfaces conversacionales, las aplicaciones móviles y los agentes de software comerciales. Sin embargo, los verdaderos iniciados de la industria comprenden que el mayor apalancamiento civilizatorio y técnico no está en la capa de aplicación, sino en la capa de investigación y desarrollo de modelos base.

La incorporación de Karpathy para integrar a Claude en su propio bucle de entrenamiento es, en esencia, una de las mayores apuestas metodológicas de la década. Si la hipótesis de la autorrecuperación recursiva funciona —si un modelo de frontera realmente puede acelerar de forma drástica, segura y medible la gestación de su propio sucesor—, Anthropic habrá desbloqueado una ventaja de velocidad imposible de igualar mediante la mera adquisición de tarjetas gráficas.

Con Andrej Karpathy al timón del Claude-in-the-Loop Pretraining, Anthropic no solo ha ganado una batalla crucial en la despiadada guerra por el talento de Silicon Valley; ha colocado una de las mentes más brillantes de nuestra generación en el centro neurálgico donde la inteligencia artificial comenzará, de forma definitiva, a diseñarse a sí misma.