Textos
Darío Ramírez
-
marzo 29, 2026

Los archivos que enseñan las máquinas 

El futuro nos alcanzó. O tal vez siempre estuvo aquí.

Las máquinas están aprendiendo a ver el mundo. Pero lo importante no es qué ven, sino cómo aprenden a hacerlo. Las inteligencias artificiales que hoy crean imágenes sorprendentes no ven la realidad, ven archivos: imágenes de internet que se convierten en datos y probabilidades algorítmicas.

Esos archivos no son neutrales. Internet, como cualquier archivo cultural, está atravesado por jerarquías, estereotipos y ausencias. Por eso, las imágenes de la inteligencia artificial parecen nuevas, pero su mirada no lo es. Las máquinas no están aprendiendo a ver el mundo, sino a verlo como ha sido archivado por el ser humano. Las nuevas imágenes no inauguran una mirada distinta: amplifican la cultura visual existente.

Las inteligencias artificiales no observan el mundo. No conocen el territorio, el cuerpo ni la historia. No tienen curiosidad, ni intención, ni experiencia. No analizan: procesan. Operan a través de grandes conjuntos de imágenes que se convierten en materia prima para condensar el pasado, el presente y el futuro en patrones reconocibles.

«Las máquinas no están aprendiendo a ver el mundo, sino a verlo como ha sido archivado por el ser humano.»

Los archivos visuales con los que aprenden estas máquinas nunca han sido neutrales. Nunca lo han sido. La representación del mundo siempre ha estado marcada por las relaciones de poder: quién produce las imágenes, quién puede hacerlas circular y quién aparece en ellas. La cultura visual global no es un reflejo inocente de la realidad, sino una construcción histórica de ciertas miradas que se han impuesto mientras otras quedaban relegadas a los márgenes.

Durante los siglos del colonialismo europeo, el control del territorio iba acompañado del control de las representaciones. Exploradores, científicos, fotógrafos y misioneros produjeron imágenes que organizaban el mundo en categorías: civilizado y primitivo, moderno y atrasado, centro y periferia. La imagen fue una herramienta para clasificar el mundo. Ese sistema no ha desaparecido hoy en día. Simplemente ha cambiado de forma.

La infraestructura desde la que se producen, organizan y circulan las imágenes del mundo está en manos de un reducido número de empresas tecnológicas. Son ellas quienes hoy controlan las condiciones desde las que las máquinas aprenden a ver.

«La representación del mundo siempre ha estado marcada por las relaciones de poder: quién produce las imágenes, quién puede hacerlas circular y quién aparece en ellas.»

Cada día se suben a internet cantidades ingentes de imágenes: solo en Instagram se comparten más de 95 millones de fotografías diarias, mientras que en Facebook se cargan más de 350 millones de imágenes al día.

Esta concentración de archivos, infraestructuras y capacidades de procesamiento guarda muchas similitudes con otras formas históricas de organización del conocimiento y del mundo. No se trata de un colonialismo estatal en el sentido clásico, porqueya que ya no existen imperios territoriales ni administraciones coloniales formales. Sin embargo, sí existe una nueva forma de organización del conocimiento visual: un colonialismo visual de plataforma en el que la cultura se convierte en materia prima para sistemas algorítmicos entrenados por corporaciones privadas.

En este contexto, las imágenes funcionan como un recurso extraíble. Se recopilan, se indexan y se convierten en datos para alimentar modelos capaces de producir nuevas imágenes demandadas por el mercado global. Así, la cultura se transforma en una mercancía algorítmica.

Muchas de las imágenes que alimentan estos modelos circulan acompañadas de fragmentos de lenguaje: títulos, etiquetas, descripciones o alt-text. Estos textos pueden parecer meramente descriptivos, pero en realidad condensan formas históricas de clasificar el mundo. En ellos se sedimentan lenguajes publicitarios, jerarquías culturales, taxonomías comerciales y prejuicios sociales que, convertidos en datos de entrenamiento, terminan moldeando la forma en que las máquinas aprenden a representar la realidad.

«La inteligencia artificial no inventa esos estereotipos. Los automatiza, los expande, los sostiene y, en ocasiones, los petrifica. »

Cuando un sistema generativo produce imágenes a partir de esos archivos, no solo reproduce estilos visuales, sino también formas históricas de organizar la mirada. Las asociaciones que durante décadas circularon por la cultura visual, qué cuerpos aparecen en ciertos roles, qué territorios se representan como periferia y qué identidades quedan fuera del encuadre,  se transforman en regularidades estadísticas. La inteligencia artificial no inventa esos estereotipos. Los automatiza, los expande, los sostiene y, en ocasiones, los petrifica. Lo que antes era una representación dominante en los archivos visuales, ahora puede convertirse en una probabilidad dominante en los sistemas generativos.

El teórico de la cultura visual Nicholas Mirzoeff propone entender la visualidad no como un simple acto de mirar, sino como un régimen histórico que organiza quién puede ver, qué se puede hacer visible y qué queda fuera del campo de lo visible. Las imágenes nunca circulan en el vacío, sino que forman parte de sistemas que ordenan la mirada.

Hoy no solo vemos imágenes, sino que basamos nuestra mirada en sistemas entrenados
en archivos masivos que filtran, clasifican y recombinan lo visible. Poco a poco, vamos entrando en una nueva forma de visualidad: la visualidad algorítmica, en la que la forma en que el mundo aparece ante nosotros empieza a depender de modelos entrenados sobre los desiguales archivos de internet.

En esta misma línea, la historiadora Ariella Aïsha Azoulay ha demostrado que los archivos visuales modernos no son simples depósitos de imágenes, sino infraestructuras atravesadas por relaciones imperiales. Durante siglos, las fotografías, los museos y las colecciones han funcionado como dispositivos de clasificación, apropiación y reorganización del mundo. Las imágenes se separan de las historias que las produjeron y pasan a formar parte de sistemas de conocimiento que las ordenan desde centros de poder.

Algo similar ocurre hoy con los grandes conjuntos de datos visuales que alimentan la inteligencia artificial. Se extraen millones de imágenes de la web, se desanclan de su contexto y se convierten en materia prima. El acontecimiento que alguna vez registraron desaparece. La imagen pasa a ser un dato. La fotografía deja de ser memoria para convertirse en un insumo para sistemas algorítmicos.

El efecto final de este proceso no es solo la reproducción de estereotipos. Es algo más amplio: una lenta homologación del imaginario visual. Cuando los sistemas generativos producen imágenes a partir de patrones dominantes, tienden a reforzar lo que ya era estadísticamente frecuente en los archivos. Las representaciones minoritarias se diluyen, las narrativas locales se simplifican y las diferencias culturales se reducen a signos fácilmente reconocibles. Lo que emerge es una cultura visual cada vez más uniforme, donde la diversidad del mundo se comprime en un repertorio limitado de imágenes plausibles.

«Quizá el problema no sea que las inteligencias artificiales generen imágenes. El problema podría ser desde qué archivos aprendieron a mirar el mundo. »

La tentación es atribuir a la inteligencia artificial una responsabilidad moral, pensar que las máquinas reproducen prejuicios o distorsionan la realidad. Sin embargo, esta formulación oculta algo más importante. Las máquinas no inventaron esas miradas. Las aprendieron. Quizá el problema no sea que las inteligencias artificiales generen imágenes.
El problema podría ser desde qué archivos aprendieron a mirar el mundo.

Porque esos archivos, construidos por una economía global de plataformas, mercados y jerarquías culturales, ya contenían las formas de ver que ahora amplifican los sistemas algorítmicos. Durante siglos, los imperios controlaron territorios; hoy, un pequeño número de empresas controla la infraestructura a través de la cual circulan las imágenes del mundo. La inteligencia artificial no está creando un nuevo régimen visual. En muchos sentidos, lo que está haciendo es revelar con una claridad sin precedentes el régimen visual que ya existía.

Pero esta constatación no tiene por qué conducir al fatalismo. Los archivos a partir de los cuales aprenden las máquinas no cayeron del cielo: fueron creados mediante decisiones humanas, miradas situadas e historias que alguien decidió contar y otras que quedaron fuera del encuadre. Eso significa que también pueden transformarse.

«Las máquinas no solo aprendieron a mirar en nuestros archivos. También aprendieron nuestras formas de olvidar.»

Frente a la homogeneización algorítmica, sigue existiendo algo que ninguna máquina puede producir por sí sola: la experiencia de estar en el mundo, la relación entre cuerpos y territorios, las historias que nacen del encuentro, de la memoria compartida, de la presencia humana. Allí donde las imágenes surgen de la experiencia vital de quienes habitan el mundo, aparece un conocimiento que no puede reducirse a datos ni a probabilidades.

En un tiempo dominado por archivos automáticos y sistemas generativos, tal vez la tarea más urgente sea precisamente esa: seguir produciendo imágenes y relatos que no provengan de las máquinas, sino de la experiencia humana. Mientras existan nuevas historias que contar y nuevas miradas dispuestas a narrarlas, el mundo seguirá siendo más amplio que cualquier archivo.

Las máquinas no solo aprendieron a mirar en nuestros archivos.
También aprendieron nuestras formas de olvidar.