La frase que resume un problema sistémico
El 12 de abril de 2026, Cristina Aranda, consultora de inteligencia artificial con trayectoria en el ecosistema español, lanzó una frase que rápidamente circuló en foros y redes: «A los modelos de inteligencia artificial les falta calle y les sobran muchos sesgos.» Esta observación no es teórica, sino la síntesis de años trabajando con sistemas de IA que funcionan perfectamente en laboratorios de Silicon Valley y fallan estrepitosamente cuando se enfrentan a la complejidad del mundo real hispanohablante.
La denuncia de Aranda pone en relieve un problema que ha estado presente en la industria de la inteligencia artificial desde sus inicios: la falta de diversidad en los datos de entrenamiento y en los equipos que desarrollan estos sistemas. Este problema no es solo una cuestión de justicia social, sino que también afecta directamente la eficacia y la precisión de los modelos de IA en diferentes contextos culturales y geográficos.
Qué significa «les falta calle»
Los modelos de lenguaje actuales se entrenan principalmente con textos en inglés, de fuentes anglosajonas, sobre contextos culturales norteamericanos o europeos occidentales. Esto no es una conspiración, sino una realidad estadística. Estimaciones de 2025-2026 sugieren que entre el 70% y el 90% del corpus de entrenamiento de los modelos principales está en inglés. Esto significa que cuando un modelo necesita entender una expresión coloquial española, un referente cultural latinoamericano o un contexto legal europeo, sus respuestas suelen ser genéricas, imprecisas o directamente incorrectas.
«Les falta calle» significa que la IA no ha caminado por los barrios, no ha escuchado las conversaciones cotidianas, no ha absorbido la diversidad lingüística y cultural que existe fuera de los centros de poder tecnológico. Un ejemplo concreto es la confusión de términos legales entre países hispanohablantes. La legislación laboral de Argentina no es la de México ni la de España. Pero para un modelo entrenado mayoritariamente en inglés, «derecho laboral español» es una categoría vaga que produce respuestas aproximadas y a veces peligrosas.
Los sesgos que sobran
Aranda señala dos tipos de sesgo particularmente problemáticos:
- Sesgos culturales. Los modelos asumen contextos culturales implícitos que no son universales. Un modelo que sugiere «celebrar con una barbacoa» como actividad de equipo ignora que en muchas culturas hispanas eso no es una referencia cultural compartida. Un modelo que asume estructuras familiares nucleares occidentales produce recomendaciones inapropiadas para contextos familiares extendidos comunes en América Latina.
- Sesgos económicos. Las herramientas de IA se diseñan para usuarios con acceso a tecnología de gama alta, conexión estable y alfabetización digital avanzada. Recomiendan aplicaciones de pago, asumen disponibilidad de dispositivos modernos y ignoran las restricciones de datos móviles que son realidad en gran parte del mundo hispanohablante.
El problema no es que los modelos sean maliciosos. Es que fueron construidos por equipos demográficamente homogéneos, entrenados con datos demográficamente sesgados, y evaluados con métricas que no miden equidad cultural.
La ilusión de la neutralidad
Una creencia extendida entre usuarios de IA es que los modelos son neutrales porque son «matemáticos». Nada más lejos de la realidad. Cada decisión de entrenamiento —qué datos incluir, qué datos excluir, qué respuestas premiar, qué respuestas penalizar— introduce valores humanos. La neutralidad es una ilusión comercial, no una propiedad técnica.
The Verge documentó recientemente cómo los modelos de ilustración generativa reproducen estereotipos visuales arraigados, desde la representación racial hasta la estética occidental dominante. Otros reportajes han mostrado cómo los modelos de compañía emocional (AI companions) refuerzan expectativas de género tradicionales en sus interacciones. Y en el ámbito geopolítico, investigaciones han revelado cómo la IA generativa puede amplificar campañas de propaganda cuando se entrena con corpus de noticias sesgados.
Todo esto son manifestaciones del mismo problema: la IA refleja al mundo que la creó, no al mundo que pretende servir.
Las soluciones que no llegan
Varias iniciativas intentan mitigar el problema. Anthropic incluye módulos de seguridad y alineación. OpenAI ha diversificado parcialmente sus equipos de evaluación. Google ha invertido en corpus multilingües. Pero ninguna de estas medidas aborda la raíz: la desproporción demográfica en quienes construyen, entrenan y evalúan los sistemas.
La «calle» que Aranda menciona no se adquiere con más datos. Se adquiere con más diversidad en los equipos que deciden qué datos importan, con evaluadores que hablen español nativo, con testers que vivan en contextos culturales no occidentales, con métricas que midan rendimiento en barrios, no solo en benchmarks académicos.
Qué significa para el hispanohablante
Para un usuario de IA en español, los sesgos no son abstractos. Son frustraciones concretas: modelos que no entienden modismos, que confunden registros formales e informales, que producen textos que suenan traducidos en lugar de escritos. Son también riesgos: modelos médicos que no entienden denominaciones farmacéuticas locales, modelos legales que confunden jurisdicciones, modelos educativos que asumen recursos inexistentes.
La denuncia de Aranda no es un lamento. Es una llamada a la acción: la IA no será realmente global hasta que deje de ser un producto occidental con traducción incluida. La inclusión de diversidad lingüística y cultural en el desarrollo de la IA no solo es una cuestión de justicia, sino también de funcionalidad y precisión. La industria de la IA debe escuchar la voz de expertos como Aranda y trabajar hacia una IA más inclusiva y global, capaz de servir a todas las culturas y comunidades del mundo.
Análisis profundo
El problema de los sesgos en la IA es complejo y multifacético. Requiere un enfoque integral que aborde no solo la diversidad en los datos de entrenamiento, sino también la diversidad en los equipos de desarrollo y evaluación. La industria de la IA debe reconocer que la neutralidad no es una propiedad inherente de los modelos, sino una ilusión que puede ser peligrosa.
La solución no es simplemente agregar más datos o diversificar los equipos, sino cambiar la forma en que se desarrollan y evalúan los modelos de IA. Se necesitan métricas que midan la equidad cultural y la precisión en diferentes contextos, así como la inclusión de voces y perspectivas diversas en el proceso de desarrollo.
La denuncia de Aranda es un llamado a la acción para la industria de la IA. Es hora de reconocer que la IA no es solo una herramienta tecnológica, sino también una herramienta social y cultural que debe ser desarrollada y utilizada de manera responsable y ética.
Conclusión
En conclusión, el problema de los sesgos en la IA es un problema sistémico que requiere un enfoque integral y multifacético. La industria de la IA debe reconocer la importancia de la diversidad y la inclusión en el desarrollo de los modelos de IA, y trabajar hacia una IA más global y más justa. La denuncia de Aranda es un llamado a la acción para que la industria de la IA cambie su enfoque y trabaje hacia una IA que sirva a todas las culturas y comunidades del mundo.
