¿Cómo funciona la IA?

IA Generador de Documentos Jon AI
de Stélio Inácio, fundador de Jon AI y especialista en IA

¿Cómo funciona realmente la IA? No es magia, se parece más a la jardinería

En la última lección, aprendimos que la IA consiste en construir máquinas que puedan pensar. Pero, ¿cómo puede una máquina, una cosa hecha de metal y silicio, «aprender» realmente a hacer cosas como reconocer tu rostro o traducir un idioma? No es magia y no se trata de una persona escondida dentro del ordenador. La respuesta es sorprendentemente elegante: la IA aprende observando innumerables ejemplos.

Imagina que le estás enseñando a un niño pequeño la diferencia entre un gato y un perro. No escribas una larga lista de reglas como: «Si tiene orejas y bigotes puntiagudos y una cola larga, es un gato». ¿Por qué? Porque algunos gatos tienen las orejas dobladas y algunos perros tienen bigotes. ¡Es demasiado complejo!

En vez de eso, simplemente muéstrales imágenes. «Esto es un gato». «Esto es un perro». «Aquí hay otro gato». Una y otra vez. Con el tiempo, el cerebro del niño comienza a descifrar los patrones por sí solo. Forman sus propias «reglas» difusas e intuitivas sobre lo que hace que un gato sea un gato.

La IA moderna funciona de forma muy similar, pero a escala cósmica. En lugar de una docena de imágenes, podría aprender de millones. Y su «cerebro» es una estructura matemática llamada red neuronal, que se inspira vagamente en la red de neuronas de nuestras propias cabezas.

Ayuda visual: un vistazo al interior del «cerebro» de la IA

Este diagrama muestra una red neuronal simplificada. Considéralo el proceso de pensamiento de la IA, que se mueve de izquierda a derecha. Toma la información, la procesa en el medio y proporciona una respuesta final.

Diagrama de una red neuronal que muestra una capa de entrada, varias capas ocultas y una capa de salida.
Una red neuronal procesa la información en capas, desde los datos iniciales (entrada) hasta una decisión final (salida).

De los píxeles a «conocer» a un gato

Entonces, sigamos la imagen de un gato a través de la red neuronal del diagrama anterior para entender cómo la IA «sabe» lo que ve. Esto nos lleva al meollo de la forma en que una IA adquiere conocimiento.

1. La capa de entrada (los «ojos»)

En primer lugar, la imagen se divide en sus elementos más básicos: píxeles. Cada pequeño punto de color de la imagen se convierte en un número. Estos números se introducen en la primera capa de la red, la capa de entrada. Esta capa no piensa en nada; simplemente «ve» los datos sin procesar.

2. Las capas ocultas (el «pensamiento» ocurre aquí)

Aquí es donde ocurre la verdadera magia. La información de los píxeles fluye a través de varias capas «ocultas». Cada capa está formada por «neuronas» digitales que buscan cosas específicas. Es un poco como una cadena de montaje de especialistas:

  • Es posible que la primera capa oculta solo busque cosas muy simples. Una neurona podría estar entrenada para detectar un borde vertical. Otra podría activarse si ve una mancha de color marrón. Un tercero podría buscar una curva simple. Su trabajo es básico, como reconocer piezas individuales de LEGO.
  • La segunda capa oculta recibe los resultados de la primera. No puede ver los píxeles originales. Su función consiste en buscar combinaciones de las características simples que encuentra la capa anterior. Hace preguntas como: «¿Veo una curva conectada a un borde vertical? Podría tener la forma de una oreja» o «¿Veo dos pequeñas manchas oscuras cerca una de la otra? Podrían ser un par de ojos». Está empezando a ensamblar los ladrillos en pequeñas estructuras.
  • Las capas ocultas posteriores continúan este proceso, basándose en el trabajo de las anteriores. Buscan combinaciones aún más complejas: «Veo dos orejas puntiagudas, una forma de nariz y una forma de bigote juntas. ¡Eso empieza a parecerse mucho a la cara de un gato!»

Cada conexión entre neuronas tiene un «peso» o un parámetro. Piensa en esto como en lo importante que es esa característica. Durante el entrenamiento, si la IA identifica correctamente a un gato, se fortalecen todas las conexiones que condujeron a la respuesta correcta (como las de los «bigotes» y las «orejas puntiagudas»). Cuando se equivoca, esas conexiones se debilitan. Tras ver millones de fotos de perros y gatos, la red ha ajustado sus parámetros para saber con exactitud qué combinación de características es lo que dice «¡CAT!»

3. La capa de salida (la respuesta final)

Finalmente, después de pasar por todas las capas ocultas, llegamos a la capa de salida. Esta capa sopesa todas las pruebas que se le presentan («se ha detectado una cara de gato con un 95% de confianza», «se han detectado las patas con un 88% de confianza», «se han detectado orejas de perro flojas con solo un 5% de confianza») y toma la decisión final. Puede tener dos neuronas de salida: una para «gato» y otra para «perro». Según todas las pruebas, es muy probable que la neurona del «gato» se encienda, y la respuesta final es: «Estoy seguro al 99% de que es un gato».

Definición: aprendizaje profundo

Este método de utilizar una red neuronal con muchas capas (es decir, capas «profundas») para aprender de los datos se denomina aprendizaje profundo. Es el potente motor detrás de la IA más impresionante que vemos hoy en día, desde ChatGPT hasta la IA, que puede generar imágenes realistas a partir de una simple descripción textual.

Comprobación rápida

¿Cómo aprende una IA de aprendizaje profundo a identificar a un gato en una foto?

Resumen: ¿Cómo funciona la IA?

Lo que cubrimos:
  • La IA aprende a partir de enormes cantidades de datos de ejemplo, de forma similar a como aprende un niño.
  • El «cerebro» de muchas IA modernas es una red neuronal inspirada en el cerebro humano.
  • La información se procesa en capas: desde los datos sin procesar (entrada), pasando por capas ocultas que reconocen patrones cada vez más complejos, hasta una decisión final (salida).
  • Este enfoque de múltiples niveles se denomina «aprendizaje profundo» y es el motor que sustenta la IA más capaz de la actualidad.

Por qué es importante:
  • Comprender este proceso estratificado demuestra que la IA no está «pensando» en un sentido humano. Se trata de un sofisticado sistema de coincidencia de patrones. Esto nos ayuda a comprender tanto sus increíbles capacidades como sus limitaciones.

A continuación:
  • Hemos visto que el «cerebro» de la IA está inspirado en el nuestro. Esto nos lleva a una pregunta fascinante que abordaremos en la siguiente lección: ¿la IA está «consciente» o «viva»?