EL PROFE TE ENSEÑA

Inteligencia Artificial, ML y DML

(Redes Neuronales)

Publicado originalmente en Revista Resorte Nº 1 — Marzo 2025

Leyendo artículos técnicos (e incluso materiales no tan técnicos) nos encontramos día a día con alguna de estas siglas. IA (Inteligencia Artificial), o en inglés AI; ML, DML. ML y DML contienen las siglas Machine Learning (traducido libremente: Máquinas que aprenden). La D en DML viene de “Deep” (profundo). Máquinas que aprenden basadas en redes neuronales profundas. Ya veremos a qué se refiere la “profundidad”.

Ejemplos de aplicaciones que utilizan IA: chat bots inteligentes como ChatGPT, generación de imágenes y videos como DALL-E o Stable Diffusion, incluso consejos sobre qué serie de TV ver, basados en nuestras elecciones anteriores; y miles de aplicaciones más. La IA ha penetrado en numerosos aspectos de nuestras vidas y hasta parece que “está de moda”.

Pero las modas no ocurren sólo en la vestimenta. También en la ciencia y la tecnología hay tendencias. Y, como toda moda, a veces se exagera. Sin embargo, incluso las modas tienen una razón de ser. La tendencia actual de la IA y el aprendizaje profundo no es un capricho: responde a avances reales y a una evolución tecnológica que llevaba tiempo gestándose.

En esta serie de artículos les contaré los fundamentos de IA, ML y DML, y también por qué se han puesto "de moda". Como decía el Dire: “Chi labora, vinci”. El que trabaja, triunfa. El trabajo es aún más productivo, interesante y mejor remunerado cuando viene acompañado de estudios. Así que, ¡fuerza y a aprender!

Sé que al principio puede parecer un poco aburrido—tenemos que arrancar con algunas definiciones básicas—pero no se preocupen, en pocos tiempo pasaremos a ejemplos más concretos. Teoría, pero también aplicaciones.

Un consejo: No olviden prestar atención a los recuadritos que acompañan estas notas. En ellos encontrarán hitos históricos y definiciones adicionales sobre la tan mentada IA.

Resorte y el Profe bromean sobre IA

MODELO DE NEURONA (fig. 1) y RED NEURONAL (fig. 2)

Un modelo simplificado de una neurona artificial, conectada a otras neuronas, funciona así:

  • La neurona recibe información de otras neuronas (0 = inactiva, 1 = activa).
  • Cada entrada tiene un peso que representa su importancia.
  • Se suman las entradas ponderadas y, si superan un umbral, la neurona se activa.

Aclaremos desde ya que éste es un modelo muy simplificado. En el cerebro, una entrada débil pero sostenida puede activar la neurona; ese comportamiento no se refleja en la mayoría de los modelos básicos de redes neuronales artificiales.

Esta manera de funcionar de la neurona artificial es similar acomo podrías elegir un bar para ir con tus amigos. Vas preguntando a cada uno si quiere y si el total es, digamos, mayor a la mitad, la decisión es aceptada. Por otra parte, puede ser que si tu mejor amigo acepta ir, su voto pese el doble para tí que el voto del resto de tus amigos.

Las entradas y salidas de las neuronas pueden tomar valores binarios como 0/1 y los pesos tomar un rango (p. ej., 0–255). En aplicaciones reales existen distintas combinaciones: desde casos donde tanto las entradas y salidas como los parámetros son exclusivamente 0 y 1, pasando por configuraciones que usan números enteros (en un cierto rango), y hasta números reales.

Evolución y revoluciones de la IA

Los pioneros de la computación, como Alan Turing y Marvin Minsky, ya imaginaban la IA a mediados del siglo pasado. A lo largo de los años, se realizaron diversos intentos para imitar cómo piensa el ser humano (sistemas expertos, lógica fuzzy) que aún se utilizan hoy.

Machine Learning (ML) propuso utilizar una estrategia diferente: en lugar de intentar imitar cómo razonamos, se propuso emular la manera en cómo aprendemos. Hace poco más de una década llegó el Deep Machine Learning (DML), con redes profundas que aprenden de cantidades astronómicas de datos. Ejemplo: se estima que toda la Wikipedia (~100 GB) fue menos del 10% de los datos de entrenamiento de ChatGPT.

¿Por qué “Inteligencia Artificial”?

El término lo acuñó John McCarthy. Aunque “artificial” puede sonar a falsedad, se usó en contraposición a la inteligencia natural de los seres vivos. El nombre prendió y quedó.

La base de datos MNIST (fig. 3)

Para aprender se necesitan datos. MNIST es una base icónica: 70 000 imágenes en escala de grises (28×28 px) de dígitos escritos a mano (0–9).

Nació para clasificar correo por Código Postal. Hoy es estándar porque:

  • Es simple (poco preprocesamiento).
  • Sirve de referencia común entre algoritmos.
  • Es trampolín a problemas más complejos (CIFAR-10, ImageNet).

¡Esto es todo por hoy! En la próxima entrega seguimos con MNIST, ML y DML y se aclaran esa y otras dudas.


Únete a nuestro grupo en Facebook: La página web de Resorte