Visualizar mapas de características CNN
Entender aprendizaje jerárquico de características
Aprender operaciones de pooling
Ver cómo las CNNs construyen comprensión de imágenes
Explora cómo las redes convolucionales aprenden
Visualiza kernels convolucionales y mapas de features a través de capas CNN. Demuestra extracción jerárquica de features: capas tempranas detectan bordes/texturas, capas profundas detectan patrones semánticos. Muestra efectos de pooling, stride, padding en dimensiones espaciales.
Cada filtro es un detector de patrones. Kernel detector de bordes [[-1,0,1]] responde fuerte a bordes verticales. Apilar capas construye jerarquía composicional: bordes → texturas → partes → objetos.
CNNs aprenden jerarquías espaciales mediante weight sharing (mismo filtro en imagen) y conectividad local (campos receptivos). Eficiente en parámetros vs fully-connected: conv 3x3 con 64 filtros = 64×9 = 576 params, FC = 224×224×64 = 3.2M params.
Stride=1: escaneo denso. Stride=2: downsampling 50%. Padding="same": tamaño salida = tamaño entrada. Padding="valid": sin padding, tamaño reduce.
Max: mantiene activación más fuerte (invariancia de traslación). Avg: más suave, menos agresivo. Max pooling dominante en CNNs modernas.
Región de entrada que influencia una neurona de salida. Crece con profundidad: conv 3×3 apilada 3 veces → campo receptivo 7×7.
ImageNet (AlexNet 2012): 1000 categorías, 60M params, 15% error. CNNs modernas: 3% error (superhumano).
Detectar tumores en rayos X/MRIs. CNNs igualan accuracy de radiólogo, asisten diagnóstico.
Detección de carriles, reconocimiento de peatones, clasificación de señales de tráfico. CNNs en tiempo real procesan 30 FPS.
Aplica filtro Sobel (detección bordes): horizontal [-1,0,1], vertical [-1;0;1]. Ve bordes iluminarse.
Max-pool con ventana 2×2, stride=2. Imagen se encoge 2x, features más fuertes preservadas.
❌ Pooling demasiado agresivo
¿Por Qué? Pierde información espacial. Usa convoluciones con stride en vez de pooling para arquitecturas modernas.
❌ Olvidar padding
¿Por Qué? Salida se encoge rápido, pierde información de borde. Usa padding="same" para preservar dims espaciales.