APPZYFY
Módulo 3advanced
🎯

Laboratorio de Detección de Objetos

60 min
1

Entender predicciones de cajas delimitadoras

2

Aprender fundamentos de arquitectura YOLO

3

Dominar conceptos de IoU y NMS

4

Aplicar detección de objetos a imágenes

Playground de Detección de Objetos

Aprende YOLO, R-CNN, bounding boxes, IoU y NMS

Guía de Aprendizaje

Intermedio⏱️ 30 min

Elige tu estilo de aprendizaje

¿Qué Hace?

Demuestra regresión de cajas delimitadoras y NMS. Cubre enfoques basados en anclas (Faster R-CNN) y sin anclas (YOLO, FCOS). Muestra métricas IoU, puntuación de confianza, clasificación multi-clase sobre ubicaciones espaciales.

¿Cómo Funciona?

  1. 1Dos etapas (Faster R-CNN): (1) Red de Propuesta de Regiones genera propuestas, (2) RoI pooling + clasificación
  2. 2Una etapa (YOLO): detección basada en cuadrícula, cada celda predice (x,y,w,h,conf,probs_clase)
  3. 3Codificación de caja delimitadora: Δx = (x-x_ancla)/w_ancla, Δy similar, Δw = log(w/w_ancla)
  4. 4Loss = L_loc (L1 suave en coords de caja) + L_conf (focal loss) + L_cls (cross-entropy)
  5. 5NMS: ordenar por confianza, suprimir cajas con IoU > umbral (0.5 típico)
  6. 6Métricas: mAP (Precisión Promedio media), umbrales IoU 0.5:0.95

Analogía Simple

Detección de objetos = localización (¿dónde?) + clasificación (¿qué?). Anclas son plantillas de cajas delimitadoras previas. NMS elimina detecciones duplicadas mediante supresión greedy.

Concepto Clave

Dos etapas: preciso pero lento (5-20 FPS). Una etapa: rápido pero menos preciso (30-150 FPS). Transformers modernos (DETR): predicción basada en conjuntos, no necesita NMS. Trade-off: velocidad vs accuracy.

Conceptos Fundamentales

IoU (Intersección sobre Unión)

Mide superposición de cajas: IoU = Área(superposición) / Área(unión). IoU > 0.5 = buena detección. Usado en NMS y mAP.

Supresión No Máxima

Remueve cajas duplicadas. Mantener caja de mayor confianza, suprimir otras con IoU > 0.5. Previene múltiples detecciones del mismo objeto.

Cajas Ancla

Plantillas de cajas pre-definidas (varias escalas/relaciones de aspecto). Modelo predice ajustes de offset. Faster R-CNN usa 9 anclas por ubicación.

Aplicaciones del Mundo Real

🚗
Autos Autónomos

Detectar peatones, vehículos, señales de tráfico, marcas de carril. Detección en tiempo real (30 FPS) en hardware edge (Nvidia Jetson).

🏥
Imagenología Médica

Detectar tumores, lesiones, anormalidades en rayos X/tomografías. Asiste radiólogos con tamizaje automatizado.

📹
Vigilancia por Video

Rastrear personas, detectar intrusiones, contar multitudes. Usado en sistemas de seguridad, analítica de retail.

Pruébalo Tú Mismo

Experimento de Umbral NMS

Umbral IoU 0.3 = supresión agresiva (menos cajas). IoU 0.7 = leniencia (más cajas). Ajustar según densidad de objetos.

Umbral de Confianza

Umbral 0.5 = balanceado. 0.8 = alta precisión, bajo recall. 0.3 = alto recall, baja precisión (muchos falsos positivos).

Errores Comunes a Evitar

Sin NMS → detecciones duplicadas

¿Por Qué? Mismo objeto detectado múltiples veces. Siempre aplica NMS con umbral IoU 0.4-0.6.

Escalas de ancla incorrectas

¿Por Qué? Anclas deben coincidir con tamaños de objetos en dataset. Analiza estadísticas de dataset (anchos/altos de cajas) para diseñar anclas.

Street Scene
car 95%
person 88%

Instrucciones

  • 1. Selecciona una imagen de muestra
  • 2. Elige una clase y dibuja cajas haciendo clic y arrastrando
  • 3. Ajusta el umbral de confianza para filtrar detecciones
  • 4. Habilita NMS para eliminar cajas duplicadas
  • 5. Compara tus cajas con ground truth (verde = correcto)

Estadísticas de Detección

Cajas Totales

0

Después de NMS

0

IoU Promedio con GT

0.00

Arquitectura YOLO

YOLO divide imagen en grilla SxS. Cada celda predice B bounding boxes con (x,y,w,h,confianza,clase). Usa anchor boxes para diferentes formas de objetos.

IoU (Intersection over Union)

IoU = Área de Superposición / Área de Unión. IoU > 0.5 = buena detección, IoU > 0.7 = excelente.

NMS (Non-Maximum Suppression)

NMS elimina detecciones duplicadas: ordenar por confianza → mantener más alta → eliminar cajas superpuestas si IoU > umbral → repetir.

Score de Confianza

Probabilidad de que caja contenga objeto × precisión de ubicación. Mayor = más certeza.