Entender predicciones de cajas delimitadoras
Aprender fundamentos de arquitectura YOLO
Dominar conceptos de IoU y NMS
Aplicar detección de objetos a imágenes
Aprende YOLO, R-CNN, bounding boxes, IoU y NMS
Demuestra regresión de cajas delimitadoras y NMS. Cubre enfoques basados en anclas (Faster R-CNN) y sin anclas (YOLO, FCOS). Muestra métricas IoU, puntuación de confianza, clasificación multi-clase sobre ubicaciones espaciales.
Detección de objetos = localización (¿dónde?) + clasificación (¿qué?). Anclas son plantillas de cajas delimitadoras previas. NMS elimina detecciones duplicadas mediante supresión greedy.
Dos etapas: preciso pero lento (5-20 FPS). Una etapa: rápido pero menos preciso (30-150 FPS). Transformers modernos (DETR): predicción basada en conjuntos, no necesita NMS. Trade-off: velocidad vs accuracy.
Mide superposición de cajas: IoU = Área(superposición) / Área(unión). IoU > 0.5 = buena detección. Usado en NMS y mAP.
Remueve cajas duplicadas. Mantener caja de mayor confianza, suprimir otras con IoU > 0.5. Previene múltiples detecciones del mismo objeto.
Plantillas de cajas pre-definidas (varias escalas/relaciones de aspecto). Modelo predice ajustes de offset. Faster R-CNN usa 9 anclas por ubicación.
Detectar peatones, vehículos, señales de tráfico, marcas de carril. Detección en tiempo real (30 FPS) en hardware edge (Nvidia Jetson).
Detectar tumores, lesiones, anormalidades en rayos X/tomografías. Asiste radiólogos con tamizaje automatizado.
Rastrear personas, detectar intrusiones, contar multitudes. Usado en sistemas de seguridad, analítica de retail.
Umbral IoU 0.3 = supresión agresiva (menos cajas). IoU 0.7 = leniencia (más cajas). Ajustar según densidad de objetos.
Umbral 0.5 = balanceado. 0.8 = alta precisión, bajo recall. 0.3 = alto recall, baja precisión (muchos falsos positivos).
❌ Sin NMS → detecciones duplicadas
¿Por Qué? Mismo objeto detectado múltiples veces. Siempre aplica NMS con umbral IoU 0.4-0.6.
❌ Escalas de ancla incorrectas
¿Por Qué? Anclas deben coincidir con tamaños de objetos en dataset. Analiza estadísticas de dataset (anchos/altos de cajas) para diseñar anclas.
Instrucciones
Cajas Totales
0
Después de NMS
0
IoU Promedio con GT
0.00
YOLO divide imagen en grilla SxS. Cada celda predice B bounding boxes con (x,y,w,h,confianza,clase). Usa anchor boxes para diferentes formas de objetos.
IoU = Área de Superposición / Área de Unión. IoU > 0.5 = buena detección, IoU > 0.7 = excelente.
NMS elimina detecciones duplicadas: ordenar por confianza → mantener más alta → eliminar cajas superpuestas si IoU > umbral → repetir.
Probabilidad de que caja contenga objeto × precisión de ubicación. Mayor = más certeza.