You are on page 1of 10

neural networks

Zeiler and
Fergus's
work on CNN
architectures
PRESENTED BY ADLAY LEVY
"No hay una comprensión clara de
por qué [CNN] se desempeñan
tan bien, o cómo podrían
mejorarse"

"Todavía hay poca información


sobre el funcionamiento y el
comportamiento internos de estos
modelos complejos, ¿cómo logran
tan buen desempeño?"
EMPLEARON LOS MISMOS DATOS
DE ENTRENAMIENTO DE IMAGENET
2012 Y LOS AUMENTARON,
REDIMENSIONANDO LAS IMÁGENES
La principal diferencia
entre la nueva
implementación y
AlexNet fue el uso de una
GPU única en lugar de
las dos originales.
Utilizaron una técnica de
visualización. Esto les mostró que la
primera y la segunda capas de
AlexNet eran débiles en el rango de
frecuencia espacial media

11 x 11 de stride grande (4 x 4) hasta


un filtro de 5 x 5 con un stride de 1 x 1
14.8%
COMPARACIÓN

ZFNET ERROR-RATING

AxelNet error.rating 15.3%


Llegaron a la
conclusión de que
mantener la
profundidad general
del modelo
arquitectónico, y
realizar cambios
detallados es
importante para
lograr un buen
rendimiento.
Ablation
study
La eliminación progresiva de
capas apunta a revelar qué
capas son críticas para la
arquitectura
CALTECH-101 CALTECH-256
Contiene imágenes de objetos en 101 Contiene imágenes de objetos en 256
categorías, con imágenes 50 por categorías y contiene un total de 30607
categoría, aunque algunas categorías imágenes, es decir, alrededor de 120 por
tienen hasta 800 imágenes. El tamaño de categoría, con un mínimo por categoría
la imagen es 300 x 200 píxeles. de entre 30 y 80.

PASCAL VOC 2012


Contiene 20 clases. Las imágenes pueden
contener varios objetos: los datos de
capacitación / validación tienen 11,530
imágenes que contienen 27,450 objetos.

Conjuntos de Datos
Tuvo un mejor desempeño en los dos
conjuntos de datos Caltech, mientras
que en el conjunto de datos PASCAL,
tuvo un desempeño mucho menor.
Esto se debió a que las imágenes del
conjunto de datos PASCAL pueden
contener múltiples objetos, mientras
que el sistema ZFNet solo proporcionó
una única predicción exclusiva para
cada imagen.

ZFNet

You might also like