007 Классификация изображений. Часть 2. VGG (VGG-16, VGG-19, VGG-16_bn)

 

А мы продолжаем знакомиться с популярными архитектурами нейронных сетей для задачи классификации. На очереди очень интересная сеть – VGG. В 2014 году на конкурсе по распознаванию изображений ImageNet эта модель заняла первое место. При этом ошибка была снижена до 7.3%. Архитектурно сеть VGG выглядит очень изящно. В дальнейшем эта сеть начала использоваться для других задач компьютерного зрения, например для задачи сегментации. В этом видео мы разберёмся с архитектурой VGG. А также обучим модель для распознавания техники из датасета Арма. Ошибки в коде: В файле train.py в строке 213 (в видео 6:23) необходимо вместо filename написать best_filename. Так будет сохраняться лучшая модель. Ошибка не повлияла на полученные результаты, так как из-за сильной регуляризации модель не переобучилась, о чём свидетельствуют равные значения точности train и val. Таймкоды: 00:00 | Введение 00:37 | Кратко о создании и создателях 03:22 | Архитектура VGG (VGG-16) 05:33 | VGG-16 и 224 пикселя изображения. Обучаем и тестируем. 11:57 | Архитектура VGG в Netron 12:35 | VGG-19 и 224 пикселя изображения. Обучаем и тестируем. 17:19 | VGG-19 и 600 пикселя изображения. Обучаем и тестируем. 23:28 | Какие есть архитектуры VGG. Batch Normalization. 24:36 | VGG-16_bn и 224 пикселя изображения. Обучаем и тестируем.