使用Pytorch實作RCNN_何謂IoU?何謂SelectiveSearch?
https://medium.com/nerd-for-tech/research-summary-object-detection-upto-fast-rcnn-43d5944f4f6f RCNN (Regions with CNN features) 首先輸入一張影像 後續透過SelectiveSearch生成一些候選框Region proposals(至多2000個) warped region=>主要是影像預處理,可能作揖些縮放到同樣大小的處理。 當時論文採用的是VGG16方式來對2000個框做特徵提取,依此十分耗時。 最終做分類則是採用SVM 而Bounding-box部分採用回歸方式處理 平均一張影像在Nvidia K40 GPU要耗費47秒 https://github.com/ChouSamuel/Pytorch-RCNN-/blob/main/RCNN%E5%AF%A6%E4%BD%9C.ipynb