第25個冬天

發表文章

目前顯示的是有「RCNN」標籤的文章

使用Pytorch實作RCNN_何謂IoU?何謂SelectiveSearch?

- 4月 06, 2026

https://medium.com/nerd-for-tech/research-summary-object-detection-upto-fast-rcnn-43d5944f4f6f RCNN (Regions with CNN features) 首先輸入一張影像後續透過SelectiveSearch生成一些候選框Region proposals(至多2000個) warped region=>主要是影像預處理，可能作揖些縮放到同樣大小的處理。當時論文採用的是VGG16方式來對2000個框做特徵提取，依此十分耗時。最終做分類則是採用SVM 而Bounding-box部分採用回歸方式處理平均一張影像在Nvidia K40 GPU要耗費47秒 https://github.com/ChouSamuel/Pytorch-RCNN-/blob/main/RCNN%E5%AF%A6%E4%BD%9C.ipynb

閱讀完整內容

兩階段目標檢測發展史(R-CNN,Fast R-CNN,Faster R-CNN)

- 3月 28, 2026

在探討RCNN之前可以先大概知道一個目標檢測發展歷史時間軸最早期CNN提出之後，陸續從2014年到2016年雙階段目標檢測的技術陸續被提出。在目標檢測技術的發展歷程中，兩階段式偵測方法是一個很重要的里程碑。它的核心概念是：先找出可能存在目標的區域（Region Proposal），再對這些區域進行分類與邊界框回歸。這類方法的代表模型依序包括 R-CNN、Fast R-CNN、Faster R-CNN，可以看出整體演進方向就是：從準確率提升，逐步走向更高效率與端到端訓練。 https://medium.com/nerd-for-tech/research-summary-object-detection-upto-fast-rcnn-43d5944f4f6f 1. R-CNN（Region-Based CNN）程式實作: 使用Pytorch實作RCNN_何謂IoU?何謂SelectiveSearch? 提出時間：2014 年作者：Ross Girshick 論文名稱: Rich feature hierarchies for accurate object detection and semantic segmentation 論文連結: Rich feature hierarchies for accurate object detection and semantic segmentation(2014初版8頁) www.cv-foundation.org/openaccess/content_cvpr_2014/papers/Girshick_Rich_Feature_Hierarchies_2014_CVPR_paper.pdf Rich feature hierarchies for accurate object detection and semantic segmentation Tech report (v5)(21頁) https://arxiv.org/abs/1311.2524 R-CNN 是早期兩階段目標檢測的重要代表作，首次明確將 Region Proposal（區域提議）的概念引入目標檢測流程中。它先透過 Selective Search 從影像中產生大量大小不一的候選區域(約2000個候選框)，再將每一個候選區...

閱讀完整內容