國立交通大學_電控工程研究所_應用於機器人之基於影像人員活動偵測_論文研讀心得

本次閱讀的論文


內容分享有些是摘由
指導教授:宋開泰 博士、羅佩禎 博士
研 究 生:陳維峻 的論文

應用於機器人之基於影像人員活動偵測
Image-Based Human Activity Detection for Robotic Applications


===============================================================

分為  三階段

---->(1)人員偵測---->(2)姿態辨識 ---->(3)活動偵測


這裡我要對於

人員偵測部分  做些閱讀內容分享

當時研究生 陳維峻學長是
採用方向梯度直方圖(Histogram of Oriented Gradient, HOG)
做為特徵,搭配支持向量機(Support Vector Machine, SVM)分類器來完成人員偵測階段。

Dalal 和 Triggs

提出利用方向梯度直方圖
(Histogram of Oriented Gradient, HOG) 來萃取人體特徵,
此特徵是一種利用邊緣資訊做為特徵,

但特別的是 HOG 是利用局部的特徵向量強度方向
做統計,故有較高的準確率


在人員的姿態辨識上,大略分成三種方法:

基於移動歷史影像法(Motion History Image, MHI)

基於輪廓(Silhouettes-based)

與基於隱藏式馬可夫模型法(Hidden Markov Model, HMM)

====================================================================

Davis提出了移動歷史影像(Motion History Image, MHI)

去識別人類的動作,它是基於移動歷史影像之辨識,

藉由匹配基於瞬間的特徵來統計以達成辨識,
把當時該點變化的持續時間給記錄下來,
但 MHI會容易受到雜訊物件動作的時間間隔影響


當時的他為了要去做人體活動偵測,所以必須要先得知影像中人體的姿態及位置

所以首當其衝的問題就是  ,  要去判斷是否有人在畫面中!!!!

利用影像來偵測人是否存在畫面中是一項挑戰,

因為人有很多不一樣的姿態且環境中存在著許多複雜背景和多變的光線。


Dalal 和 Triggs
提出利用方向梯度直方圖
(Histogram of Oriented Gradient, HOG) 來萃取人體特徵,
再透過
線性支持向量機(Linear Support Vector Machine, LSVM)的方式

去辨識是否為人







當時第一階段研究的架構圖

人員偵測架構圖









Histogram of Oriented Gradient 特徵萃取




首先,先在靜止畫面中存取一張背景圖片,
再將之後得到的連續影像與此背景圖片做影像相減,
可以得到二值化的移動物體前景







接著對此張前景圖做水平方向及垂直方向的影像投影,
可以得到初始的辨識區域

Xtart1、Xend1、
Xstart2、Xend2、

Ystart1 和 Yend1


第一次的影像投影 


但由於在畫面中可能同時出現兩個以上的移動物體,
若只做一次的投影框選區域Ystart1及 Yend1 
會選最高及最低的部份,
就會造成個別的框選區域有留白的情況



所以他們當時對各框選區域再做一次垂直方向的投影來分出
 Ystart1、Yend1、
Ystart2 及 Yend2

最後就找出
目標物一的( Xstart1,Ystart1 )、( Xend1,Yend1)  跟
目標物二的( Xstart2,Ystart2 ) 、( Xend2,Yend2 )


第二次的影像投影







由於要取出的欲辨識區塊的大小都是不固定的,
這邊所使用的 HOG 特徵萃取方式必須要使最終特徵向量的維度相等,
在這邊要將所有的辨識區塊正規化成相同的辨識視窗大小








留言

這個網誌中的熱門文章

何謂淨重(Net Weight)、皮重(Tare Weight)與毛重(Gross Weight)

Architecture(架構) 和 Framework(框架) 有何不同?_軟體設計前的事前規劃的藍圖概念

經得起原始碼資安弱點掃描的程式設計習慣培養(五)_Missing HSTS Header