歐拉影片放大技術研究_Eulerian Video Magnification, EVM_捕捉影片中肉眼看不見的微小變化(工業設備異常檢測?)
你是否想過,一段看起來靜止的普通影片,其實可能藏著人眼難以察覺的脈搏、心跳、呼吸、機械震動或結構晃動?有沒有辦法透過非接觸式的訊號捕抓這些肉眼看不明顯的微小震動方案呢?
Eulerian Video Magnification,簡稱 EVM,中文常譯為歐拉影像放大或歐拉影片放大,正是一種用來把影片中微小變化「放大到看得見」的電腦視覺技術。
MIT CSAIL 的研究團隊在 2012 年 SIGGRAPH 發表了經典論文
Eulerian Video Magnification for Revealing Subtle Changes in the World
Eulerian Video Magnification for Revealing Subtle Changes in the World
目標是揭露普通影片中肉眼難以看見的時間變化。
什麼是歐拉影像放大?
歐拉影像放大的核心概念很直覺:輸入一段普通影片,先對每一幀影像做空間分解,再針對時間軸上的像素變化做濾波,最後把特定頻率範圍內的微小變化放大,讓原本看不見的變化變得明顯。MIT 專案頁明確說明,這個方法會對影片做 spatial decomposition、temporal filtering,然後將訊號放大以揭露隱藏資訊。
簡單而言,EVM 並非傳統物件追蹤那樣一路追著某個點跑,而是站在固定影像位置上,觀察每個像素或區域隨時間產生的顏色、亮度或相位變化。這也是它被稱為「Eulerian」的原因:它借用了流體力學中 Eulerian perspective 的觀念,也就是在固定位置觀察變化,而不是跟著物體移動的 Lagrangian perspective。
它能看見哪些原本看不見的東西?
最經典的案例是人臉脈搏。當血液流經臉部時,皮膚顏色會產生非常細微的週期性變化,人眼通常無法直接察覺,但 EVM 可以將這些變化放大,使臉部血流造成的顏色變化變得可視化。
2012 年的原始 EVM 常被稱為 linear EVM,適合用來放大顏色變化與小幅度運動。
後續 MIT 團隊在 2013 年 SIGGRAPH 發表 Phase-Based Video Motion Processing,改用 complex-valued steerable pyramid 中的相位變化來描述運動。該研究指出,相較於先前的 Eulerian Video Magnification,phase-based 方法可以支援更大的放大倍率,而且對雜訊較不敏感。
較典型的2012年版本演算法流程
Step1.將影片影格轉為 YIQ 色彩空間
Step2.對每個影格取得單一高斯金字塔層級
Step3.進行時間帶通濾波以取得心率頻段 0.83–1.0 Hz(視不同應用情況來設置,在此指心率)
Step4.放大已濾波的金字塔層級
Step5.將放大的金字塔層級加回原始影格
Step6.轉回 RGB 色彩空間
近期由於IRB狀況非接觸式生理資訊收集研究議題變更少了
有一些趨勢開始往工業設備異常檢測發展
Research on Rotating Machinery Fault Diagnosis Based on an Improved Eulerian Video Motion Magnification
Video-based diagnosis of a rolling element bearing using a high-speed camera: Feedback on the Survishno 2023 conference contest
Mechanical Systems and Signal Processing Volume 230, 1 May 2025, 112601
Survishno 2023 contest data files
Ref:
https://medium.com/@itberrios6/how-to-detect-heart-rate-in-videos-3dbbf1eb62fd
留言
張貼留言