Image Caption可應用的不同生活情境_論文研究Idea與可利用的公開資料集探討_車損拍照產生理賠報告/室內照產生房屋描述(裝修前後驗收、格局敘述)
Image Caption可應用的不同生活情境,其實除了在盲人輔助生活以外應用,根據文獻回顧可以發掘只要工作模式涉及這類既定模式「拍照後有需要寫報告」,基本上都還滿容易能夠被應用的。 而研究過程中最麻煩也是讓人擔憂的問題就在於資料來源易取得性,此外對於IRB的問題有點困難,加上無醫學背景就不探討醫療報告生成這部分資料集應用範疇。 1.汽車損傷拍照到快速理賠,產生車損理賠報告。 應用自動車輛損傷檢測與在汽車保險業引起了極大的關注。 Vehicle Damage Detection Using Artificial Intelligence: A Systematic Literature Review https://wires.onlinelibrary.wiley.com/doi/10.1002/widm.70027 CarDD: A New Dataset for Vision-based Car Damage Detection https://cardd-ustc.github.io/ https://github.com/harpreetsahota204/car_dd_dataset_workshop CarDD 包含 4,000 張高解析度的車輛損傷影像,具有超過 9,000 個經良好註記的六類損傷實例(範例如圖 1 所示),但預設該資料集並沒有對應理賠或車損文字描述,因此對應文字敘述的前置準備是大工程。 https://cardd-ustc.github.io/docs/CarDD.pdf Coco Car Damage Detection Dataset https://www.kaggle.com/datasets/lplenka/coco-car-damage-detection-dataset 根據過往研究論文主要會和特定保險公司合作,並且理賠內容都比較沒對外公開。在Kaggle上有人曾利用BLIP 模型為 CarDD 資料集生成了對應的 Captions,並以 COCO 格式標註。這直接解決了 CarDD 缺乏文字描述的問題。 Blip for Captioning Car Damage https://www.kaggle.com/datasets/gabrielfcarvalho/blip-for-captioning-car-dama...