圖像描述/影像自動語義生成 (Image Captioning)看圖說故事_V2L問題(Visual-to-Language)

 

https://www.oreilly.com/library/view/deep-learning-for/9781788295628/89def52b-a455-4a2f-b51e-23b74e154bd0.xhtml

Image captioning is the task of describing the image with text

圖像描述主要應用十分多領域
  • 從醫學影像產生臨床報告
  • 旅遊照之情感分析與自動撰寫評論
  • 影片摘要
  • 視覺問答


國內各大院校研究論文
國立交通大學-資訊學院資訊學程/深度學習–旅遊照之情感分析與自動撰寫評論(2019)
國立中山大學-電機工程學系研究所/基於 Transformer 具領域外泛化能力之影像標題生成(2021)
國立成功大學-資訊工程學系/基於模態轉換和大型語言模型的視覺問答(2023)
大同大學/資訊工程學系/利用數種深度學習搭配注意力機制對胸腔X光照做醫療報告生成(2023)
朝陽科技大學-營建工程系/工地影像字幕生成技術初探-以工地危害描述為例(2024)
國立臺灣科技大學-工業管理系/結合圖片描述技術與影片標題於影片摘要預測之應用(2024)
國立清華大學-資訊系統與應用研究所/使用基於圖形的深度轉換器與大型語言模型來從醫學影像產生臨床報告(2024)





留言

這個網誌中的熱門文章

何謂淨重(Net Weight)、皮重(Tare Weight)與毛重(Gross Weight)

(2021年度)駕訓學科筆試準備題庫歸納分析_法規是非題

經得起原始碼資安弱點掃描的程式設計習慣培養(五)_Missing HSTS Header