圖像描述/影像自動語義生成 (Image Captioning)看圖說故事_V2L問題(Visual-to-Language)
https://www.oreilly.com/library/view/deep-learning-for/9781788295628/89def52b-a455-4a2f-b51e-23b74e154bd0.xhtml
Image captioning is the task of describing the image with text
圖像描述主要應用十分多領域
- 從醫學影像產生臨床報告
- 旅遊照之情感分析與自動撰寫評論
- 影片摘要
- 視覺問答
國內各大院校研究論文
國立交通大學-資訊學院資訊學程/深度學習–旅遊照之情感分析與自動撰寫評論(2019)
國立中山大學-電機工程學系研究所/基於 Transformer 具領域外泛化能力之影像標題生成(2021)
國立成功大學-資訊工程學系/基於模態轉換和大型語言模型的視覺問答(2023)
大同大學/資訊工程學系/利用數種深度學習搭配注意力機制對胸腔X光照做醫療報告生成(2023)
朝陽科技大學-營建工程系/工地影像字幕生成技術初探-以工地危害描述為例(2024)
國立臺灣科技大學-工業管理系/結合圖片描述技術與影片標題於影片摘要預測之應用(2024)
國立清華大學-資訊系統與應用研究所/使用基於圖形的深度轉換器與大型語言模型來從醫學影像產生臨床報告(2024)
Image Captioning in news report scenario
Mitigating Gender Bias in Natural Language Processing: Literature Review
Patch Matters: Training-free Fine-grained Image Caption Enhancement via Local Perception
Deep Learning Image Captioning Technology for Business Applications
Automatic image captioning in Thai for house defect using a deep learning-based approach
(運用深度學習方法自動生成泰語房屋缺陷影像說明)
A deep learning-based image captioning method to automatically generate comprehensive explanations of bridge damage(一種基於深度學習的影像標註方法,可自動生成橋樑損壞的全面解釋)
Empirical Study of Image Captioning Models Using Various Deep Learning Encoders
Experimenting Encoder-Decoder Architecture for Visual Image Captioning
Image Captioning with Multiple Perspectives—A Visual Context-Based Approach
Google相簿自動辨識技術出大包,竟把用戶的黑人朋友標示成大猩猩!
相片辨識出包誤將黑人標成大猩猩,Google火速道歉
將黑人標註為「靈長類動物」 臉書AI功能出包急道歉
Google AI 將黑人識別成「大猩猩」兩年後:就算能識別,也不敢識別了
留言
張貼留言