第25個冬天

發表文章

[論文筆記]Skip-Thought Vectors_將句子或片語(而非單詞)向量化

- 2月 15, 2026

在導讀此篇論文筆記之前，還需要有RNN、LSTM等先備知識。 https://arxiv.org/pdf/1506.06726 Skip-Thoughts 使用跳躍思維模型與 word2vec 相當相似是一種自然語言處理模型，但不是一次將個別單詞轉換為向量。取而代之，將整個句子作為單位轉換為向量。主要理論是去取得一個自然語言語料庫，並找出哪些句子傾向於彼此相鄰出現，然後訓練一個神經網路，使其能預測哪些句子預期會出現在任何其他句子之前或之後。研究問題這項研究試圖解決的核心問題是：如何在這個缺乏標註數據的狀況下，學習出高品質、通用且分佈式的句子表示向量（Distributed Sentence Representations）？在當時，雖然詞向量（Word Vectors）已經能透過非監督學習取得很好的效果，但句子向量的學習大多仍依賴「監督式任務」（Supervised tasks），例如情感分析或邏輯推理。這導致模型學習到的特徵往往只針對特定任務有效，缺乏通用性。雖然 Paragraph Vector 是一種非監督替代方案，但它在測試階段需要進行推論來計算新句子的向量，效率較低。作者希望創造一種「隨取隨用」（off-the-shelf）的編碼器，能將任何句子映射成向量，並直接應用於各種下游任務 Skip-Thought Vectors採用的encoder-decoder結構，會先將輸入句子的單詞序列進行編碼，並依序預測前後文句的單詞作為輸出。通過學習句子與其前後文句之間的共現關係，Skip-thought 能夠獲得句子編碼結果的數值向量(Skip-Thought Vector)，可視為是對單詞向量合成方法本身的學習。研究背景 Skip-thought 是由 Ryan Kiros 等人於 2015 年提出的一種深度學習演算法，用於將文檔中的句子表達轉換為數值向量。該演算法的特點在於採用無監督學習方式，因此在學習過程中無需標籤或註解過的文本。只要存在由有序句子組成的文檔，即可基於此進行學習並建立模型。此篇論文研究的靈感主要來自於詞嵌入模型，但其演算法與 Word2vec 有很大的不同。在 Word2vec(skip-gram)中，主要是透過對輸入詞彙預測其周邊位置的詞彙，來學習詞彙之間的共現關係。從詞到句子：既然 Skip-gram...

閱讀完整內容

啟用Azure學生方案教學步驟

- 1月 23, 2026

填寫學校信箱然後接收驗證 https://azure.microsoft.com/zh-tw/free/students https://it.nycu.edu.tw/it/ch/app/artwebsite/view?module=artwebsite&id=220&serno=40e18628-1dab-411b-8dc0-aab0905d38b2 登入outlook (透過m365的信箱帳號登入) 確認信有收到點連結啟用驗證學生身分結束這一回合此時導入的預設首頁要確認如果概觀仍呈現如下圖，代表你還沒真正啟用100美元扣打以下是正式有起用的概觀首頁預覽畫面此外預設會產生Azure for Students的訂用戶

閱讀完整內容

Decoding Methods for Language Models_Exhaustive search,Greedy Search與Beam Search比較

- 1月 20, 2026

https://medium.com/@shravankoninti/decoding-strategies-of-all-decoder-only-models-gpt-631faa4c449a 語言模型不是只會「算機率」，真正影響輸出品質的是「怎麼選字」基本上分兩模式 Deterministic（確定性）優點:可重現、偏「安全 / 標準答案」，常被應用在法規 / 技術文件。缺點:容易重複、呆板，生成式任務中不夠生動。 Stochastic（隨機性）優點:多樣有創意、輸出不固定缺點:可能胡說、不一致 Sequence-to-Sequence Model for Machine Translation 諸多 NLP 應用（例如機器翻譯、聊天機器人、文本摘要或當前很夯的語言模型）都會產生文字作為輸出。另外，關於圖片說明（image captioning）或自動語音辨識（即語音轉文字）等應用也會輸出文字。所有這些應用在產生最終輸出的步驟中，都會使用以下幾種常用的演算法。以下探討的針對Deterministic模式做比較 1.Exhaustive search(窮舉搜尋) 一種透過確認所有可能的狀況來尋找答案的方法。窮舉所有可能的輸出序列，並在探索所有可能情況的同時，僅保留符合要求的結果。保證能找到解但是效率不高假設我們要用詞彙表 { cold, coffee, I , like , water, <stop>} 生成一個 5 個詞的序列。窮舉搜尋所有可能序列及其對應機率，並輸出機率最高的序列。 I like cold water I like cold coffee coffee coffee coffee coffee I like I like coffee like cold coffee ..... 所以對於每個句子的輸出，其機率將會是 P(x1, x2, x3,…..xn) = P(x1).P(x2/x1), ……….., P(xn/x1, x2, ……xn-1) 我們會在解碼過程中找到所有可能的序列。在每個時間步都會傳入所有的詞彙。如果其中一個範例輸入序列是「I like cold coffee <stop>」上述序列的總機率將等於 P(I) * P(like/I)*P(cold/I,like)*P(coffee...

閱讀完整內容

[論文筆記]CIDEr: Consensus-based Image Description Evaluation

- 1月 20, 2026

https://www.youtube.com/watch?v=pVlcRbfCL6k 年份:2015年期刊:CVPR 論文連結: https://arxiv.org/abs/1411.5726 研究問題當使用自動技術對一幅圖像描述進行評價時，應該與專家的圖像描述一致。常用的一些句子相似度評價度量如基於 BLEU 的機器翻譯評分指標。然而這些方法的結果與人的評價相差很遠。現在介紹的 CIDEr 評估指標則是測量一個句子與一組人為生成真實句子的相似性，可以考慮語法、重點以及精度全部考慮在內。研究背景在自然語言處理中，給定一幅圖像，機器自動生成圖像描述具有廣泛的應用。但是如何評價一個圖像機器生成的描述是非常具有挑戰性。現在介紹如何自動評價一幅圖像描述的品質，即基於共識 (consensus-based) 的評價方法。假如每一幅圖像具有 50 個人工圖像描述，機器生成的圖像描述與這 50 個人工描述進行比較，得到選票多的機器圖像描述為最合適的描述。這種共識方法要求比較候選描述句子與參考描述句子的相似性比較，所以需要對每一個描述句子定義一個向量描述。使用 n-gram 作為句子特徵描述候選句子和參考句子。給定一幅圖像，假如有 50 個專家生成的參考句子（R1–R50）描述這幅圖像，有兩個需要評價的候選句子 C1 和 C2，從參考句子中任意選擇一個句子稱為 A，和 B 與 C 一起構成三元註釋。我們需要對 B 和 C 進行評價，看哪一個與句子 A 更相似。共識方法會在 B 和 C 之中選出一個，並使用每一條參考句子與 A 一起形成三元標註。參考句子透過投票給出候選 B 或 C 與參考 A 的相似性評分，最後根據共識評分結果得出：究竟是 B 或 C 與參考 A 更相似。 CIDEr 自動評價一幅圖像 I i I_i I i 的描述品質，使用共識方法評價一個候選圖像標註 c i c_i c i 匹配一組專家生成圖像描述 S i = { s i 1 , s i 2 , … , s i m } S_i=\{s_{i1}, s_{i2}, \ldots, s_{im}\} 。首先把候選句子和參考句子中所有的詞映射到它們的 stem 或 root 形式。例如，fishes、fishing、fished 映射為根詞 fish。每個句子都表示為...

閱讀完整內容