(科學園)詞嵌入 龔惜
你曾否思考過為甚麼「快樂」這個詞就代表心情好,而「傷心」便代表心情不好?為甚麼不能是「傷心」這個詞是表示心情好?雖然讓人使用「傷心」來表示自己很開心,聽起來感覺怪異,但未必並非不可,因為詞言本身只是一個代號,大家通過詞語讓彼此理解對方的意思。但由於我們受教育時被灌輸固有思維,認為詞彙賦予了特定含義,導致當我們探討這些問題時產生困惑。
我們從小受到老師和父母的教育下理解詞語意思和使用詞語,例如知道「開心」和「快樂」是同意詞,當我們不開心的時候便使用「孤單」、「悲哀」等詞語來表達自己的情緒,但機器即電腦如何知道這些詞語本身的函義,Chat GPT 是如何理解我們句中的意思?當中利用一個叫詞嵌入技術,即把字詞投射在向量中,每個單詞都會映射成一個向量,簡單舉例把「開心」、「高興」、「狗」這三個字投射在一個二維空間中,假設「開心」對應的向量為(1.0,1.0),「高興」對應的向量為(1.0,2.0),「狗」對應的向量為(1.0,-5.0),然後透過cosine來計算不同詞向量間的夾角餘弦值,電腦便知道當兩個詞的夾角餘弦值大的時候代表意思並不太相近,反之則意思相近。所以電腦並不理解人們詞中表達的意思,只是用透過數學來計算,讓機器也可以像一樣「理解」詞中意思。
機器能把文字變成數字,亦能把圖片變成數字,好像所有事物都能透過數字來表示。有時候會想世間萬物其實是不是只是一堆數字,即我們人類也只是一堆數字堆砌而成,只是我們還沒發現吧了。不過,一切只是我的奇空幻想。◇