2019年12月29日 星期日

詞嵌入無監督自然語言翻譯--臉書團隊的 MUSE 專案

在課堂上認識的 Ruben 兄目前正在進行自然語言翻譯的研究,提到了這個 MUSE

乍聽之下沒什麼特別的,動手把玩一下才知道很神奇的,因為我給它的是兩個單語詞嵌入辭典…

換句話說我沒告訴它 cat 跟"貓"的對應關係哦,這厲害了吧 XD

專案網址 https://github.com/facebookresearch/MUSE

參考原始程式 https://github.com/facebookresearch/MUSE/blob/master/demo.ipynb


簡單來說,這是在假設所有語言都有相似的拓樸結構,因此進行有限步的(仿射?)變換後可以得到兩個語言的疊合。

我的直觀感覺是這樣,相對詞頻其實提供了一個很重要的資訊,被拿來當作錨點,以此進行疊合。可想而知,正確率會隨詞頻的下降而降低:


最後按照慣例,來張詞嵌入的經典,A-B+C=D



沒有留言:

張貼留言