2019年12月29日 星期日

詞嵌入無監督自然語言翻譯--臉書團隊的 MUSE 專案

在課堂上認識的 Ruben 兄目前正在進行自然語言翻譯的研究,提到了這個 MUSE

乍聽之下沒什麼特別的,動手把玩一下才知道很神奇的,因為我給它的是兩個單語詞嵌入辭典…

換句話說我沒告訴它 cat 跟"貓"的對應關係哦,這厲害了吧 XD

2019年12月22日 星期日

2019年12月21日 星期六

廢文界的 deepfake -- textsynth.org



隨便打一段字,幫你接龍的網站,測試結果:

fastText 文本分類初探-- google colab 上執行為例

以下以中文出題的單選題為例來進行文本分類
首先掛載 google drive
import fasttext
from google.colab import drive
drive.mount('/content/drive')
train_data_file="/content/drive/My Drive/Colab Datasets/twmlestep2_train_clean.txt"
test_data_file_raw="/content/drive/My Drive/Colab Datasets/twmlestep2_test_clean.txt"

標記後的文本長得像這樣

2019年12月19日 星期四

Colab 環境的開門三件事(!)

說的是這篇 3 More Google Colab Environment Management Tips

總之 Colab 就是個 VM ,所以此文就是說它有辦法做到這三件事:

2019年12月13日 星期五

爆炸性成長的 GCN (圖卷積網路)

不過三年的時間,GCN 已經自成一個山頭,可以觀察知乎的話題,或是搜尋一下也可以知道每個月都有上百篇的中文討論出現這個關鍵字 GCN。再推薦幾篇:

2019年12月9日 星期一

HMM / CRF 與 RNN

先看看李宏毅老師教學影片 RNN-1 RNN-2  ,以及 "工程師。日常" 的整理 1 2 3 4

2019年12月1日 星期日

玩轉 corenlp(3)

在做一些測試的時候,使用 maven 是比較簡單(懶惰)的選擇

首先到 https://jdk.java.net/ 抓到新版 jdk ,解壓到自選的位置

再來到 https://maven.apache.org/download.cgi 抓到新版 maven ,解壓到自選的位置