2018年12月16日 星期日

win10 上安裝 Flask-MongoAlchemy 的 "Subprocess output does not appear to be encoded as cp65001" 解決方法

參考討論串 https://bugs.python.org/issue27179

實際錯誤是發生在安裝 pymongo 時

總之執行 cmd /u 即可



2018年11月16日 星期五

Google新自然語言處理模型--BERT!!屌打微軟亞洲研究院,復旦+流利說團隊、國防科大團隊、阿里巴巴團隊,中國平安旗下金融壹賬通GAMMA LAB,韓國江原大學

BERT 的原始碼已釋出,參 https://github.com/google-research/bert

2小時前團隊剛更新程式碼,表示已經在 Stanford SQuAD 問答集上再推進 3.0%,根本上屌打其它對手


谷哥大神滿佛心的其實,第二、三名其實也是借了谷哥所釋出的 BERT 之力,否則正確來說 BERT 已經屌打非 BERT 技術達到 12% 之多!!

但是文意的理解是否是答題的基礎呢? 打個問號囉~~

2018年11月2日 星期五

"此環境變數太大"的原因和解法

原理詳 https://blog.miniasp.com/post/2015/09/07/Maximum-length-of-PATH-environment-variable.aspx

文中論及解法,感覺上 regedit 可以用用。

使用者環境變數:HKEY_CURRENT_USER\Environment

2018年10月24日 星期三

emacs 的 eshell 及 python 等各種 shell command 在 windows 10 無法正常輸出 utf-8 , 只要這樣作就OK…

這下標有內容農場的味道吧呵呵

開啟"控制台"中的"時鐘和區域"設定,"變更系統地區設定",勾選"Beta:..."選項,按"確定"


這樣就不用每次在那兒 chcp 65001了,而且 eshell 也可以正常執行並輸出 utf-8 囉

2018年10月21日 星期日

Stanford parser初探(3)--CoreNLP version 3.9.2(20181005)

相較於在 Stanford parser初探(2) 一文中,對於中文的處理略有增強


同時在4G記憶體的筆電上也能跑得動了,速度也大幅提升。

用英文測試一下,感覺也滿不錯。測試句為:

A 36-year-old pregnant woman was evaluated at 33 weeks of gestation because of newly diagnosed adenocarcinoma. One week earlier, severe pain in the lower back had developed; computed tomography revealed hypoattenuating hepatic lesions. Management decisions were made.


好 parser ,不 try 嗎?

2018年9月29日 星期六

以 email 送出 git diff (patch) 的方法

參 https://orgmode.org/worg/org-contribute.html#commit-messages

使用 git format-patch 產生 *.patch ,其中 * 會是個序號加上 commit 的註解訊息內容


2018年9月16日 星期日

github上有趣的專案

https://github.com/trending?since=monthly

來看我覺得比較有趣,有時會有些很無厘頭的專案,例如 "Windows 95 in Electron" 之類

https://github.com/trending?since=weekly

來看就有點 radical 了,看人囉

https://github.com/trending?since=daily

來看有時也滿好玩的,某些特定專案被衝高了讚數

其實比較正經點的做法,當然是搭配各種(自己拿手的)語言為條件來過濾。

像最近有個影片對影片翻譯(?!)的專案

改天再寫個介紹文。真的是很有趣