2018年2月23日 星期五

自然語言處理的另類選擇: spaCy 初探

安裝見 https://spacy.io/usage/ ,線上示範參 https://demos.explosion.ai/displacy/



速度上的確是比 Stanford coreNLP 快一點 ( 但也沒有到官方文件說的一個數量級那麼誇張 ) ,分析有時會比較合理,但 google scholar 上參考數很少

問題可能是出在安裝上,對 visual studio 和 c 的編譯不熟的話,安裝會有極大困難

( 我想這也是為何在 github 上, spaCy 的人氣反而超過 Stanford coreNLP 的原因 )

上圖是 spaCy 的分析結果,下圖是同一句子在 coreNLP 的分析,其中 calls 都被誤認為是名詞

一個句子/子句的中心就是動詞, spaCy 的分析結果很尊重這個原則。


在一些日常的英文中, "with" 這個單字的解析在 spaCy 也是比較正確的,而 spaCy 出錯時, coreNLP 也不見得正確。但是在一些很簡單的範例上, spaCy 會錯得很離譜,而 coreNLP 卻能得到正確結果。而且 spaCy 目前還不能處理中文。 只能說有一好就沒兩好吧?

沒有留言:

張貼留言