行有餘力則以學文: Stanford parser初探

2010年12月3日星期五

Stanford parser初探

在作業系統的開發上，Stanford與Berkeley一直互有競逐，並延伸到其它的層面。在自然語言處理上，代表作就是stanford parser和berkeley parser。先來看看Stanford parser，訪問首頁

http://nlp.stanford.edu/software/lex-parser.shtml

可以下載最新的版本。將它解壓到一個方便的目錄下，依照網頁下方所言產生mumbai.txt檔案來進行實驗，打出以下指令

java -mx200m -cp stanford-parser.jar edu.stanford.nlp.parser.lexparser.LexicalizedParser -retainTMPSubcategories -outputFormat "wordsAndTags,penn,typedDependencies" englishPCFG.ser.gz mumbai.txt

文章的作者因為是開發者，所以沒注意到加上-cp這段，我們如果作為純使用者的話，指明class path是必要的