2010年12月3日 星期五

Berkeley parser初探

對應的目錄

http://code.google.com/p/berkeleyparser/downloads/list

把這些檔案抓下來,放在同一個工作目錄中,以要分析的檔案名叫mumbai.txt為例,鍵入


java -Xms64m -Xmx512m -jar berkeleyParser.jar -gr eng_sm6.gr.gz -inputFile mumbai.txt

它的說明檔範例中沒有參數-Xms64m -Xmx512m,對於使用者來說可能會得到空間不夠的錯誤訊息;其它可用參數如下


-render                       Write rendered tree to image file. (Default: false)
-inputFile                    Read input from this file instead of reading it from STDIN.
-substates                    Output subcategories (only for binarized viterbi trees). (Default: false)
-gr                           Grammarfile (Required) [required]
-binarize                     Output binarized trees. (Default: false)
-likelihood                   Output sentence likelihood, i.e. summing out all parse trees: P(w) (Default: false)
-confidence                   Output confidence measure, i.e. tree likelihood: P(T|w) (Default: false)
-tokenize                     Tokenize input first. (Default: false=text is already tokenized)
-scores                       Output inside scores (only for binarized viterbi trees). (Default: false)
-viterbi                      Compute viterbi derivation instead of max-rule tree (Default: max-rule)
-chinese                      Enable some Chinese specific features in the lexicon.
-accurate                     Set thresholds for accuracy. (Default: set thresholds for efficiency)

Stanford parser初探

在作業系統的開發上,Stanford與Berkeley一直互有競逐,並延伸到其它的層面。在自然語言處理上,代表作就是stanford parser和berkeley parser。先來看看Stanford parser,訪問首頁

http://nlp.stanford.edu/software/lex-parser.shtml

可以下載最新的版本。將它解壓到一個方便的目錄下,依照網頁下方所言產生mumbai.txt檔案來進行實驗,打出以下指令


java -mx200m -cp stanford-parser.jar edu.stanford.nlp.parser.lexparser.LexicalizedParser -retainTMPSubcategories -outputFormat "wordsAndTags,penn,typedDependencies" englishPCFG.ser.gz mumbai.txt

文章的作者因為是開發者,所以沒注意到加上-cp這段,我們如果作為純使用者的話,指明class path是必要的

2010年11月26日 星期五

「你到底行不行?」:學術摸底系統Web of Science介紹

「你到底行不行?」:學術摸底系統Web of Science介紹


非常有趣的一個工具,希望有一天能把endnotes也整合進去,讓寫論文變得更方便

2010年10月30日 星期六

XP開機不能!!先從bootlog下手看看

http://technet.microsoft.com/en-us/library/bb457123.aspx

簡單來說就是在boot.ini中加入/bootlog參數,看最後到那一步掛掉的

2010年9月16日 星期四

Email::Send::Gmail - Send Messages using Gmail (3)

切記安裝的是ActivePerl 5.10,否則裝了ActivePerl 5.12的話,不論怎樣都看不到這個gmail的模組的

2010年8月22日 星期日

中橫健行隊經典復刻梯

真的是太經典了…以下資訊轉錄自http://www.youth.org.tw/index.php

活動名稱:

中橫健行隊經典復刻梯
活動代號:
92MA08
 
活動特色:
七、八十年代全國高中職、大專生擠破頭報名的夢幻活動:「中橫健行隊」,即將在當年領隊、駐站服務員手中經典復刻!本營隊突破困難,重啟封莊十年的慈恩、洛韶兩山莊,只為重現我們那曾經伴隨汗水與淚光、笑語和勇氣的永恆青春!老朋友、新朋友,讓我們肩起背包頭頂小黃帽,腳踏實地69公里,在陽光與笑顏裡寫下我們自己的光陰故事。
第一天:台中火車站報到→專車接送至霧社→合歡山→觀雲→晚餐→觀雲大型團康晚會之夜。第二天:觀雲早餐→健行至金馬隧道6公里→午餐(便當)→健行至慈恩10公里→晚餐→慈恩通舖溫馨晚會之夜。第三天:慈恩早餐→健行至新白楊10公里→午餐(便當)→健行至洛韶11公里→晚餐→洛韶闖關遊戲晚會之夜。第四天:洛韶早餐→健行至西寶8公里→午餐(便當)→健行至天祥8公里→晚餐→天祥土風舞晚會之夜。第五天:天祥早餐→健行至靳珩橋9公里→午餐(便當)→健行至長春祠健行終點7公里→專車接送至花蓮學苑→晚餐→花蓮市區遊覽→花蓮惜別晚會之夜第六天:花蓮學苑早餐(三明治)→團體照→花蓮學苑解散。
附註:洛韶山莊目前雖正加緊整建,但相關室內住宿、用餐環境、盥洗衛生等環境,因山莊荒廢日久,故各項條件相對簡陋,需請注意。
 
活動日期:
第2梯 時間 : 2010-07-06 13:00:00 至 2010-07-11 11:00:00
報到地點:
台中火車站
活動對象:
高中職校以上 
活動費用:
NT 5200元 
活動地點:
台中、花蓮地區 
活動聯絡人:
文耀忠 
聯絡電話:
(02)25025858分機404 

2010年7月22日 星期四

Perl OpenGL (POGL)

http://en.wikipedia.org/wiki/Perl_OpenGL
Perl OpenGL (POGL) is a portable, compiled wrapper library that allows OpenGL to be used in the Perl programming language.


基本上就是在perl裏呼叫opengl函式庫,速度看來相當快


http://graphcomp.com/pogl.cgi?v=0111s3m8&r=s3m1 有兩個demo可以拿來run一下看看