關於簡繁互轉的工具
http://sptuner.blogspot.tw/2012/08/convertz-v802.html 只適用win平台下,big5/gbk/unicode/utf-8/jis/shift-jis/euc-jp各種內碼之間自由轉換
http://search.cpan.org/~audreyt/Encode-HanConvert-0.35/lib/Encode/HanConvert.pm 提到以下三種方式
# iconv | b2g | iconv
# Encode::HanConvert b2g.pl -u
# Lingua::ZH::HanConvert trad2simp
再來還有cconv及opencc
根據 http://www.byvoid.com/application/opencc/ 的說法,opencc目前是最佳解了
官網在此: http://code.google.com/p/opencc/
ps.路上經過一個大陸的corpus 網站 http://www.corpus4u.org/forum/index.php ,滿有趣的
2012年9月1日 星期六
2012年8月31日 星期五
perl模組安裝及管理--cpanplus/cpanp(二)
常用指令
m 查模組全名,在ubuntu結果會以less顯示,最前方的編號要記得,方便安裝
i 全名or上列指令m查詢結果的編號
沒想到上一篇提到cpanp的文章在繁中查詢結果名列前矛,真是可喜可賀啊…
參考資料
http://c9s.blogspot.tw/2009/05/cpanplus.html
2012年8月30日 星期四
find2perl 介紹--原來perl是作弊王
管理檔案或專案目錄時常有用到find -path -name|xargs grep等等的指令,我本來會產生一個結果檔然後匯入perl進行後續處理的。但是今天被我發現一個神奇的指令:find2perl
http://wiki.debian.org.tw/index.php/find2perl
可以直接把find的結果轉成一個perl程式,因為呼叫File::Find可能解決了在win32上跨平台的問題。我說perl你真是不給人活路啊,這算作弊吧XD
http://wiki.debian.org.tw/index.php/find2perl
可以直接把find的結果轉成一個perl程式,因為呼叫File::Find可能解決了在win32上跨平台的問題。我說perl你真是不給人活路啊,這算作弊吧XD
2012年8月27日 星期一
2012年8月10日 星期五
Ubuntu上Jenkins的試用
在軟體中心找到Jenkins並安裝,非常迅速
http://localhost:8080/ 是它預設的輸出頁,如果8080有裝了其它server的話可能會有問題
中文教程可參見 http://www.cnblogs.com/itech/archive/2011/11/23/2260009.html
特別要注意這篇http://www.cnblogs.com/itech/archive/2011/11/14/2248507.html
有些習用的小段shell script或perl script,如果很懶得寫log的話,“畫面輸出”可以作為一個很陽春的log;配合scm,可以一做完修改,就產生測試的動作。以前會在產生的log檔名中故意加上時間的字串以方便比較,現在也不必了,產生的畫面會依建置的時間分別儲存而不會被覆蓋。
P.S. ubuntu有一些快捷鍵,這裏有列表 http://blog.longwin.com.tw/2012/01/unity-keyboard-shortcut-2012/
P.S.-2. 基本的emacs操作 http://www.study-area.org/cyril/opentools/opentools/x42.html
http://localhost:8080/ 是它預設的輸出頁,如果8080有裝了其它server的話可能會有問題
中文教程可參見 http://www.cnblogs.com/itech/archive/2011/11/23/2260009.html
特別要注意這篇http://www.cnblogs.com/itech/archive/2011/11/14/2248507.html
有些習用的小段shell script或perl script,如果很懶得寫log的話,“畫面輸出”可以作為一個很陽春的log;配合scm,可以一做完修改,就產生測試的動作。以前會在產生的log檔名中故意加上時間的字串以方便比較,現在也不必了,產生的畫面會依建置的時間分別儲存而不會被覆蓋。
P.S. ubuntu有一些快捷鍵,這裏有列表 http://blog.longwin.com.tw/2012/01/unity-keyboard-shortcut-2012/
P.S.-2. 基本的emacs操作 http://www.study-area.org/cyril/opentools/opentools/x42.html
2012年7月23日 星期一
國際財金數據的取得(一)
以風險管理的角度來看,將所有的投資標的(instruments)依所曝露的風險分為4種,equity(權益證券/股票、對應的衍生商品), FI(fixed income,含票、債券、對應的衍生商品), FX(外匯、對應的衍生商品), commodity(金、油、穀等商品、對應的衍生商品)。FX和commodity若排除otc商品的話是最單純的(歷史匯價下載可參考 http://www.quantshare.com/sa-421-6-places-to-download-historical-intraday-forex-quotes-data-for-free ),FI如果單就國庫券、國債來說還算單純,所以上述標的中最複雜的就是equity,但是各國政府通常會規定公司必需定期揭露財報資訊,而交易所會提供報價(通常要收錢)及財報。
免費的歷史報價可參考 http://www.quantshare.com/sa-426-6-ways-to-download-free-intraday-and-tick-data-for-the-us-stock-market
財報目前多可下載xbrl檔案,sec的網頁上有edgar專門放置這些資料 http://www.sec.gov/edgar.shtml
開源的xbrl專案 http://arelle.org/download/
另外nasdaq有類似的網頁,以蘋果為例:http://www.nasdaq.com/symbol/aapl/financials?query=balance-sheet
而總經的數據,以台灣為例,由主計處及勞委會、央行分別製作權責內的報告,目前匯總於
http://ebas1.ebas.gov.tw/pxweb/Dialog/statfile9L.asp
免費的歷史報價可參考 http://www.quantshare.com/sa-426-6-ways-to-download-free-intraday-and-tick-data-for-the-us-stock-market
財報目前多可下載xbrl檔案,sec的網頁上有edgar專門放置這些資料 http://www.sec.gov/edgar.shtml
開源的xbrl專案 http://arelle.org/download/
另外nasdaq有類似的網頁,以蘋果為例:http://www.nasdaq.com/symbol/aapl/financials?query=balance-sheet
而總經的數據,以台灣為例,由主計處及勞委會、央行分別製作權責內的報告,目前匯總於
http://ebas1.ebas.gov.tw/pxweb/Dialog/statfile9L.asp
2012年7月4日 星期三
机率与统计书单(四)
抽空重新看了一下chung的Elementary Probability Theory,發現223頁談到這個stirling formula真的滿有趣的。回顧一下,它是對n!的一個近似式,在沒有計算機的時代,這提供了相當大的計算便利。學統計時一定會發現一件很突兀的事,就是卡方(chi-square)的引入,等效來說,就是gamma函數的引入;但是如果能了解stirling近似的必要性,就會發現,這是很自然而方便的擴展。可參考
http://en.wikipedia.org/wiki/Stirling's_approximation
http://episte.math.ntu.edu.tw/articles/mm/mm_17_2_05/page4.html
224頁導出二項分配最中間出像的機率,225頁繼續推導固定半徑下累計出像的機率,與上述連結之推導有同步進展的意味。226頁則將p擴展到1/2以外的情況,並且開始偷渡了常態標準值的觀念進去,228頁導出二項分配在固定區間內的累積機率,至此為常態分布舖路的工作告一段落。
http://en.wikipedia.org/wiki/Stirling's_approximation
http://episte.math.ntu.edu.tw/articles/mm/mm_17_2_05/page4.html
224頁導出二項分配最中間出像的機率,225頁繼續推導固定半徑下累計出像的機率,與上述連結之推導有同步進展的意味。226頁則將p擴展到1/2以外的情況,並且開始偷渡了常態標準值的觀念進去,228頁導出二項分配在固定區間內的累積機率,至此為常態分布舖路的工作告一段落。
訂閱:
文章 (Atom)
