2013年4月29日 星期一

Wavii介紹


[舊聞]Facebook 版的 Google 新聞?新一代個人新聞頻道「Wavii」beta 版公開測試



自然語言處理仍然是internet新創事業的熱點之一,這個Wavii講白了,就是利用你的fb的歷史記錄,找出你對新聞內容的偏好,給你個人化的新聞。它也是和Summly一樣有摘要的功能沒錯,但是我想它的精確度也不是賣點。這幾天它也和Summly一樣用3000萬美元賣掉了,買主是google。或許不久以後就可以看到它出現在google+裏面?


张庆祥医生 - 关于生活,财富,成功及幸福的几点思考 (中文字幕)

http://www.youtube.com/watch?v=umLkfADe17s

A very meaningful speech by Late Dr Richard Teo, R.I.P.

张庆祥医生 - 关于生活,财富,成功及幸福的几点思考 (中文字幕)

http://www.heavenaddress.com/Dr-Richard-Teo-Keng-Siang/424153/379719/content

演說的原文,在治療兩年後,張醫師也已經於2012年十月辭世。不過我相信他的自省不會太晚,肯定有幫助到他自己以及許多曾經迷失的羔羊。像這樣的見證,必能在互聯網上繼續發光發熱,影響無數的人們。

p.s.像 http://www.heavenaddress.com/ 這樣的網站真的滿有意義的,可以讓我們有機會看到一些人在面對生命終點時的肺腑之言。

2013年4月28日 星期日

Ubuntu升級13.04結果叫不出輸入法,索性安裝fcitx輸入法

http://www.ubuntu-tw.org/modules/newbb/viewtopic.php?post_id=248348

參考上述連結,步驟歸納如下:

  1. 在軟體中心或更新管理員中加入: deb http://ppa.launchpad.net/fcitx-team/nightly/ubuntu ringtail [註:最後的 ringtail 是依版本而定,如果是12.10就改為 quantal main]
  2. 到軟體中心安裝fcitx,安裝完先不要關
  3. 按"更多資訊"按鈕,頁面下方勾 im-config 並套用
  4. 若系統設定中的"語言支援"消失了,到軟體中心安裝"語言支援",提示移除 im-switch 時按確定
  5. 下載boshiamy table(嘸蝦米字碼表);打開軟體中心後,點-系統-項目(非常重要),搜索tablefcitx關鍵字,你會看見一堆fcitx的字碼表(如:canjie倉頡、zhengma鄭碼、boshiamy嘸蝦米、等等)就下載來用吧!
  6. 更新完,預設啟動為 Ctrl+Space
    開啟輸入法後,在輸入法視窗上按滑鼠右鍵,即可見設定選單。
原連結中還有些設定的部分可以參考。這個安裝方式的嘸蝦米,候選字的順序比較合一般人的胃口,與WINDOWS上的是一致的。

2014/2/15更新:

  1. 命令列安裝方式請參考 http://cwwang2.blogspot.tw/2013/10/ubuntu-linux-1304-fcitx.html
  2. 安裝英文版ubuntu 13.10,繁體中文環境支援(language support)的lc_ctype是香港的(!!),若需在gtk的程式輸入中文,必需將對應的環境變數設定為:
export LC_CTYPE=zh_HK.utf-8

2014/3/1更新:

完整的設定請參考 http://www.ubuntu-tw.org/modules/newbb/viewtopic.php?post_id=246872
撰寫者對整個設定說明得非常清楚。另外gnome中(如emacs)無法輸入中文時,環境變數設定locale,參考
http://www.davidpai.tw/ubuntu/2011/ubuntu-set-locale/

2013年4月25日 星期四

org-mode升級到8.0以上,一些行為的改變及對策

  1. org-store-link 會存檔名/文字而非以前的 id。解決之道是去改 org-id-link-to-org-use-id 的設定
  2. org-format-latex-options 可以調整預覽latex的屬性,如縮放比例
  3. ...

2013年4月24日 星期三

org mode匯出中文pdf的問題解決方式

更新:最新的 emacs 24.4 及預設的 org 基本上只需要指定 xeCJK 的部分即可。
  1. 確定org mode版本,M-x org-version看一下,本文解法要8.0以上。若要更新版本,請往前翻兩、三篇文看一下程序,不要用elpa,更新不了的,最好用git
  2. 利用apt-get安裝texlive-xetex及texlive-lang-cjk
  3. 指定 xeCJK:
    文件開頭加上這幾行;副作用是,在preview latex時會有問題,記得關掉設定,重開檔案
    # -*- coding: utf-8; -*-
    # Latex设置
    #+LaTeX_HEADER: \usepackage{xeCJK} 
    #+LATEX_HEADER: \setCJKmainfont{WenQuanYi Zen Hei}
    #+LATEX_HEADER: \setCJKsansfont{WenQuanYi Zen Hei}
    #+LATEX_HEADER: \setCJKmonofont{WenQuanYi Zen Hei}
  4. 設定Org Export Pdf這個group,Value Menu選3 runs of xelatex並Save
  5. 設定檔中加入這幾行,當然要org載入以後;方法請往前兩篇
    (add-hook 'org-mode-hook
              (lambda ()
                (setq org-latex-default-packages-alist
                      (delete '("AUTO" "inputenc" t) org-latex-default-packages-alist))
                ))
    (setq-default TeX-master nil)
  6. 參考連結︰http://johnnyzls.blogspot.tw/2013/01/org-modebeamer-cjk.html
    但 org-export-latex-default-packages-alist 在 org mode v8 己改名為 org-latex-default-packages-alist
  7. org-latex-image-default-width 這個customization option改為空字串,否則每個圖都變成與頁面同寬,令人髮指…org-latex-image-default-option 視情況改scale=2到4之間

2013年4月23日 星期二

使用perl one liner進行檔案搜尋取代的流程(SOP)

1. 第一步是找出要取代的標的,利用 perl -ne 'print if m/pattern/' filename 確認
2. 要做什麼樣的改寫?利用 perl -ne 'print if s/pattern/pattern2/' filename 確認
3. 試試看結果.利用 perl -pe 's/pattern/pattern2/' filename 確認
4. 加入i參數以進行更動. perl -pi -e 's/pattern/pattern2/' filename

ps.取代部要使用函數呼叫的話,參考 http://www.perlmonks.org/?node_id=638259 ,簡言之就是使用/e選項或 @{[...]}結構

例如,將srt字幕檔延遲5秒


perl -p -i.bak -e "s/((\d\d):(\d\d):(\d\d))/@{[sprintf('%02d',int(($4+60*$3+3600*$2+5) \/ 3600))]}:@{[sprintf('%02d',int((($4+60*$3+3600*$2+5) % 3600 \/ 60) ))]}:@{[sprintf \"%02d\",($4+60*$3+3600*$2+5) % 60]}/g;" srt.srt

2013年4月22日 星期一

org mode中內嵌圖片在buffer顯示時的大小設定 (& org mode的更新問題)

參考 http://comments.gmane.org/gmane.emacs.orgmode/59504

You can now (from git master) use `org-image-actual-width'.

(setq org-image-actual-width 300)
  => always resize inline images to 300 pixels

(setq org-image-actual-width '(400))
  => if there is a #+ATTR.*: width="200", resize to 200,
     otherwise resize to 400

(setq org-image-actual-width nil)
  => if there is a #+ATTR.*: width="200", resize to 200,
     otherwise don't resize

(setq org-image-actual-width t)
  => Never resize and use original width (the default)

亦可參考 http://orgmode.org/worg/doc.html#org-image-actual-width

根據文件所言,要更新org到版本8以上。

org mode的更新問題

現在雖有elpa很方便,但是更新前後還是記得抄一下org-version的版本號再次確定。
如果在.emacs之類的設定中有第三方元件寫得不好,可能會在org被elpa載入前呼叫到舊版的org,而直接載入;解決之道,請把這個載入函式放到安全的地方,例如:


(eval-after-load "org"
  '(progn
                  (load-library....................

另外,如果曾經byte-compile過這些 *.el 的話,更改過任何部分都一定要再byte-compile過,雖然程式啟動時會抱怨檔案的日期不對,但程式不會自動幫你compile,而且直接載入舊的版本。很多時候debug不出原因時,要想想這個目題是不是有可能存在…

org mode在export時的問題

如果玩到這一步時,請乖乖的使用git (http://orgmode.org/manual/Installation.html) 來安裝,並移除舊版或改掉它的目錄名讓它無法被載入。詳情似乎是elpa在emacs上設計的問題,contributors吵到都快發火了(^^)

更新時下達指令為
git remote update
參 http://stackoverflow.com/questions/6150188/how-to-update-a-git-clone-mirror

2013年4月19日 星期五

將word檔轉換為其它格式

http://de.wikipedia.org/wiki/Wikipedia:Textverarbeitung/Word2Wiki

這個vba程式直接把doc檔轉到wiki,並且儘可能的轉換其中非文字的資料,非常有參考價值

http://www.windowsdevcenter.com/pub/a/windows/2005/03/22/word_macros.html

如要由perl/python呼叫vba,參考上面這個連結的寫法

p.s.1.轉換後在emacs當中如果出現了很多行末的^M符號,表示你寫的print不太好,儘量指定vbLF如:

print #FILE, "abcdef" & vbLF;

而不要寫成 print #FILE, "abcdef"

預設的情況它會幫你加上vbCRLF,造成困擾,參考以下連結

http://stackoverflow.com/questions/9444887/avoid-extra-carriage-return-in-print-statement-with-visual-basic

http://ergoemacs.org/emacs/emacs_line_ending_char.html

p.s.2.轉出來的圖檔如果黑黑一片,表示沒有設背景,因為doc檔預設背景是白色,所以要做些預處理

p.s.3.轉出來的檔是bmp格式,如果要批次轉為其它格式,如png,請參考以下連結,抓setup回來,在預設安裝目錄 C:\Program Files\GnuWin32\bin 中的bmp2png.exe就很好用,以bmp2png *.bmp這樣執行,非常方便

http://gnuwin32.sourceforge.net/packages/pngutils.htm

p.s.4.轉圖形的部分另可參考 http://blog.163.com/caoyujiao@yeah/blog/static/137465247201303075527195/

列出一些inlineshape的type常數

? wdInlineShapeEmbeddedOLEObject
 1 ,方程式之類的
? wdInlineShapeHorizontalLine
 6
? wdInlineShapeLinkedOLEObject
 2
? wdInlineShapeLinkedPicture
 4
? wdInlineShapeLinkedPictureHorizontalLine
 8 這好像也是圖形
? wdInlineShapeOLEControlObject
 5
? wdInlineShapeOWSAnchor
 11
? wdInlineShapePicture
 3 常見於圖形
? wdInlineShapePictureBullet
 9
? wdInlineShapePictureHorizontalLine
 7 這好像也是圖形
? wdInlineShapeScriptAnchor
 10

2013年4月18日 星期四

emacs當掉後的檔案復原

http://www.gnu.org/software/emacs/manual/html_node/emacs/Recover.html

再啟動程式後,鍵入

M-x recover-session

依據時間選譯對應的 .saves-* 檔,請特別注意,之後不是按enter錄,是打 C-c C-c