第一步要安裝 R ,參考 http://taiwanrusergroup.github.io/DSC2014Tutorial/ 輸入以下指令
sudo sh -c 'echo "deb http://cran.csie.ntu.edu.tw/bin/linux/ubuntu trusty/" >> /etc/apt/sources.list'
sudo apt-key adv --keyserver keyserver.ubuntu.com --recv-keys E084DAB9
sudo apt-get update &&
sudo apt-get install -y r-base libcurl4-openssl-dev libxml2-dev espeak
標紅色的指令應是網頁上筆誤,要加一下
第二步要安裝 RStudio , 到以下網頁抓合用的下來,我抓的是 RStudio 0.99.464 - Ubuntu 12.04+/Debian 8+ (64-bit)
https://www.rstudio.com/products/rstudio/download/
http://www.cc.ntu.edu.tw/chinese/epaper/0030/20140920_3006.html 快速上手,花個幾分鐘看看
http://taiwanrusergroup.github.io/DSC2014Tutorial/ 另有不少教學資源,我相信是目前為止最好的網頁,有空的話我也想好好看看~
以下為非必要步驟,想玩玩 text mining 文字探勘的話可以試試…
第三步裝
jdk (不要裝oracle的哦,否則…), 參考 http://linuxpilot.com/ubuntu-java 輸入:
sudo apt-get install default-jdk
第四步,"
用R進行中文 text Mining"
按他介紹的步驟玩玩,但請先詳讀以下附註。
PS.
1. DSC2014網頁中提到"如果是其他版本的使用者,請修改上述 trusty 的部份。"這對ubuntu 的初學者來說還滿容易發生問題,參考以下連結以了解版本號對應的命名(就像是iOS 的 snow leopard,你懂的)
https://wiki.ubuntu.com/Releases
2. /usr/lib/R/etc/javaconf 這個檔案,在安裝R時寫入了預設值 JAVA_HOME ,如果日後安裝了新的 java 版本,這個值是不會自動更新的。怎麼處理?你懂的~
3. 安裝 rJava 時發生任何問題,請參考 http://stackoverflow.com/questions/12872699/error-unable-to-load-installed-packages-just-now ; 反正我現在都是執行
sudo R CMD javareconf && rstudio &
4. 安裝 rwordseg 時,如果在非 windows 平台上會有問題。上述網頁的作者應該是使用 windows 的環境,壓縮檔是 zip 格式, rstudio 預設解壓要的是 .tar.gz ,所以無法自動安裝。解決方式就是把
zip 檔抓回來,解壓後再壓成 .tar.gz ,然後用 rstudio 的選單 Tools -> Install Packages... 手動安裝; twcn 的安裝也有類似問題,也是抓
zip 檔安裝就解決了