2014年3月1日 星期六

ubuntu上用beautifulsoup進行網頁資訊擷取

要說javascript因為jquery而脫胎換骨實不為過,這很大一部分要拜精心設計的selector語法所賜。而在python中,託其執行期環境之福,結合上beautifulsoup也可以做到大部份相同的事。再搭配上瀏覽器本身的開發者工具,例如在chrome中按滑鼠右鍵,選"檢查元素",即可查到該元素的tag及原始碼位置。

官網 http://www.crummy.com/software/BeautifulSoup/

中文化文件 http://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html

安裝指令

sudo apt-get install Python-bs4 #官網文件中少寫了sudo


沒有留言:

張貼留言