2018年2月17日 星期六
使用 perl one liner 進行檔案搜尋取代的流程 ( SOP ) ( 三 )
(上圖是 kuso 快遞公司 FedEx)
承接 2013 年 使用perl one liner進行檔案搜尋取代的流程(SOP) 一文,如果要串接多個層次的處理也是沒有問題的。(沒辦法,RE 真的是太好用太強大啦!!)
| 這個重新導向算子可以把前面的結果傳給後面,所以可以這樣使用:
perl -pe /xxxxxxxx/ abc.txt | perl -ne /xxxxxxxxxxxxx/ > def.txt
另外還可以衍生出一種使用的情境,就是資料的過濾,這必需要 -ne 參數搭配上 print 函數,合於條件時才利用 print 輸出以進入下一層處理。以下這行簡單的 one-liner 可以證明, | 兩側的 perl instance 是同時執行,且輸出入是即時重導的:
2018年2月16日 星期五
python3 對 html 的高速剖析-- lxml
bs4 的速度在處理大家資料時有點令人不耐,此時 lxml 不失為一個好方案
參 http://lxml.de/
在處理文字時,如果有 tag 與文字混雜的情況,可參考 http://yshblog.com/blog/151
基本上就是會把文字放在 tag 的 tail 屬性當中,要花點工夫去找出來、串起來
2018年2月14日 星期三
Stanford coreNLP的非官方 python 介面 "stanford-corenlp" 初探
主頁在 https://github.com/Lynten/stanford-corenlp ,可以直接用 pip3 安裝
測試檔可以試試 https://github.com/Lynten/stanford-corenlp/blob/master/test.py
(已經改寫為 python3 的語法)
測試檔可以試試 https://github.com/Lynten/stanford-corenlp/blob/master/test.py
(已經改寫為 python3 的語法)
2017年11月19日 星期日
python on a stick / node.js on a stick
有些時候要 demo 一些東西,但是不能用自己的電腦,那麼就得想個方法,最好是不要安裝任何東西在 demo 的平台上,人家可能不答應,我們可能也擔心留下跟賣點有關的資訊甚至機密。node 在這種情況下相對單純,專案目錄和 node 目錄 copy 出來到 usb 上,手動指定 node 的執行位置,基本上就沒問題。 python 相對來講複雜許多,因為它可能很依賴一些 path 以及環境變數的設定。有人對解決方案做過一些 survey ,目前看來 WinPython 相對來說更新比較頻繁。也有人整理一些思路,例如撰寫 batch file 來設定所需的環境變數和目錄。 不過我想直接使用 WinPython 是比較簡單的~~
node.js 的部分,有人有討論過,也有人整理過流程。總之沒有要使用 npm 的話,事情就會單純許多。主程式的下載位置在 https://nodejs.org/dist/
node.js 的部分,有人有討論過,也有人整理過流程。總之沒有要使用 npm 的話,事情就會單純許多。主程式的下載位置在 https://nodejs.org/dist/
2017年10月10日 星期二
git pull --rebase 的前置作業
- git commit -m "..." #確定 staging area 清空
- git log 找出上次 checkout 的版本
- git diff 版本號 #確定 diff 的內容可以接受,沒有不需要的檔案、目錄,不然merge會很久
- git remote -v #確定 remote repository 的名稱
- git pull --rebase repo名 branch名
- 中間會有需要手動解決的情況,編輯該檔案,並記得 git add 該檔案,接著下 git rebase --continue (或skip),事後要確認檔案內容
在 local repo 中移除特定目錄
比較特別的是要在 local repo 中移除特定目錄,但保留在 working dir 當中,參考此帖
簡言之就是:
git rm -r --cached 目錄名
並請記得在 .gitignore 中加入對應的一行,以斜線"/"結尾,這樣才能順利 commit
2017年9月21日 星期四
DOM 文件中節點樹的遍歷 (traverse)
參 https://www.codeday.top/2016/11/15/1705.html
上述網頁列出了5種方式。搭配 DOM 的官方文件使用:https://www.w3schools.com/jsref/dom_obj_all.asp
上述網頁列出了5種方式。搭配 DOM 的官方文件使用:https://www.w3schools.com/jsref/dom_obj_all.asp
訂閱:
文章 (Atom)




