2009年6月15日 星期一

如何转PDF文件为text文件?

http://www.9php.com/FAQ/cxsjl/perl/2008/08/2560469127856.html

其实CAM::PDF已经相当不错用了,对比其它ruby/python写的模组,结果已经很不错

http://search.cpan.org/~cdolan/CAM-PDF/bin/getpdftext.pl

getpdftext.pl 就是利用CAM::PDF对pdf文件进行处理

对比getPageContentTree的内容,可以用常规表示法得到相当正确的结果

沒有留言:

張貼留言