有时我们需要对PDF文件进行一些处理,提取文本、合并等。以前我们使用A-PDF Text Extractor免费工具,为什么不自己写一个呢? 现在我们可以使用PDFBox-0.7.3这个开源类库. 下载解包后引用: 代码如下:PDFBox-0.7.3.dllIKVM.GNU.Classpath.dll
新建一个项目,代码很简单: 代码如下:public static string ParseToTxtStringUsingPDFBox(string filename){PDDocument do