PDF专题分类

需求描述：在我的keywordsExtractor 目录下有一些文件夹，文件夹内是pdf文件，我需要把这些pdf文件跟目标股票进行对比，如果该PDF属于目标股票，那么加载，否则不加载。然后把PDF中的一些特定关键词出现次数提取到Excel中，如下示例：

yczha大约 5 分钟

本文介绍一个提取PDF中的表格内容的程序。首先，程序给出使用示例，最后给出代码开发思路及细节。

yczha大约 10 分钟

文章介绍把PDF格式的电子发票内容提取出来保存到Excel中

yczha大约 7 分钟

这篇文章介绍了如何使用Python3把PDF文件转换为word文档并替换word文档中的文字内容，这里替换的规则是中英转换或者其它自定义规则。

yczha大约 6 分钟

最近需要将一批PDF文件中的某些数据整理到Excel中，因为文件数量接近20w+，手动更新几乎不现实，于是就提取关键词和内容动手写了个Python小工具，以实现自动完成上述目标。

yczha大约 13 分钟

这篇文章主要介绍如何使用Python[3.6版本]中的PDFminer3k 模块来抽取PDF内容，包括文本、图像、曲线等。

yczha大约 2 分钟

本文尝试从不同角度讲述发票解析及处理的一些技术手段

yczha大约 10 分钟