油田英语文学选论
1.遍历文件夹下的子文件夹;
2.遍历子文件夹下的pdf文档(text_path),获取名称(Field_name);
3.读取pdf文档,将整篇文章存成字符串;
4.检索字符串中Field_name和“参考”或“参考”或“ REFERENCE”或“ REFERENCES”的位置;
5.比较两者的位置,如果字段仅出现在引用之后,而且文章中存在引用,则返回text_path,可以将text_path写入false_field_name_0.txt;
6.读取false_field