这篇文章主要介绍了基于Python获取docx/doc文件内容代码解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
整体思路:
下载文件并修改后缀为zip文件,解压zip文件,所要获取的内容在固定的文件夹下:work/temp/word/document.xml
所用包,全部是python自带,不需要额外下载安装.
# encoding:utf-8
import os
import re
import requests
import zip
毒蛇猴
ViperMonkey是用Python编写的VBA仿真引擎,旨在分析和模糊处理Microsoft Office文件(Word,Excel,PowerPoint,Publisher等)中包含的恶意VBA宏。
有关ViperMonkey进行恶意软件反的真实示例,请参阅文章“”。
ViperMonkey还在Black Hat Europe 2019大会上进行了演示:参见和(18:38)。
ViperMonkey由在2015-2016年创建,该项目保存在资源库。 自2017年11月以来,大