统计文本词频并输出为Excel表格形式——Python实现
本次实例主要是熟练对中文分词库_jieba库,以及二维数据存储_csv库的使用。
目录
简单介绍两个库的使用
实例问题及问题分析
Python实现
一、简单介绍两个库的使用
jieba库:中文分词库,将中文文本分解为单个词语进行处理。
jeba.lcut(s):精确模式,对原文本进行词语拆分,无冗余。
jieba.lcut(s,cut_all=True):全模式,对文本进行拆分,列出所以可以组成的词语,存在冗余。
jieba.lcut_