文件名称:
解析数据处理:基于Pandas数据框的一组用于处理СSV文件的工具,可以对文本进行潜在的语义分析-源码
开发工具:
文件大小: 38kb
下载次数: 0
上传时间: 2021-02-10
详细说明:解析数据处理(使用LSA)
一套基于Pandas数据框的СSV文件处理工具,可能对文本进行潜在的语义分析。
一组用于处理通过解析网页获得的DSV表格数据的工具。
发布时间:
按关键字删除数据行
通过CSV文件中的预标记关键字列表删除数据行
删除关键字
对所选数据列的潜在语义分析(聚类结果并不总是正确的,需要实验方法)。
将LSA群集标签分配给数据行。
保存CSV
快速开始:
CSV文件的路径(文件编码必须为UTF-8,以“;”分隔)。
DIR = 'test_dataset.csv'
测试数据集:200个具有联系方式,有关区域的信息等的不同公司。文本信息不完整,使用特殊字符以不同的形式编写。
创建一个类对象,并指定CSV文件的路径,分析数据的主要语言和最小字长(小于要删除的字长)
data = CSV_preprocessing ( dir = DIR , lang
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.