文件名称:
LDA-孟加拉语:使用LDA确定WX格式的孟加拉语文档中有意义的主题-源码
开发工具:
文件大小: 3mb
下载次数: 0
上传时间: 2021-02-22
详细说明:LDA-孟加拉语
使用LDA确定WX格式的孟加拉语文档中有意义的主题
问题状态网
鉴于:
94个WX格式的孟加拉文献文档,其中每个文档都包含以下格式的数据-
句子(一组单词)由空白行分隔,即文档中的每个空白行都指定一个新句子的开头。
每条非空白行都包含一个已经POS标记的单词。
任务:
应用机器学习工具和算法从94个文档集中找出以下内容:*。 文档涵盖的有意义的主题。 *。 每个主题的关键字。
提交一份报告(软拷贝),其中提到您如何执行此任务,即详细格式的算法,代码和输出。
内容
该作业包含以下内容-
作业2-机器学习(CS-603).pdf:该报告提到了我是如何执行任务的,即算法,代码和详细格式的输出。
代码:此文件夹包含*。 data_prep.py:数据准备代码*。 lda.py:用于实现LDA,获取输出和数据可视化的代码
数据:此文件夹包含*。 94个文档:提供的数
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.