文件名称:
plagiarism_detection:窃检测器,用于检查文本文件并执行二进制分类; 将文件标记为抄袭还是不抄袭,取决于文本文件与提供的源文本的相似程度-源码
开发工具:
文件大小: 500kb
下载次数: 0
上传时间: 2021-03-15
详细说明:抄袭项目,机器学习部署
该存储库包含用于使用AWS SageMaker部署a窃检测器的代码和相关文件。
项目概况
在这个项目中,您将负责构建a窃检测器,该检测器将检查文本文件并执行二进制分类。 根据该文本文件与提供的源文本的相似程度,将该文件标记为抄袭或不抄袭。 侦查窃是一个活跃的研究领域。 这项任务很艰巨,解释的答案和原始作品之间的差异通常并不那么明显。
该项目将分为三个主要笔记本:
笔记本1:数据探索
加载of窃文本数据的语料库。
探索现有的数据功能和数据分布。
这第一台笔记本是不是在你的最终项目要求提交的。
笔记本2:功能工程
清理并预处理文本数据。
定义用于比较答案文本和源文本的相似性的特征,并提取相似性特征。
通过分析不同功能之间的相关性来选择“良好”功能。
创建包含用于训练/测试数据点的相关功能和类标签的训练/测试.csv文件。
笔记本3:在SageMaker
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.