文件名称:
高级机器学习:该项目是我的作业提交清华高级机器学习的班级-源码
开发工具:
文件大小: 207kb
下载次数: 0
上传时间: 2021-02-17
详细说明:先进的机器学习
该项目是我的作业在哪里提交的课是清华高级机器学习。
作业_2
相关代码和具体的报告说明见name-disambiguation文件夹
名字歧义同名消歧
同名消歧是一个具有挑战性的问题,由于数据的杂乱以及同名情景十分复杂,要快速且准确的解决同名消歧问题还有很大的障碍。
论文的冷启动消歧
工作描述
给定一堆拥有同名作者的论文,要求返回一组论文聚类,因为一个聚类内部的论文都是一个人的,不同聚类间的论文论文不属于一个人。最终目的是识别出那些同名作者的论文属于同一个人。
尖端
可以把问题看成成对论文集的聚类任务,对于某个待消歧管的人名,先提取出论文的特征向量,然后计算出论文之间的相似度矩阵。最后根据相似度矩阵利用聚类算法将论文划分成不同的簇,每一个簇代表一个作者的论文集。
主要难点在于如何提取论文的特征向量,以及采用另外的聚类算法进行聚类。
文本特征如何提取:TF-IDF,图表征的学
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.