文件名称:
QA:信息检索实验:问答系统设计与实现-源码
开发工具:
文件大小: 253mb
下载次数: 0
上传时间: 2021-03-11
详细说明:信息检索实验:问答系统设计与实现
一,实验目的
本次实验目的是对问答系统的设计与实现过程有一个全面的了解。调优。
二,实验内容
本次实验中,首先要自己建立一个检索系统,从文本库中检索到与问题最相关的文档(可以是一个或多个)。然后对文档中的替代答案进行排序,删除出最相关的最后,在最相关的补充答案中解最精简的答案,这个答案可能是一个词或几个词。实验提供了一部分有标注的数据作为训练集和开发集,需要提交的那部分是去掉了标注的数据,最终通过提交答案和标准答案的相似度(BLEU-1值)来评估本次实验的效果。
三,实验过程及结果
3.1文本集合进行处理,建立索引
我在此章节分别使用了Whoosh开源库和BM25算法重构索引,效果上略有差异,Whoosh的top1变量为86%,top3为91%,BM25的top1为89%,top3为93%,BM25较优于Whoosh,具体讲解如下。
3.1.1使用开源库W
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.