您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. copycat:CopyCat是TREC式实验设置中用于重复数据删除的资源-源码

  2. 山寨 CopyCat是开放源代码资源,可以使TREC风格的实验设置中的重复数据删除更容易实现,并提供(1)ClueWeb09,ClueWeb12和两个Common Crawl快照中近重复文档的汇编,以及(2)软件库启用任意文档集的重复数据删除。 大纲 (在软件的所有部分中使用) 入门 CopyCat软件带有一个以及一个并提供了一个支持jupyter笔记本的docker映像(+)。 要在安装了CopyCat并安装了本地目录的情况下启动bash shell,请运行 docker run --rm
  3. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:105906176
    • 提供者:weixin_42139302