您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 数据库中的快速语义重复检测技术

  2. 今天,数据库中的语义重复项代表着一项重要的数据质量挑战,这会导致错误的决策。 在大型数据库中,有时我们发现自己有成千上万的重复项,因此需要进行自动重复数据删除。 为此,有必要使用一种相当可靠的方法来检测重复项,以找到尽可能多的重复项,并且其功能足以在合理的时间内运行。 本文提出并比较了基于真实数据的有效重复检测方法,该方法可基于名称(使用法语文本或英语文本以及非洲或西方国家或地区的人名)自动对文件进行重复数据删除。 在对语义重复项进行比常规分类更完全的分类后,我们介绍了几种检测平均重复性小于O(
  3. 所属分类:其它

    • 发布日期:2020-06-04
    • 文件大小:483328
    • 提供者:weixin_38615783