您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 基于视觉特征的网页正文提取方法研究

  2. 基于视觉特征的网页正文提取方法研究
  3. 所属分类:其它

    • 发布日期:2012-04-08
    • 文件大小:386048
    • 提供者:cczz598
  1. 基于视觉特征的网页正文提取方法研究

  2. 利用网页的视觉特征和DOM树的结构特性对网页进行分块,并采用逐层分块逐层删减的方法将与正文无关的噪音块删除,从而得到正文块。对得到的正文块运用VIPS算法得到完整的语义块,最后在语义块的基础上提取正文内容。试验表明,这种方法是切实可行的。
  3. 所属分类:其它

    • 发布日期:2020-10-26
    • 文件大小:205824
    • 提供者:weixin_38738005