您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 基于分数次布朗运动理论的无线通信业务的特性分析

  2. 文章首次提出了用分数次布朗运动来分析无线通信业务,分数次布朗运动具有自相似性、壅尾性及长期相关性,因此能够完整地分析无线通信业务的特性并仿真出相应的业务图,从业务量到具体的会话层、网页层、对象展进行分析,得出无线环境下的网络特性。
  3. 所属分类:网络基础

    • 发布日期:2009-12-15
    • 文件大小:324608
    • 提供者:yuyufe776
  1. 一种编辑距离算法及其在网页搜索中的应用

  2. 针对传统方法不能很好地处理网页中简短域与用户查询之间的相关性排序问题,提出一种 基于改进的编辑距离排序算法.将以词为单位的用户查询和简短网页域通过匹配编码转化为2个 字符串,再利用改进的编辑距离计算2个字符串之间的相似性.
  3. 所属分类:其它

    • 发布日期:2010-02-03
    • 文件大小:365568
    • 提供者:lhqhust
  1. ROST文档相似性检测工具

  2. (1)本软件不能检查已发表文档,因为已发表的文档往往已经到处传播和引用开来。 (2)本软件的每检测400字需要6秒钟,一篇8000字的文档至少需要2分钟,需要一点点耐心。 (3)本软件检测结果存在误差,用更小的文档块进行检测,可以减少误差,但需要的时间会相应增加,块数大小定为200-400字较为合适,此时误差率也是可以接受的,文档相似率一般是比实际的要低。 (4)如果某个相似块未显示,说明未检索到相似的文档。 (5)本软件每天检测字数不能超过10万字,否则服务器过载,将封锁IP。 (6)本软件
  3. 所属分类:专业指导

    • 发布日期:2010-05-09
    • 文件大小:1048576
    • 提供者:zhuojun
  1. 面向主题的网页采集系统的设计与研究

  2. 对面向主题的信息采集技术进行了探索性研究。采用基于DOM的信息抽取技术, 建立混合空问模型表示内容和结构特征信息,并通过定义网贞间相似性来识别主题页面。较好的处理了Web信息抽取中主题页面识别的问题,实验结果证明了系统的可行性。
  3. 所属分类:网络基础

    • 发布日期:2010-09-16
    • 文件大小:364544
    • 提供者:yerida
  1. 网页相似性算法的研究与实现

  2. 吉林大学一个张同学的硕士论文。 对于网页首先用过滤净化算法得到网页的主要内容再进行特征选取,选出有代表性的文本块,并对每个文本块采用指纹算法计算它们的指纹,那么每个文档就可以用一组指纹来代表,这样就可以通过两个文档所具有相同指纹的数量来判断他们是否是相似的。在检测相似文档时还可以一对多或多对多同时进行检测。相对于其它的一些方法,我们的方法更适用于相似网页的检测。
  3. 所属分类:其它

    • 发布日期:2010-09-27
    • 文件大小:1048576
    • 提供者:afanger
  1. 2011硕士论文查重软件 反抄袭软件

  2. 马上要预答辩了,在网上新下了个查重软件,感觉不错,特来推荐按! 说明: ⑴.本软件不能检查已发表文档,因为已发表的文档往往已经到处传播和引用开来。 ⑵.本软件的每检测400字需要6秒钟,一篇8000字的文档至少需要2分钟,需要一点点耐心。 ⑶.本软件检测结果存在误差,用更小的文档块进行检测,可以减少误差,但需要的时间会相应增加,经过我们在多家编辑部的试用情况,块数大小定为200-400字较为合适,此时误差率也是可以接受的,文档相似率一般是比实际的要低。 ⑷.如果某个相似块未显示,说明未检索到相
  3. 所属分类:专业指导

    • 发布日期:2011-03-16
    • 文件大小:1048576
    • 提供者:youol
  1. ROST 文档相似性 检测工具

  2. 相当好用的文档检测工具~~好不容易弄到一个能用的,分享给大家~~~ (1)本软件不能检查已发表文档, 因为已发表的文档往往已经到处传播和引用开来。 (2)本软件的每检测400字需要6秒钟, 一篇8000字的文档至少需要2分钟,需要一点点耐心。 (3)本软件检测结果存在误差, 用更小的文档块进行检测,可以减少误差,但需要的时间会相应增加,块数大小定为200-400字较为合适,此时误差率也是可以接受的,文档相似率一般是比实际的要低。 (4)如果某个相似块未显示, 说明未检索到相似的文档。 (5)本
  3. 所属分类:管理软件

    • 发布日期:2011-10-31
    • 文件大小:1048576
    • 提供者:birdmenscheng
  1. 基于支持向量机的搜索引擎垃圾网页检测研究

  2. 现有的基于内容特征的垃圾网页检测模型忽略了网页之间的链接关系,故构建了软间隔支持向量机分类器,以网页的内容特征作为支持向量机,根据网页之间的链接具有相似性的特点定义了惩罚函数,使用样本集学习,得出了线性支持向量机网页分类器,并对分类器的分类效果进行了测试。
  3. 所属分类:其它

    • 发布日期:2011-12-27
    • 文件大小:214016
    • 提供者:qiuqihui
  1. [疯狂Android讲义].李刚.配套源码

  2. 绝对超值,绝对能下,绝对能解压缩,不好你们拍我。 《疯狂Android讲义》是一本介绍Android应用开发的实用图书,全面介绍了Android 2.3平台上应用开发各方面的知识。如果你对JDK安装、Java基本语法还不熟,本书并不适合你。本书只用了一章来介绍如何搭建Android开发环境、Android应用结构,当然也简要说明了Android的发展历史。本书只是一本介绍Android实际开发的图书,这不是一本关于所谓“思想”的书,不要指望学习本书能提高你所谓的“Android思想”,所以奉劝
  3. 所属分类:Android

    • 发布日期:2012-03-17
    • 文件大小:10485760
    • 提供者:lovehome9
  1. 编辑距离JS算法

  2. 这是用JS编写的一个编辑距离算法,可以用来在网页中检测语句相似性!检测两个字符串的相似性!
  3. 所属分类:Javascript

    • 发布日期:2012-04-11
    • 文件大小:1024
    • 提供者:zzhandlyq
  1. 论文查重软件(论文相似性检测)

  2. (1)本软件不能检查已发表文档,因为已发表的文档往往已经到处传播和引用开来。 ⑵.本软件的每检测400字需要6秒钟,一篇8000字的文档至少需要2分钟,需要一点点耐心。 ⑶.本软件检测结果存在误差,用更小的文档块进行检测,可以减少误差,但需要的时间会相应增加,经过我们在多家编辑部的试用情况,块数大小定为200-400字较为合适,此时误差率也是可以接受的,文档相似率一般是比实际的要低。 ⑷.如果某个相似块未显示,说明未检索到相似的文档。 ⑸.本软件每天检测字数不能超过10万字,否则服务器过载,将
  3. 所属分类:其它

    • 发布日期:2014-10-12
    • 文件大小:3145728
    • 提供者:yeliuxing1234
  1. java实现simhash

  2. java实现simhash算法,适用于网页去重,文档相似性分析
  3. 所属分类:Java

    • 发布日期:2017-10-12
    • 文件大小:6144
    • 提供者:qq_25237355
  1. \"Tag-TextRank:一种基于Tag的网页关键词抽取方法\"分享总结

  2. NULL 博文链接:https://snv.iteye.com/blog/1886969在 Wikipedia中的实体,并且算法的复杂度很高。另外,国内一些学者lm2也开展了关键 词提取的研究。实际上,从上面的工作,我们可以得到这样的基本结论:基本的R特征可 以找到部分关键词,而加入用户信息或者领域知识可以进一步提高关键词抽取效果。 本文利用Tag信息来提高关键词的抽取效果。近年来,Tag数据作为·种新的资源, 其挖掘和利用已经成为信息检索、社区发现等领域的研究热点。从数据质量上讲,Iag数 据
  3. 所属分类:其它

    • 发布日期:2019-04-20
    • 文件大小:1046528
    • 提供者:weixin_38669628
  1. 中心聚类和语义特征融合的网页信息文本挖掘方法

  2. 针对网页信息内容丰富且结构复杂,难以准确挖掘的问题,采用中心聚类和语义特征相互融合的方法.利用中心聚类算法确定样本最终的聚类中心,根据每个词在网页中出现的频率和词的上下文语义,构造一个网页-词语的权重映射矩阵,并将语义特征作为中心聚类相似性的判断依据,完成网页文本信息的挖掘.实验结果表明:利用该方法对网页文本进行挖掘,在时间增加不多的情况下,可以获得更高的召回率和准确率.
  3. 所属分类:其它

    • 发布日期:2020-05-30
    • 文件大小:588800
    • 提供者:weixin_38531017
  1. 论文相似性检测工具(论文查重软件)

  2. (1)本软件不能检查已发表文档,因为已发表的文档往往已经到处传播和引用开来。 ⑵.本软件的每检测400字需要6秒钟,一篇8000字的文档至少需要2分钟,需要一点点耐心。 ⑶.本软件检测结果存在误差,用更小的文档块进行检测,可以减少误差,但需要的时间会相应增加,经过我们在多家编辑部的试用情况,块数大小定为200-400字较为合适,此时误差率也是可以接受的,文档相似率一般是比实际的要低。 ⑷.如果某个相似块未显示,说明未检索到相似的文档。 ⑸.本软件每天检测字数不能超过10万字,否则服务器过
  3. 所属分类:其它

    • 发布日期:2020-08-25
    • 文件大小:3145728
    • 提供者:swp0314
  1. PopStar-and-PopRank:使用网站敏捷性和社会声誉进行恶意网站检测。 Web搜寻器,以捕获源代码,链接并获取网页的屏幕截图。 还开发了用于直方图分析的代码,以使用Opencv计算图像的相似性。 使用机器学习分类器将网站分类为良

  2. PopStar-and-PopRank:使用网站敏捷性和社会声誉进行恶意网站检测。 Web搜寻器,以捕获源代码,链接并获取网页的屏幕截图。 还开发了用于直方图分析的代码,以使用Opencv计算图像的相似性。 使用机器学习分类器将网站分类为良性或恶意,还对搜索引擎结果进行排名,以使打Kong网站的排名较低
  3. 所属分类:其它

    • 发布日期:2021-03-25
    • 文件大小:3145728
    • 提供者:weixin_42150745
  1. 结构化数据丰富的网页分类研究

  2. Web页的主题识别和分类是垂直搜索引擎的核心,是结构化数据删除的替代,具有重要的学术价值,工程应用也非常广泛。以往的工作多以定向爬虫技术来解决垂直搜索引擎数据采集的专业化问题,而Web页面的主题识别和分类也多采用传统的文本分类方法。该框架首先解析Web页面的组织结构,通过属性检测算法,获得Web页面所包含的主题关键字。进一步通过计算主题关键字与结构化抽取模板的相似性来确定Web页面的主题并按照领域进行分类。该方法避免了主题蠕虫对URL格式严重依赖的问题,分类正确率也高于传统的文本分类方法。通过实
  3. 所属分类:其它

    • 发布日期:2021-03-10
    • 文件大小:555008
    • 提供者:weixin_38739164
  1. 基于匈牙利匹配算法的钓鱼网页检测方法

  2. 如何快速有效地计算网页的相似性是发现钓鱼网页的关键.现有的钓鱼网页检测方法在检测效果上依然存在较大的提升空间.文中提出基于匈牙利匹配的钓鱼网页检测模型,该模型首先提取渲染后网页的文本特征签名、图像特征签名以及网页整体特征签名,比较全面地刻画了网页访问后的特征;然后通过匈牙利算法计算二分图的最佳匹配来寻找不同网页签名之间匹配的特征对,在此基础上能够更加客观地度量网页之间的相似性,从而提高钓鱼网页的检测效果.一系列的仿真实验表明文中方法可行,并具有较高的准确率和召回率.
  3. 所属分类:其它

    • 发布日期:2021-02-20
    • 文件大小:641024
    • 提供者:weixin_38666232
  1. 基于页面布局相似性的钓鱼网页发现方法

  2. 针对钓鱼网页与真实网页布局结构相似的特点,提出了基于页面布局相似性的钓鱼网页发现方法,该方法首先抽取出网页中带链接属性的标签作为特征,然后基于该特征提取网页标签序列分支来标识网页;接着通过网页标签序列树对齐算法将网页标签序列树的对齐转换成网页标签序列分支的对齐,使二维的树结构转换成一维的字符串结构,最后通过生物信息学 BLOSUM62编码的替换矩阵快速计算对齐分值,从而提高钓鱼网页的检测效果,仿真实验表明该方法可行,并具有较高的准确率和召回率。
  3. 所属分类:其它

    • 发布日期:2021-01-14
    • 文件大小:730112
    • 提供者:weixin_38692631
  1. 面向高速网络流量的恶意镜像网站识别方法

  2. 针对网络环境中造成危害的信息通过镜像网站进行传播从而绕过检查的问题,提出了面向高速网络流量的恶意镜像网站识别方法。首先,从流量中提取碎片化数据并且还原网页源码,同时加入标准化处理来提高识别准确率;然后,将网页源码分块,利用相似度散列算法对每个网页源码分块计算散列值,得到网页源码的相似度散列值,同时引入海明距离来计算网页源码之间的相似性;最后,截取网页快照,提取其 SIFT 特征点,通过聚类分析和映射处理得到网页快照的感知散列值,通过感知散列值计算网页相似性。在真实流量下的实验表明,所提方法的准确
  3. 所属分类:其它

    • 发布日期:2021-01-14
    • 文件大小:878592
    • 提供者:weixin_38696196
« 12 »