您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 基于相邻词的中文关键词自动抽取

  2. 请先下载CAJ阅读器 对于单编文档d自动提取关键词的算法如下所述; 1 使用基于词典的正向最小分词算法对文档进行分词。 2统计出文档d中每个词t在d中的TF,并将每个词在d中的权重Wt.....
  3. 所属分类:其它

    • 发布日期:2010-11-09
    • 文件大小:73728
    • 提供者:qdfch
  1. XML文档的相似测度和结构索引研究

  2. 提出了一个可用于定量度量XML文档问差异的方法(称为XED距离).利用结点问的模拟关系,一个 XML文档可以表示为一棵精简的、带权重的结构索引树.两个XML文档间的相似度可以通过计算它们的索引树 问的编辑距离来测定.利用索引树可以大大提高判定两个XML文档结构相似度的效率.XED距离测度可用于 XML文档的结构搜索、XML文档聚类、XML文档结构抽取、XML文档的变换检测以及XML视图的增量计算
  3. 所属分类:其它

    • 发布日期:2012-09-19
    • 文件大小:288768
    • 提供者:gzh5432467
  1. 风暴的多普勒雷达自动识别.caj

  2. 3种基于雷达的风暴自动识别方法:(1)美国WSR-88D Build 7.0风暴算法,它利用多个预设阈值来检验回波的强度和连续性,以构造具有三维连续结构的风暴,该方法在风暴合并、分裂以及多个单体相距较近时误差较大。(2)为美国WSR-88D Biuld 9.0风暴算法(B9SI),它用7个反射率因子识别阈值替代此前唯一的一个反射率因子阈值,增加了特征核抽取和相近单体处理技术,并保留远距离上的强的2D分量。该方法在面对成串或成簇多单体时,能够识别出多个单体核,并准确定位。B9SI没有考虑反射率因
  3. 所属分类:其它

    • 发布日期:2012-09-21
    • 文件大小:2097152
    • 提供者:radar_seven_2
  1. 图像的模糊处理!

  2. 这个也是从d8的程序中抽取过来的,但是我处理的方式不太好。因为我是用了按键来改变纹理元素的颜色。这样的后果是按下去后程序会卡一段时间。具体的原因在程序中解释了。这里面的技术是读取相邻的元素的颜色根据权重算出纹理的颜色。这样牵涉到概念核心数组。这里面有3x3的核心数组。5x5的核心数组。关键是模糊处理的思想。所以,我先发程序了。大家觉得不好请自行修改。
  3. 所属分类:C/C++

    • 发布日期:2013-10-24
    • 文件大小:3145728
    • 提供者:a03910
  1. 文本挖掘tmSVM开源项目包含Python和Java两种版本带参考文档

  2. 文本挖掘tmSVM开源项目集成libSVM和liblinear包含Python和Java两种版本带PDF源码参考文档 简介 文本挖掘无论在学术界还是在工业界都有很广泛的应用场景。而文本分类是文本挖掘中一个非常重要的手段与技术。现有的分类技术都已经非常成熟,SVM、KNN、Decision Tree、AN、NB在不同的应用中都展示出较好的效果,前人也在将这些分类算法应用于文本分类中做出许多出色的工作。但在实际的商业应用中,仍然有很多问题没有很好的解决,比如文本分类中的高维性和稀疏性、类别的不平衡
  3. 所属分类:Python

    • 发布日期:2014-02-23
    • 文件大小:3145728
    • 提供者:vcfriend
  1. A Fast Approximate Nearest Neighbor Search Algorithm in the Hamming Space

  2. 该文献的主要思想是:输入文件的哈希值(我用的是文件名)例如一个64位的哈希值,多次随机抽取若干位(例如4位)的值组成一个字串,按照字串值的不同将文件放入不同的哈希桶中。这样一个64位哈希值将被放入64/4=16个桶中,查询时把所有查询点也哈希成64位哈希值,按照相同的方式随机抽取,把所在桶中所有的字符串全部拿出来做候选集。同时,为了进一步提高查全率设定一个权重值(度量汉明距离),准备一个汉明字典将所有字串和其他汉明字串的值记录用以将权重值内的桶的字符串也做为候选集。
  3. 所属分类:其它

    • 发布日期:2014-08-19
    • 文件大小:806912
    • 提供者:zhangliangaws
  1. 基于依存句法分析的多主题文本摘要研究.pdf

  2. 基于文本关系图摘要是当下多主题文本摘要中常用方法,针对该方法的不足,对其进行了改进。首先,由 于基于词频统计的文本相似度计算方法对句子作用有限,引入依存句法分析,通过挖掘语义信息来扩展句子特征 项,提高句子相似度计算准确性。其次,选择基于图结构的无尺度图K-中心点聚类算法对文本关系图进行聚类分 析,提高主题挖掘的准确性。最后,综合考虑句子相似度和位置信息来计算句子权重,提高摘要句抽取的准确性。 最后用实验证明该改进方法的有效性。
  3. 所属分类:Java

    • 发布日期:2014-10-17
    • 文件大小:1048576
    • 提供者:u013085605
  1. C语言、Python实现TF-IDF算法

  2. 该资源属于代码类,用C语言和Python实现了TF-IDF算法,适用于文本分类等特征权重抽取
  3. 所属分类:C

    • 发布日期:2015-11-01
    • 文件大小:3072
    • 提供者:blinkhow
  1. TFIDF C#版

  2. 该资源属于代码类,用C#实现了TF-IDF算法,适用于文本分类等特征权重抽取
  3. 所属分类:C#

    • 发布日期:2016-11-22
    • 文件大小:2048
    • 提供者:qiqittjj
  1. 权重控制随机抽取率

  2. 利用权重数控制随机抽取概率,在后台控制的时候可以根据权重数控制
  3. 所属分类:C#

    • 发布日期:2018-08-08
    • 文件大小:180224
    • 提供者:acycwf
  1. SSD抽取权重

  2. SSD检测网络抽取权重,用于生成更好的预训练模型,加快收敛速度。
  3. 所属分类:Python

    • 发布日期:2018-02-02
    • 文件大小:6144
    • 提供者:jesse_mx
  1. 抽奖随机加权示例源码.zip

  2. 抽奖随机加权示例源码,根据装备的权重产生暴出率,好的装备会暴出率极低 前台可根据输入抽取的次数,展示暴击结果 示例有两个一个是装备的暴出展示,一个是餐馆抽中几率展示
  3. 所属分类:其它

    • 发布日期:2019-05-23
    • 文件大小:27648
    • 提供者:weixin_39840924
  1. Java开源的下一代社区平台Symphony.zip

  2. 简介 Symphony([ˈsɪmfəni],n.交响乐)是一个现代化的社区平台,因为它: 实现了面向内容讨论的论坛 包含了面向用户分享、交友、游戏的社交网络 集成了聚合独立博客的能力,共建共享优质资源 并且 100% 开源 欢迎到 Sym 官方讨论区了解更多。另外,如果你需要搭建一个企业内网论坛,请使用 SymX。 动机 Sym 的诞生是有如下几点原因: (正版) 很多系统界面上仍然保持着老式风格,远远没有跟上时代发展的脚步,它们没有创新、好玩的特性,缺少现代化的交互元素和用户体验 大部分系
  3. 所属分类:其它

    • 发布日期:2019-07-19
    • 文件大小:4194304
    • 提供者:weixin_39841848
  1. 管理海量数据-压缩、索引和查询 第2版.zip

  2. 第1章 概览 1.1 文档数据库(document databases) 1.2 压缩(compression) 1.3 索引(indexes) 1.4 文档索引 1.5 MG海量文档管理系统 第2章 文本压缩 2.1 模型 2.2 自适应模型 2.3 哈夫曼编码 范式哈夫曼编码 计算哈夫曼编码长度 总结 2.4 算术编码 算术编码是如何工作的 实现算术编码 保存累积计数 2.5 符号模型 部分匹配预测 块排序压缩 动态马尔科夫压缩 基于单字的压缩 2.6 字典模型 自适应字典编码器的LZ77
  3. 所属分类:数据库

    • 发布日期:2019-08-04
    • 文件大小:236978176
    • 提供者:harlensaint
  1. Web新闻关键词抽取与主题特征自动化构建研究

  2. Web新闻关键词抽取与主题特征自动化构建研究,单艳雯,刘鲁,将词汇位置信息引入权重的计算过程,提出了基于位置重要性的Web新闻关键词抽取算法。进一步,将算法引入Web新闻主题特征构建框架中
  3. 所属分类:其它

    • 发布日期:2020-01-16
    • 文件大小:301056
    • 提供者:weixin_38621441
  1. \"Tag-TextRank:一种基于Tag的网页关键词抽取方法\"分享总结

  2. NULL 博文链接:https://snv.iteye.com/blog/1886969在 Wikipedia中的实体,并且算法的复杂度很高。另外,国内一些学者lm2也开展了关键 词提取的研究。实际上,从上面的工作,我们可以得到这样的基本结论:基本的R特征可 以找到部分关键词,而加入用户信息或者领域知识可以进一步提高关键词抽取效果。 本文利用Tag信息来提高关键词的抽取效果。近年来,Tag数据作为·种新的资源, 其挖掘和利用已经成为信息检索、社区发现等领域的研究热点。从数据质量上讲,Iag数 据
  3. 所属分类:其它

    • 发布日期:2019-04-20
    • 文件大小:1046528
    • 提供者:weixin_38669628
  1. 商品用户行为数据处理中的数学问题(1)

  2. 随着网络日益普及,选择使用网络购物的人数也大大增加,个性化推荐模型能极大地提升商家的收益。本文通过对问题和数据的分析和合理假设,建立回归方程模型以及协同过滤推荐算法,给出符合实际的个性化推荐模型,并给出销售策略。问题三:题目要求建立对于不同地点的推荐模型并给出预测结果。本文选择建立基 于协冋同过滤的地点综合推荐模型。建立川户-商品评分矩阵,再综合不同地区不同种类商 品的购买量加权求和,取出评分最大的几个商品作为12月18号的预测购买结果并进行 精度检验。 问题四:题∏要求建立对于不同时间以及地点
  3. 所属分类:其它

    • 发布日期:2019-03-15
    • 文件大小:778240
    • 提供者:zrg_hzr_1
  1. 非负矩阵分解算法的代码

  2. 作为一种重要的身份认证的手段,人脸识别已经广泛地应用于管理、安全等各个领域。人脸识别的一个关键性的问题是特征抽取,即如何从众多的特征中寻找最有效的特征。子空间分析法是一种有效的特征抽取方法,而本文所研究讨论的非负矩阵分解(Non-negative Matrix Factorization, NMF)具有一些独特的优点,成为构建特征子空间的一种有效的方法。 非负矩阵分解是一种新的矩阵分解方法,它将一个非负矩阵分解为左右两个非负矩阵的乘积。由于分解前后的矩阵中仅仅包含非负元素,因此原来矩阵中的列向量
  3. 所属分类:其它

    • 发布日期:2010-04-12
    • 文件大小:8192
    • 提供者:xuying198702
  1. 基于动词名词和CHI特征选择的中文人物社会关系抽取

  2. 针对中文人物社会关系标注语料库的匮乏和人物关系分类过于粗糙的问题,采用一种简单的方式标注了八类主要人物社会关系。为了有效地降低特征向量的维数避免维数灾难,并尽可能去除噪声特征以提高关系抽取的准确率,提出一种基于动词和名词抽取与χ2统计量法( CHI) 相结合的特征选择方法,并使用TF-IDF计算特征权重。通过SVM 分类器进行实验,F值和正确率都得到了提高; 为了充分利用数据集对该特征选择方法的效果进行测试,使用k-折交叉验证检验该方法的有效性,实验表明通过该方法产生的分类模型具有较强的区分能力
  3. 所属分类:其它

    • 发布日期:2021-02-25
    • 文件大小:827392
    • 提供者:weixin_38657353
  1. 基于结点权重模型的XML片段检索策略

  2. 当用户向XML检索引擎提交查询后,返回的结果通常远远多于用户的期望,返回结果中难免有一些不相关的文档或结点.对于以文档为中心的XML文档集合,XML片段检索是根据用户的查询,从XML检索引擎返回的XML文档或结点中抽取出仅包含数百字节的片段,用户可以通过该片段判断片段所在的XML文档或结点与查询的真实相关性,以决定是否有必要进一步阅读,从而有效地提高从XML文档中获取信息的效率.该文提出了基于结点权重模型的XML片段检索策略.该策略先利用结点权重模型ATG(平均主题概括强度)对XML文档集中的标
  3. 所属分类:其它

    • 发布日期:2021-02-09
    • 文件大小:911360
    • 提供者:weixin_38570296
« 12 »