您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. LJParser文本搜索与挖掘开发平台

  2. 一、简介 LJParser文本搜索与挖掘开发平台包括:全文精准搜索,新词发现,汉语分词标注,词语统计与术语翻译,自动聚类与热点发现,分类过滤,自动摘要,关键词提取,文档去重,正文提取等十余项功能。针对互联网内容处理的需要,融合了自然语言理解、网络搜索和文本挖掘的技术,提供了用于技术二次开发的基础工具集。开发平台由多个中间件组成,各个中间件API可以无缝地融合到客户的各类复杂应用系统之中,可兼容Windows,Linux, Android,Maemo5, FreeBSD等不同操作系统平台,可以供
  3. 所属分类:Web开发

    • 发布日期:2010-05-11
    • 文件大小:17825792
    • 提供者:lingjoin
  1. 灵柩软件 可用于汉语分词处理

  2. LJParser文本搜索与挖掘开发平台的十大功能: 1. 全文精准检索 支持文本、数字、日期、字符串等各种数据类型,多字段的高效搜索,支持AND/OR/NOT以及NEAR邻近等查询语法,支持维语、藏语、蒙语、阿拉伯、韩语等多种少数民族语言的检索。可以无缝地与现有文本处理系统与数据库系统融合。 2. 新词发现: 从文件集合中挖掘出内涵的新词语列表,可以用于用户专业词典的编撰;还可以进一步编辑标注,导入分词词典中,从而提高分词系统的准确度,并适应新的语言变化。 3. 分词标注: 对原始语料进行分词
  3. 所属分类:Web开发

    • 发布日期:2010-11-05
    • 文件大小:688128
    • 提供者:zhangguoqiang52
  1. oracle·10G函数大全

  2. 很全面的oracle函数介绍和使用,非常详细,分类整理清晰,针对每个函数的功能,参数,条件,返回类型都进行了说明,有相关示例参考,还列出了对应的相近和相反的函数。 共分为七类: 数值型函数 字符型函数 日期函数 转换函数 聚组函数 分析函数 其它函数
  3. 所属分类:Oracle

    • 发布日期:2011-11-24
    • 文件大小:71680
    • 提供者:l838024497
  1. 《自己动手写搜索引擎》罗刚——doc版

  2.  《自己动手写搜索引擎》是猎兔企业搜索开发团队的软件产品研发和项目实践的经验汇总。《自己动手写搜索引擎》全方位展现出一个商用级别的Lucene搜索解决方案,主要包括爬虫、自然语言处理和搜索实现部分。爬虫部分介绍了网页遍历方法和从网页提取主要内容的方法。   自然语言处理部分包括了中文分词从理论到实现以及在搜索引擎中的实用等细节。   其他自然语言处理的经典问题与实现包括:文档排重、文本分类、自动聚类、语法解析树、拼写检查、拼音转换等理论与实现方法。   在实现搜索方面,《自己动手写搜索引擎》用
  3. 所属分类:Web开发

  1. SQL Server 2008 商业智能完美解决方案 第一部分

  2. SQL Server 2008 商业智能完美解决方案 书籍的扫描整理版本,由于文件太大,分三个包,三个包都下载了解压即可。 《SQL Server 2008商业智能完美解决方案》结合专家团队提供的实际示例和丰富经验进行介绍,让读者能够直观轻松地掌握构建商业智能(BI)解决方案的概念、工具和技术,是一本不可多得的商业智能开发参考指南。无论是商业智能(BI)编程新手还是经验丰富的老手,都可从《SQL Server 2008商业智能完美解决方案》中获益。 图书目录   第一部分 面向商业决策者和架构
  3. 所属分类:SQLServer

    • 发布日期:2012-10-24
    • 文件大小:59768832
    • 提供者:yrq205
  1. SQL Server 2008 商业智能完美解决方案 第二部分

  2. SQL Server 2008 商业智能完美解决方案 书籍的扫描整理版本,由于文件太大,分三个包,三个包都下载了解压即可。 《SQL Server 2008商业智能完美解决方案》结合专家团队提供的实际示例和丰富经验进行介绍,让读者能够直观轻松地掌握构建商业智能(BI)解决方案的概念、工具和技术,是一本不可多得的商业智能开发参考指南。无论是商业智能(BI)编程新手还是经验丰富的老手,都可从《SQL Server 2008商业智能完美解决方案》中获益。 图书目录   第一部分 面向商业决策者和架构
  3. 所属分类:SQLServer

    • 发布日期:2012-10-24
    • 文件大小:59768832
    • 提供者:yrq205
  1. NLPIR大数据搜索与挖掘共享开发平台

  2. 一、简介 NLPIR文本搜索与挖掘开发平台针对互联网内容处理的需要,融合了自然语言理解、网络搜索和文本挖掘的技术,提供了用于技术二次开发的基础工具集。开发平台由多个中间件组成,各个中间件API可以无缝地融合到客户的各类复杂应用系统之中,可兼容Windows,Linux, Android,Maemo5, FreeBSD等不同操作系统平台,可以供Java,C,C#等各类开发语言使用。 NLPIR是一套专门针对原始文本集进行处理和加工的软件,提供了中间件处理效果的可视化展示,也可以作为小规模数据的处
  3. 所属分类:C/C++

    • 发布日期:2014-10-24
    • 文件大小:41943040
    • 提供者:u012548562
  1. firtex-1.0.3_RC_src(Windows版本源代码)

  2. 开放式架构: 采用标准C++实现,支持Windows,Unix-like 操作系统; 实验和工程的通用平台,不仅是一个检索系统,同时也是一个全文索引和检索框架 多个组件基于插件设计,不仅可以采用C/C++对系统进行扩展,也可以通过内置的跨平台COM库设计COM组件来扩展系统 。 功能: 支持增量索引,差量索引,多字段索引,提供了3种前向索引方式; 支持纯文本,HTML,PDF等文件格式; 提供快速中文分词; 从底层到高层,提供了多种索引访问接口,灵活自由地使用索引文件; 提供丰富的检索语法,支
  3. 所属分类:C++

    • 发布日期:2008-12-21
    • 文件大小:8388608
    • 提供者:ydd1991
  1. firtex-1.0.3_RC_src.tar(Linux版本源代码)

  2. 开放式架构: 采用标准C++实现,支持Windows,Unix-like 操作系统; 实验和工程的通用平台,不仅是一个检索系统,同时也是一个全文索引和检索框架 多个组件基于插件设计,不仅可以采用C/C++对系统进行扩展,也可以通过内置的跨平台COM库设计COM组件来扩展系统 。 功能: 支持增量索引,差量索引,多字段索引,提供了3种前向索引方式; 支持纯文本,HTML,PDF等文件格式; 提供快速中文分词; 从底层到高层,提供了多种索引访问接口,灵活自由地使用索引文件; 提供丰富的检索语法,支
  3. 所属分类:C++

    • 发布日期:2008-12-21
    • 文件大小:7340032
    • 提供者:bluecll
  1. 基于快速密度聚类的电力通信网节点重要性评估.pdf

  2. 电力通信网的节点重要性评估是电力通信研究的一个重要议题。针对目前电力通信网节点重要性评估存在 的连接权值单一以及评价指标单一等问题,利用电力通信网的带宽和距离作为权值,计算电力通信网节点的多种 评价指标:节点强度、节点紧密度以及节点的介数。基于电力通信网节点的多种评价指标,利用快速密度聚类方 法建立电力通信网的节点重要性评估模型,为电网通信的规划做支撑。通过快速密度聚类方法进行无监督的分类, 将节点分为若干个重要性等级。该方法可以有效地改善基于距离的无监督分类方法的不足。利用某省的实际电
  3. 所属分类:其它

    • 发布日期:2019-09-13
    • 文件大小:403456
    • 提供者:weixin_38743481
  1. 科技文献数据挖掘关键技术研究.pdf

  2. 科技文献数据挖掘关键技术研究分类号 密级: UDC 编号 工学硕士学位论文 科技文献数据挖掘关键技术研究 硕士研究生:李梦阳 指导教师:姚念民教授 学位级别:工学硕士 学科、专业:计算机科学与技术 所在单位:计算机科学与技术学院 论文提交日期:2015年3月3日 论文答日期:2015年3月13日 学位授予单位:哈尔滨工程人学 Classified Index U. D. C. A Dissertation for the degree of M. Eng Research on key tec
  3. 所属分类:互联网

    • 发布日期:2019-07-08
    • 文件大小:2097152
    • 提供者:dddds123
  1. 标准送审稿2019DevOps研发运营(3).pdf

  2. 标准送审稿2019DevOps研发运营(3).pdfYDT1756T2018 7.11配置对象 ..11 7.12配置数据 11 8容量和成本管理 81容量管理…… 12 81.1基础设施容量 12 812业务容量 12 8,2成本管理… 13 821成本合理性 822预算与核算 13 9高可用管理 4 91应用高可用管理, 14 911弹性能力 14 912柔性能力 15 913运行与维护管理 .15 92数据高可用管理…. 16 921数据库高可用 16 922缓存高可用 17 10业务连续
  3. 所属分类:互联网

    • 发布日期:2019-07-05
    • 文件大小:1048576
    • 提供者:zl3533
  1. 商品用户行为数据处理中的数学问题(3)

  2. 随着网络时代不断的发展,网购已成为人民大众主要购物方式,基于大数据预测用户网购行为成为了重要的问题,本文通过所给 20000 用户数据对其商品行为进行预测并给出评价指标。以ut-8格式编码;包含 user id和 item id两列(均为 string类型),要求去除重复。例 如 user id I item id 100000 2345 100000 2478 100001 127900 100002 207245 评估指标 釆用经典的精确度( precision)、召回率( recall〕和
  3. 所属分类:其它

    • 发布日期:2019-03-15
    • 文件大小:1048576
    • 提供者:zrg_hzr_1
  1. 聚类分类时间数据的框架

  2. 在无监督学习中经常做出的基本假设是,问题是静态的,即,类别的描述不会随时间变化。 但是,许多实际的群集任务都涉及不断变化的环境。 因此,人们认识到,分析不断变化的环境趋势的方法和技术越来越受到关注和重视。 尽管聚类数值随时间变化的数据的问题已得到很好的探讨,但是聚类分类随时间变化的数据的问题仍然是一个具有挑战性的问题。 在本文中,我们提出了一个用于分类时间演化数据的通用聚类框架,该框架由以下三种算法组成:一种用于检测当前滑动窗口与最后一个滑动窗口之间差异的漂移概念检测算法,一种数据标记算法该算法
  3. 所属分类:其它

    • 发布日期:2021-02-23
    • 文件大小:262144
    • 提供者:weixin_38530995
  1. lexpredict-lexnlp:LexPredict的LexNLP-源码

  2. LexPrep的LexNLP 真实,非结构化法律文本的信息检索和提取 LexNLP是用于处理真实的,非结构化的法律文本(包括合同,计划,政策,程序和其他材料)的库。 LexNLP提供以下功能: 细分和标记化,例如 一个句子解析器,它知道LLC等常见的法律缩写。 或F.3d。 针对法律概念(例如页面或版块)的预训练细分模型。 广泛且针对特定实践领域的预训练词嵌入和主题模型 针对文档类型和子句类型的预训练分类器 事实提取范围广泛,例如: 货币金额,非货币金额,百分比,比率 条件语句和约束,例
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:141557760
    • 提供者:weixin_42110070
  1. 基于随机森林算法的台区合理线损率估计方法

  2. 线损管理是电力公司的重点管理内容之一,低压电网普遍采用分台区的管理手段。供电侧数据缺失和营销抄表日期冲突导致的线损率缺失是电力公司线损系统中台区线损数据存在的主要问题。为此,提出了一种涉及多源数据的基于随机森林算法的台区合理线损率估计方法。从线损系统、生产管理系统和营销系统中提取台区、变压器和用户相关数据,建立台区特征数据库;对台区进行聚类分析,并在此基础上建立决策树分类模型和随机森林估计模型;利用上述模型估计台区线损率。以上海电力公司实际数据为例,计算结果验证了所提方法的可行性;并将所得结果与
  3. 所属分类:其它

    • 发布日期:2021-01-13
    • 文件大小:1048576
    • 提供者:weixin_38499950
  1. django-ml-app:可以解决您的回归,分类,聚类或深度学习问题的Web应用程序-源码

  2. 自动化数据科学 这个django专案有多个应用程式: regml-回归问题 classml-分类问题 clustml-聚类问题 superml-深度学习问题 该Web应用程序的最终目标是能够分析提供的数据集并从最常用的模型中推荐最佳的ML模型。 这全都取决于您的机器学习问题。 该工具将执行所需的任何数据预处理-数据清理,特征提取,规范化等。它将可视化数据并查看特征之间的关系。 最终用户只需输入很少的内容,就可以分别处理数字,分类和日期时间功能。 这听起来不令人兴奋吗? REGML-回归ML
  3. 所属分类:其它

    • 发布日期:2021-04-01
    • 文件大小:3145728
    • 提供者:weixin_42110038
  1. TSML.jl:一个用于时间序列数据处理,分类,聚类和预测的软件包-源码

  2. 文献资料 建置状态 帮助 随着时间的推移观星人 TSML(时序机器学习) TSML是用于时间序列数据处理,分类,聚类和预测的软件包。 它使用通用API结合了Python的ScikitLearn(通过其互补的软件包)和Julia ML的ML库,并允许无缝集成和集成异构ML库以创建复杂的模型,以进行可靠的时间序列预测。 该包的设计/框架受Samuel Jenkins的和包的影响很大。 TSML在Julia 1.0及更高版本中针对Linux,MacOS和Windows进行了积极开发和测试。 链接到
  3. 所属分类:其它

    • 发布日期:2021-03-31
    • 文件大小:2097152
    • 提供者:weixin_42152298
  1. ITU-ACM-20-21-Spring-Machine-Learning-源码

  2. ITU-ACM-20-21-Spring机器学习 讲师 穆罕默德·伊耶特·阿特斯(MehmetYiğitAteş) 计算机工程#2 ITU 先决条件 Python编程语言的基本知识。 微积分和线性代数的基本知识。 目标 使参与者熟悉基本的机器学习主题,例如分类和回归 让与会者熟悉机器学习算法的工作机制和数学 人工神经网络介绍 介绍NumPy计算库的基础 教学大纲 #日期 #话题 #描述 16.03.2021 机器学习导论 机器学习的工作原理,NumPy和梯度下降 23.03.2021 线
  3. 所属分类:其它

    • 发布日期:2021-03-30
    • 文件大小:4194304
    • 提供者:weixin_42131601
  1. Data-Science:R中的EDA和机器学习模型(回归,分类,聚类,SVM,决策树,随机森林,时间序列分析,推荐系统,XGBoost)-源码

  2. EDA和ML项目 存储库包含各种项目,这些项目都使用R语言编写了以下代码: 探索性数据分析 机器学习模型(线性回归,逻辑回归,k均值聚类,分层聚类,SVM,决策树,随机森林,时间序列分析,XGBoost) 以下是一些常用的程序包/库的列表,这些程序包/库被用作数据分析和构建机器学习模型的一部分 数据处理: dplyr,plyr,tidyr,stringer,data.table,lubridate(用于日期处理), 数据可视化: ggplot2,cowplot,ggthemes,比例 ML模型:
  3. 所属分类:其它

    • 发布日期:2021-03-20
    • 文件大小:27262976
    • 提供者:weixin_42135462
« 12 »