您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Yard中文分词系统V0.1.1版

  2. Yard中文分词系统采用改进了的正向最大匹配算法,利用双字哈希进行词典组织解决了中文分词中最长词带来的分词效率低下问题。 本次发布的版本为0.1.1版能对中文词组进行完美的切分同时利用词组的词频和词性解决了歧义划分的问题,但是对人名、地名、组织名、英文、数字等还不能进行很好的切分,在下一个版本中将解决这些问题。中文词典应用了搜狗实验室提供的互联网词库。纯java编写源码和词典在附件中可以下载。本软件为开源软件你可以进行任何修改以适应你的需求,如果你加入了新功能请发送一份副本给我,我们一同完善改
  3. 所属分类:其它

    • 发布日期:2009-06-16
    • 文件大小:1048576
    • 提供者:Soul_fly
  1. 搜狗网页分类语料

  2. 搜狗实验室提供的免费实验语料。用于进行网页分类研究。
  3. 所属分类:专业指导

    • 发布日期:2007-12-28
    • 文件大小:169984
    • 提供者:wangyi1177
  1. 搜狗实验室技术交流文档 网络模型(PDF)

  2. 编写连接数巨大的高负载服务器程序时,经典的多线程模式和select 模式都不再适 用。应当抛弃它们,采用epoll/kqueue/dev_poll 来捕获I/O 事件。最后简要介绍了AIO。
  3. 所属分类:网络基础

    • 发布日期:2011-01-12
    • 文件大小:223232
    • 提供者:jaxe
  1. C10K问题的相关文档

  2. 搜狗实验室技术交流文档,探讨C10K问题的一些情况
  3. 所属分类:C++

    • 发布日期:2011-06-17
    • 文件大小:223232
    • 提供者:crazyleeyang
  1. 搜狗实验室技术交流文档

  2. 搜狗实验室技术交流文档 编写连接数巨大的高负载服务器程序时,经典的多线程模式和 select 模式都不再适 用。 应当抛弃它们, 采用 epoll/kqueue/dev_poll 来捕获 I/O 事件。 最后简要介绍了 AIO。
  3. 所属分类:其它

    • 发布日期:2011-08-21
    • 文件大小:223232
    • 提供者:sungis
  1. 搜狗实验室 文本分类语料库

  2. 搜狗实验室 文本分类语料库。可用于进行文本开发等相应实验练习
  3. 所属分类:其它

    • 发布日期:2013-06-03
    • 文件大小:24368795
    • 提供者:mao15034986148
  1. 搜狗实验室词典

  2. 词库比较全,可以用于基于机械分词的小型中文分词系统
  3. 所属分类:其它

    • 发布日期:2014-03-07
    • 文件大小:2097152
    • 提供者:itinchina
  1. linux网络编程之 epoll简介

  2. 编写连接数巨大的高负载服务器程序时,经典的多线程模式和 select模式都不再适 用。应当抛弃它们,采用 epoll/kqueue/dev_poll 来捕获 I/O 事件。最后简要介绍了 AIO。 --------- from 搜狗实验室
  3. 所属分类:Linux

    • 发布日期:2008-11-04
    • 文件大小:223232
    • 提供者:ronliu
  1. 搜狗实验室 文本分类语料库

  2. 搜狗实验室 文本分类语料库。可用于进行文本开发等相应实验练习
  3. 所属分类:其它

    • 发布日期:2016-10-25
    • 文件大小:24117248
    • 提供者:chenjieit619
  1. 搜狗实验室新闻分类语料库

  2. 搜狗实验室新闻分类语料库,主要有10个分类,共50多万条记录 0 汽车 1 财经 2 IT 3 健康 4 体育 5 旅游 6 教育 7 招聘 8 文化 9 军事
  3. 所属分类:机器学习

    • 发布日期:2017-06-19
    • 文件大小:26214400
    • 提供者:whzhaochao
  1. 搜狗实验室文本分类语料

  2. 搜狗实验室用于文本分类的语料库,包含财经、互联网、健康、教育、军事、旅游、体育、文化、招聘9个类别文本数据,每个类别包含1990篇文本。
  3. 所属分类:机器学习

    • 发布日期:2017-10-19
    • 文件大小:30408704
    • 提供者:wy8722
  1. 整理后的搜狗实验室全网新闻数据样例(word2vec用)

  2. 用来测试word2vec的数据样本,从搜狗实验室全网新闻数据库http://www.sogou.com/labs/resource/list_news.php 下载并提取出新闻内容的数据。
  3. 所属分类:机器学习

    • 发布日期:2018-04-13
    • 文件大小:263900
    • 提供者:czs1130
  1. 搜狗实验室文本(整理版)

  2. 搜狗实验室1个月数据,我已经整理过,做好了分类,并且去除了无用数据
  3. 所属分类:机器学习

    • 发布日期:2018-04-25
    • 文件大小:53477376
    • 提供者:imxtg
  1. 搜狗实验室(用户查询日志)

  2. 搜狗实验室(用户查询日志)SogouQ.reduced,用于做大数据分析的数据
  3. 所属分类:spark

    • 发布日期:2018-08-29
    • 文件大小:150994944
    • 提供者:c920644981
  1. 搜狐2012新闻语料(已分类,utf8格式)

  2. 对搜狗实验室的2012搜狐新闻语料进行切分、格式转换(已转为UTF8),从中抽取了11个新闻类别并分文件夹存储,每个txt文件包含600篇新闻。数据大概共54M,可以用于中文分类。
  3. 所属分类:机器学习

    • 发布日期:2018-02-05
    • 文件大小:56456685
    • 提供者:mrchung2016
  1. 搜狐新闻中文语料(已分类整理)

  2. 在搜狗实验室下载的搜狐新闻数据整理后的一部分中文分类语料~
  3. 所属分类:机器学习

    • 发布日期:2018-02-08
    • 文件大小:178257920
    • 提供者:wxxiangge
  1. 搜狗互联网词库

  2. 搜狗词库,也可直接在搜狗实验室直接下载,统计出的词条数约为15万条高频词,除标出这部分词条的词频信息之外,还标出了常用的词性信息。
  3. 所属分类:深度学习

    • 发布日期:2018-10-16
    • 文件大小:2097152
    • 提供者:baidu_26788951
  1. 搜狗新闻分类语料

  2. 整理自搜狗实验室中的新闻分类。含有金融、体育、军事等11个分类集。
  3. 所属分类:数据库

    • 发布日期:2018-10-30
    • 文件大小:34603008
    • 提供者:makecontral
  1. 大数据综合案例-搜狗搜索日志分析(修复版final).doc

  2. 基于搜狗查询数据500w条使用MapReduce做数据清洗,hive做离线分析的项目,详细文档附数据连接,搜狗实验室的搜索数据下载后缺少了用户ID字段的数据,所以本分析采用的是完整的数据,大家可以放心下载,如果下载数据的百度云链接失效无法下载,大家可以给我留言。
  3. 所属分类:Hive

    • 发布日期:2019-12-20
    • 文件大小:3145728
    • 提供者:yuyuyuxiaolei
  1. 搜狗实验室新闻数据 文本分类

  2. 搜狗实验室新闻数据 文本分类
  3. 所属分类:机器学习

    • 发布日期:2021-03-07
    • 文件大小:745537536
    • 提供者:weixin_50941869
« 12 »