您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 新浪微博数据挖掘方案

  2. 随着新浪微博用户群体的增长, 新浪微博的数据获 取是微博研究首先需要解决的问题。该文提出了基于新浪 微博API 与基于页面解析的新浪微博数据获取方案。程序 逻辑控制API 调用方法与频率, 获取JSON 对象并解析实现 高效数据获取。同时将传统的网络爬虫结合网页解析技术 结合API 同时使用, 解决了因API 接口开放不完善, 且因在 返回结果数量上限与调用频率方面的限制, 导致不能有效实 现新浪微博数据的全面获取的问题。经过实验测试, 通过2 套方案的结合可以实现新浪微博数据高效全面的获取。
  3. 所属分类:其它

    • 发布日期:2012-05-07
    • 文件大小:868352
    • 提供者:petterla999
  1. 新浪微博数据挖掘方案

  2. 摘 要: 随着新浪微博用户群体的增长, 新浪微博的数据获 取是微博研究首先需要解决的问题。该文提出了基于新浪 微博API 与基于页面解析的新浪微博数据获取方案。程序 逻辑控制API 调用方法与频率, 获取JSON 对象并解析实现 高效数据获取。同时将传统的网络爬虫结合网页解析技术 结合API 同时使用, 解决了因API 接口开放不完善, 且因在 返回结果数量上限与调用频率方面的限制, 导致不能有效实 现新浪微博数据的全面获取的问题。经过实验测试, 通过2 套方案的结合可以实现新浪微博数据高效全
  3. 所属分类:其它

    • 发布日期:2012-08-28
    • 文件大小:868352
    • 提供者:willproud
  1. 新浪微博数据挖掘方案

  2. 随着新浪微博用户群体的增长, 新浪微博的数据获取是微博研究首先需要解决的问题。该文提出了基于新浪微博API 与基于页面解析的新浪微博数据获取方案
  3. 所属分类:其它

    • 发布日期:2012-12-13
    • 文件大小:869376
    • 提供者:bulafusiji
  1. 新浪微博数据挖掘方案

  2. 一篇文献,该文提出了基于新浪微博API 与基于页面解析的新浪微博数据获取方案。
  3. 所属分类:Java

    • 发布日期:2012-12-24
    • 文件大小:868352
    • 提供者:jerrylee_
  1. 新浪微博数据挖掘方案

  2. 新浪微博数据挖掘方案 随着新浪微博用户群体的增长, 新浪微博的数据获 取是微博研究首先需要解决的问题。该文提出了基于新浪 微博API 与基于页面解析的新浪微博数据获取方案。程序 逻辑控制API 调用方法与频率,
  3. 所属分类:Java

    • 发布日期:2013-03-21
    • 文件大小:868352
    • 提供者:superstarao
  1. 新浪微博数据挖掘方案

  2. 摘 要: 随着新浪微博用户群体的增长, 新浪微博的数据获 取是微博研究首先需要解决的问题。该文提出了基于新浪 微博API 与基于页面解析的新浪微博数据获取方案。程序 逻辑控制API 调用方法与频率, 获取JSON对象并解析实现 高效数据获取。同时将传统的网络爬虫结合网页解析技术 结合API 同时使用,解决了因API 接口开放不完善, 且因在 返回结果数量上限与调用频率方面的限制,导致不能有效实 现新浪微博数据的全面获取的问题。经过实验测试, 通过2 套方案的结合可以实现新浪微博数据高效全面的获
  3. 所属分类:其它

    • 发布日期:2013-08-08
    • 文件大小:868352
    • 提供者:madman188
  1. 基于Hadoop的微博信息挖掘.pdf

  2. 对于hadoop和数据挖掘的结合应该有比较好的启发
  3. 所属分类:Java

    • 发布日期:2014-04-17
    • 文件大小:1048576
    • 提供者:like_4722
  1. 实战大数据01

  2. 本书对目前大数据及其相关技术的发展进行总结,既不缺乏理论深度又具有实用价值。全书共12章,内容包括大数据的概念、特点、发展历史,数据获取与存储,数据抽取和清洗,数据集成,数据的查询、分析与建模,异构数据采集,文档的存储与检索,异种数据的统一访问与转换,基于微博的股票市场预测系统实例,海量视频检索系统实例,HDFS云文件系统实例等。本书适合大数据技术初学者、大数据从业人员和研究人员,也可以作为高校相关专业的教学参考书。
  3. 所属分类:其它

    • 发布日期:2015-02-14
    • 文件大小:68157440
    • 提供者:sdlysqc
  1. 实战大数据02

  2. 本书对目前大数据及其相关技术的发展进行总结,既不缺乏理论深度又具有实用价值。全书共12章,内容包括大数据的概念、特点、发展历史,数据获取与存储,数据抽取和清洗,数据集成,数据的查询、分析与建模,异构数据采集,文档的存储与检索,异种数据的统一访问与转换,基于微博的股票市场预测系统实例,海量视频检索系统实例,HDFS云文件系统实例等。本书适合大数据技术初学者、大数据从业人员和研究人员,也可以作为高校相关专业的教学参考书。
  3. 所属分类:其它

    • 发布日期:2015-02-14
    • 文件大小:68157440
    • 提供者:sdlysqc
  1. 实战大数据03

  2. 本书对目前大数据及其相关技术的发展进行总结,既不缺乏理论深度又具有实用价值。全书共12章,内容包括大数据的概念、特点、发展历史,数据获取与存储,数据抽取和清洗,数据集成,数据的查询、分析与建模,异构数据采集,文档的存储与检索,异种数据的统一访问与转换,基于微博的股票市场预测系统实例,海量视频检索系统实例,HDFS云文件系统实例等。本书适合大数据技术初学者、大数据从业人员和研究人员,也可以作为高校相关专业的教学参考书。
  3. 所属分类:其它

    • 发布日期:2015-02-14
    • 文件大小:47185920
    • 提供者:sdlysqc
  1. 新浪微博数据挖掘方案

  2. : 随着新浪微博用户群体的增长, 新浪微博的数据获 取是微博研究首先需要解决的问题。该文提出了基于新浪 微博 API 与基于页面解析的新浪微博数据获取方案。程序 逻辑控制 API 调用方法与频率, 获取 JSON 对象并解析实现 高效数据获取。同时将传统的网络爬虫结合网页解析技术 结合 API 同时使用, 解决了因 API 接口开放不完善, 且因在 返回结果数量上限与调用频率方面的限制, 导致不能有效实 现新浪微博数据的全面获取的问题。经过实验测试, 通过 2 套方案的结合可以实现新浪微博数据
  3. 所属分类:其它

    • 发布日期:2015-10-23
    • 文件大小:868352
    • 提供者:jetmah2015
  1. 基于微博数据挖掘的突发事件舆情演化分析--以艾尔玛飓风为例

  2. 基于微博数据挖掘的突发事件舆情演化分析--以艾尔玛飓风为例,魏洁,张凌,[目的/意义] 探索突发事件中不同情感微博对信息传播量的影响,进而发现舆情传播的特点和规律,为舆情分析与决策提供依据。[方法/�
  3. 所属分类:其它

    • 发布日期:2020-03-09
    • 文件大小:1048576
    • 提供者:weixin_38751014
  1. 基于内容分析的微博转发行为研究.pdf

  2. 摘 要:【目的/意义】微博转发行为反映了微博用户对所感兴趣微博的一种行为表现,对微博转发行为的研究有助 于微博的深度挖掘工作。【方法/过程】本文从内容分析的角度,对微博转发行为进行了预测。量化分析了微博内容 中一组低水平特征和高水平特征,采用逻辑回归模型对微博转发概率进行预测,并在微博数据集中进行了训练和 验证。【结果/结论】基于模型中的参数学习,证实这些内容特征对于微博转发有着密切的联系,据此进一步推断微 博用户主要的兴趣点。 关键字:微博;转发;内容分析;情感理论研究 情报科学 第36卷第4
  3. 所属分类:其它

    • 发布日期:2019-09-07
    • 文件大小:1048576
    • 提供者:maomao1688
  1. 一种面向大规模微博数据的话题挖掘方法.pdf

  2. 随着微博的日趋流行,新浪微博已成为公众获取和传播信息的重要平台之一,针对微博数据的话题挖掘也 成为当前的研究热点。提出一个面向大规模微博数据的话题挖掘方法。首先对大规模微博数据进行分析,基于 Bloom Filter算法对数据进行去重处理,针对微博的特有结构,对文本进行预处理,提出改进的LDA主题模型So- cial Network LDA(SNLDA),采用吉布斯采样法进行模型推导,挖掘出微博话题。实验结果表明,方法能有效地从 大规模微博数据中挖掘出话题信息。
  3. 所属分类:算法与数据结构

    • 发布日期:2020-06-09
    • 文件大小:576512
    • 提供者:sinat_34886114
  1. 基于微博的数据挖掘与社交舆情分析.zip

  2. 基于微博的数据挖掘与社交舆情分析 This project consists of four parts: 1. Crawl weibo data, contain comment、userinfo etc... 2. Process the captured data to the format we want 3. Analyze the data in order to get social sentiment information 4. Show the final result on
  3. 所属分类:Python

    • 发布日期:2020-07-23
    • 文件大小:1048576
    • 提供者:q6115759
  1. 面向微博用户的标签自动生成技术研究.caj

  2. 近年来,微博服务作为新型的互联网应用,受到了越来越多用户的关注。 在自然语言处理、信息检索和社会计算等相关领域,针对微博的研究工作也在 逐渐开展和积累中。微博用户标签,作为描述用户兴趣爱好、职业领域特征等 的载体,在用户组织和搜索,挖掘用户兴趣、实现微博上的个性化等方面有着 重要的作用。 本文着眼于基于微博内容的用户标签自动生成,借助对内容的分析,生成 能够体现用户兴趣的标签。 本文通过新浪微博 API 随机获取了百万级规模的标签相关数据,用于分 析用户标签在统计、语义等方面的特征。同时,我
  3. 所属分类:机器学习

    • 发布日期:2020-09-08
    • 文件大小:3145728
    • 提供者:fengliren
  1. 新浪微博网信息传播分析与预测

  2. 文中以新浪微博为研究对象,以分析新浪微博的信息转发与传播特征为研究目的,并对传播行为进行预测.在获取大量新浪微博在线数据的基础上,对各种可能影响用户转发行为的因素进行统计、分析,挖掘各种影响因素特征并进行建模.提出基于用户属性、社交关系和微博内容三类综合特征,使用机器学习的分类方法,对给定微博的用户转发行为进行预测.基于微博网关注关系拓扑,利用概率级联模型对给定微博的转发路径进行预测,为预测微博的影响范围提供依据.文中通过实验分析了新浪微博符合复杂网络特征、社交类特征对转发行为有重要影响,并验证
  3. 所属分类:其它

    • 发布日期:2021-03-24
    • 文件大小:1048576
    • 提供者:weixin_38674675
  1. 基于特征分析的微博炒作账号识别方法

  2. 常规的微博炒作账户异军实施,采用违规法规实施网络公关活动严重干扰乱了正常的互联秩序。传统的炒作账户识别方法主要依靠人工分析,效率低下且不适合对海量账户进行识别。针以上问题提出了一种基于基本特征的炒作分析,效率低下且不适合对海量账户进行识别。针以上问题提出了一种基于特征的炒作分析,效率低下且不适合对海量账户进行识别。种基于特征的炒作帐户识别方法,从多个角度对炒作的特征进行分析,建立起炒作账户特征集,并利用数据挖掘中的多种分类算法对炒作账户特征集,并利用数据挖掘实验表明,本文提出的炒作账户识别方法能
  3. 所属分类:其它

    • 发布日期:2021-03-09
    • 文件大小:632832
    • 提供者:weixin_38712874
  1. 概率主题模型在微博主题挖掘中的应用研究

  2. 本身,微博能够着重于自身的特点发展成为社会公共*的重要平台,对国家安全和社会发展产生了深远的影响,从而对微博文本主题提取重叠格外重要。结果,文本主题挖掘的主流技术是主题概率模型。变量,首先对主题概率模型中LDA模型进行了详细的地介绍;其次分析了微博的数据特征,从三个方面:存在噪音,微博文本短小以及微博的时序性概述了主题概率模型在微博主题挖掘方面的研究;近一步,又概述了利用主题模型发现基于主题的社团关系的研究;最后总结了未来主题模型在挖掘微博主题方面存在的挑战。
  3. 所属分类:其它

    • 发布日期:2021-03-09
    • 文件大小:711680
    • 提供者:weixin_38606169
  1. 基于微博APl的分布式抓取技术

  2. 随着微博用户的迅猛增长,越来越多的人希望从用户的行为和微博内容中挖掘有趣的模式。针对如何对微博数据进行有效合理的采集,提出了基于微博API的分布式抓取技术,通过模拟微博登录自动授权,合理控制API的调用频次,结合任务分配控制器高效地获取微博数据。该分布式抓取技术还结合时间触发和内存数据库技术实现重复控制,避免了数据的重复爬取和重复存储,提高了系统的性能。本分布式抓取技术具有可扩展性高、任务分配明确、效率高、多种爬取策略适应不同的爬取需求等特点。新浪微博数据爬取实例验证了该技术的可行性。
  3. 所属分类:其它

    • 发布日期:2021-01-19
    • 文件大小:1048576
    • 提供者:weixin_38567956
« 12 3 »