您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 微博内容抓取工具

  2. ROST 新浪定时监控工具,基于新浪微博Oauth模式认证下调用新浪微博api抓取新浪微博数据,支持实时(最少5秒钟抓取更新一次)抓取数据。数据包括微博作者、作者VIP判断、微博内容、发布时间、抓发评论数、如果是转发的微博还包括转发者及转发者说的话的详细信息 -- 转自武大沈阳博客
  3. 所属分类:网络监控

    • 发布日期:2011-12-02
    • 文件大小:24576
    • 提供者:lgxw1027
  1. 新浪微博android

  2. 本资源详细记载了新浪微博的客户端登陆显示微博信息,并实时刷新数据。
  3. 所属分类:3G/移动开发

    • 发布日期:2013-03-17
    • 文件大小:2097152
    • 提供者:mufaith
  1. 新浪微博2013年4月14日至4月16日实时数据集(剔除了小号和微博内容噪音)

  2. 新浪微博2013年4月14日12:00至4月16:日12:00的实时数据。已经剔除了小号并且对微博内容进行了一定的过滤。数据集可以用来进行数据挖掘的实验等。数据可以直接导入mysql数据库使用
  3. 所属分类:MySQL

    • 发布日期:2013-11-06
    • 文件大小:16777216
    • 提供者:u012721450
  1. 基于Python的新浪微博数据爬虫_周中华.pdf

  2. 为了快速地获取到海量微博中的数据,根据微博网页的特点,提出了一种基于Python爬虫程序设计方法.通过模拟登录新浪微博,实时抓取微博中指定用户的微博正文等内容;该工具利用关键词匹配技术,匹配符合规定条件的微博,并抓取相关内容;最后使用该工具对部分微博数据作了一个关于雾霾问题的分析.实验结果表明:本程序具有针对性强、数据采集速度快、易嵌入开发、简单等优点,为不善于编程的研究者提供了快速获取微博的方法,有利于对微博的后续数据挖掘研究.
  3. 所属分类:搜索引擎

    • 发布日期:2018-08-07
    • 文件大小:219136
    • 提供者:weixin_42906583
  1. 大数据生态体系课程大纲.pdf

  2. CSDN 学院大数据生态体系课程大纲。 实战项目: 电商企业大数据分析平台架构与设计 电商大数据分析平台 微博社交数据分析平台 电商数据运营分析平台 企业实时运营指挥室大数据分析平台 金融企业用户交易行为分析大数据平台 企业运营数据实时指挥室 欧洲运营商O 域用户
  3. 所属分类:Hadoop

    • 发布日期:2018-06-30
    • 文件大小:569344
    • 提供者:hvang1988
  1. 网跃新浪微博内容采集直发工具 v2.1.zip

  2. 网跃新浪微博内容采集直发工具是一款用于微博内容采集与批量发布的辅助工具,功能多样。 网跃新浪微博内容采集直发工具软件用途 1).微博内容采集(包括文本、图片、头像、微博数、关注数、粉丝数、是否加V、作者、博主昵称、博主头像、UID等) 2).微博内容全自动批量发布,可以指定多个帐号、指定多条内容 全自动批量群发原创微博,此软件也可以用于微博小号维护,全自动更新微博内容,减轻微博维护的工作量 3).采集微博昵称、UID(可以通过关键字搜索、提取某人粉丝的昵称UID、提取某个人关注的昵称UI
  3. 所属分类:其它

    • 发布日期:2019-07-15
    • 文件大小:4194304
    • 提供者:weixin_39840914
  1. 微博评论语料,4435960条数据

  2. 微博回复语料数据。微博是指一种基于用户关系信息分享、传播以及获取的通过关注机制分享简短实时信息的广播式的社交媒体、网络平台,允许用户通过Web、Wap、Mail、App、IM、SMS以及用户可以通过PC、手机等多种移动终端接入,以文字、图片、视频等多媒体形式,实现信息的即时分享、传播互动。
  3. 所属分类:数据库

    • 发布日期:2020-09-28
    • 文件大小:243269632
    • 提供者:happy3532
  1. Android 微博实时热点获取(GET)网络请求

  2. Android 微博实时热点获取(GET)网络请求,该项目采用了两种来获取数据,第一种:每60秒自动刷新获取数据;第二种:下拉刷新获取数据
  3. 所属分类:Android

    • 发布日期:2020-10-03
    • 文件大小:13631488
    • 提供者:Scxioi0
  1. 基于PHP爬虫的微博热搜实时监控平台

  2. 基于PHP爬虫的微博热搜实时监控平台背景一、整体思路二、数据爬取1.获取HTML2.提取数据3.返回数据三、数据可视化1.画柱状图2.ajax请求数据四、效果展示写在最后 背景 在学习、“脱发”之余,便是去微博看看有没有发生什么有趣的事情,或是了解一下正在发生着哪些“大事”,亦或是某些让我久久不能平复的事… Whatever~ 因为重点并不是这个 重点是,当我去搜微博热搜的时候,是这样的: 界面需要一直手动刷新,而且我简单搜了一下,似乎是没有相关的实时统计图的,于是我尝试着自己写一个。 (p
  3. 所属分类:其它

    • 发布日期:2021-01-08
    • 文件大小:406528
    • 提供者:weixin_38660579
  1. 基于PHP爬虫的微博热搜实时监控平台

  2. 基于PHP爬虫的微博热搜实时监控平台背景一、整体思路二、数据爬取1.获取HTML2.提取数据3.返回数据三、数据可视化1.画柱状图2.ajax请求数据四、效果展示写在最后 背景 在学习、“脱发”之余,便是去微博看看有没有发生什么有趣的事情,或是了解一下正在发生着哪些“大事”,亦或是某些让我久久不能平复的事… Whatever~ 因为重点并不是这个 重点是,当我去搜微博热搜的时候,是这样的: 界面需要一直手动刷新,而且我简单搜了一下,似乎是没有相关的实时统计图的,于是我尝试着自己写一个。 (p
  3. 所属分类:其它

    • 发布日期:2021-01-08
    • 文件大小:406528
    • 提供者:weixin_38657139
  1. 微博的特定主题转发计数排名

  2. 在本文中,我们研究了微博中特定主题的转发数排名问题。 两个挑战使这项任务变得微不足道。 首先,传统方法无法获得推文的有效功能,因为在特定主题的设置中,推文通常具有太多的共享内容,无法区分它们。 我们提出一种LSTM嵌入的自动编码器来生成推特功能,并具有以下认识:推特文本的任何不同前缀都是可能的独特功能。 其次,在主题特定的环境中充分了解主题的意义至关重要,但是微博提供的有关主题的信息很少。 我们利用头条的实时新闻信息来丰富主题的含义,因为超过85%的主题是头条新闻。 我们基于消融方法评估提出的组
  3. 所属分类:其它

    • 发布日期:2021-03-08
    • 文件大小:931840
    • 提供者:weixin_38556416
  1. 微博中与实时多媒体品牌相关的数据识别

  2. 微博中与实时多媒体品牌相关的数据识别
  3. 所属分类:其它

    • 发布日期:2021-03-06
    • 文件大小:1030144
    • 提供者:weixin_38701952
  1. 微博CacheService架构浅析

  2. 微博作为国内最大的社交媒体网站之一,每天承载着亿万用户的服务请求,这些请求的背后,需要消耗着巨大的计算、内存、网络、I/O等资源。而且因为微博的产品特性,节假日、热门事件等可能带来突发数倍甚至十几倍的访问峰值,这些都对于支撑微博的底层基础架构提出了比较严苛的要求,需要满足:1.每秒数十万的用户请求2.数据更新的实时性3.服务请求的低响应时间4.99.99%以上的服务可用性为了满足业务的发展需要,微博平台开发了一套高性能高可用的CacheService架构用于支撑现有线上的业务系统的运转。但“冰动
  3. 所属分类:其它

    • 发布日期:2021-02-26
    • 文件大小:164864
    • 提供者:weixin_38632146
  1. 基于风暴的实时微博突发事件检测系统

  2. 微博客正成为突发新闻事件的重要信息来源。 由于微博客是具有复杂关系的实时无限制流,因此传统的突发事件检测技术无法很好地发挥作用。 本文介绍了RBEDS,它是遵循Storm分布式流处理框架的实时突发事件检测系统。 分别执行K-Means聚类方法和突发特征检测方法以识别候选突发事件。 它们的输出被合并以生成最终事件检测结果。 这样的操作被实现为风暴拓扑。 在大型新浪微博数据集上对提出的系统进行了评估。 所获得的系统性能表明,RBEDS系统可以以良好的及时性,有效性和可伸缩性检测突发事件。
  3. 所属分类:其它

    • 发布日期:2021-02-26
    • 文件大小:339968
    • 提供者:weixin_38681286
  1. 如何实现秒级百万TPS?微博WAIC实时流计算平台架构演进

  2. 本文来自于51cto,随着新浪微博业务的不断推进,对数据处理的实时性要求越来越高。例如,大家所熟悉的微博热词,需要在很短的时间内完成数据处理以供在线系统使用。本文将按照如下四个阶段分享微博实时流计算平台的搭建历程,以及在创建过程中的一些问题和解决方案:实时流计算平台初建实时流计算平台发展总结DQRA设计模式初入实时流计算首先介绍一下我们实时流计算平台开发历程:2015年,我进入新浪微博。当年,我们利用实时流计算做出了物料池系统。2016年,我们进行了用户实时兴趣反馈系统的开发。2017年,我们接
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:987136
    • 提供者:weixin_38516491
  1. 微博CacheService架构浅析

  2. 微博作为国内最大的社交媒体网站之一,每天承载着亿万用户的服务请求,这些请求的背后,需要消耗着巨大的计算、内存、网络、I/O等资源。而且因为微博的产品特性,节假日、热门事件等可能带来突发数倍甚至十几倍的访问峰值,这些都对于支撑微博的底层基础架构提出了比较严苛的要求,需要满足:1.每秒数十万的用户请求2.数据更新的实时性3.服务请求的低响应时间4.99.99%以上的服务可用性为了满足业务的发展需要,微博平台开发了一套高性能高可用的CacheService架构用于支撑现有线上的业务系统的运转。但“冰动
  3. 所属分类:其它

    • 发布日期:2021-02-21
    • 文件大小:164864
    • 提供者:weixin_38746926
  1. 量化器:Quanta是一个开源社交媒体(Fediverse)平台,用于Wiki,微博客,协作,发布,安全消息传递,文件共享和视频音频共享。 基于浏览器,并用Java和TypeScript编写-源码

  2. 广达网络平台 欢迎来到Fediverse! 加入Fediverse! Quanta是一种新型的分散式和联合社交媒体平台。 通过Wiki,博客,文档协作,对话线程,加密的安全消息传递,视频/音频记录和共享,文件共享,podcatcher等独特而强大的功能连接到Fediverse。 创建层次结构化的内容文本,文档,图像,音频和视频,这些内容始终可编辑,可在Fediverse上共享并保存在IPFS上。 Quanta是一个内容发布/托管平台,其中所有内容都存在于树形数据库中,并且每个用户都拥有该全
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:9437184
    • 提供者:weixin_42131790
  1. 如何实现秒级百万TPS?微博WAIC实时流计算平台架构演进

  2. 本文来自于51cto,随着新浪微博业务的不断推进,对数据处理的实时性要求越来越高。例如,大家所熟悉的微博热词,需要在很短的时间内完成数据处理以供在线系统使用。本文将按照如下四个阶段分享微博实时流计算平台的搭建历程,以及在创建过程中的一些问题和解决方案: 实时流计算平台初建 实时流计算平台发展 总结DQRA设
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:987136
    • 提供者:weixin_38717579
  1. 基于主题模型的微博话题检测算法

  2. 摘 要:微博数据的实时、大规模、短文本以及富含噪声等特征为话题检测带来新的挑战,传统向量空模型(VSM)表示文本无法很好地对其进行建模。基于此,提出一种基于主题模型的微博话题检测算法。首先,对微博数据构建文档词条矩阵和词语夫联矩阵来提取主题词;然后,对主题词进行聚类,得到主题模型;最后,利用文本与主题模型相互匹配实现文本聚类,从而达到话题检测的目的。实验结果表示,该算法能有效地进行话题聚类并检测出话题,在最佳参数组合条件下,其各类别的平均F值达到95%以上。
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:1048576
    • 提供者:weixin_38555304
  1. Python3 制作疫情的实时数据地图(附源码)

  2. 每天在地铁上刷着疫情的数据与新闻,希望能看到更多的好消息。 最近看到大家都在写疫情的实时数据地图,作为测试工程师,当然也不能落下。 下面的程序是通过Python生成实时生成数据分布图,全国和每个省份。 (数据来自微博,更新可能有所延迟。本文主要是技术分享) 全国数据图 湖北省 广东省 在命令行导入这些模块 pip install requests pip install re pip install pyecharts 依次是全球地图、中国省级地图、中国市级地图、中国区县级地图、中国区域地
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:644096
    • 提供者:weixin_38667581
« 12 3 4 5 »