通过分析亚马逊弹性 M apRe duce( EMR)平台构架, 针对信息情报机构内部数据处理的迫切需求, 提出通 过开源技术 Xen和 H adoop平台构建基于云计算的动态可伸缩的海量数据处理平台并给出实施方案、 海量文本数 据处理案例和开源 EMR平台的优势分析。实施方案主要分为三部分: 搭建动态虚拟的云计算环境、 安装制作 H adoop虚拟服务器模板、 配置运行 C l oudera和 C l oudera Desktop。通过开源 EMR架构的应用, 可以有效解决服务 器蔓延问题,
Talend, a successful Open Source Data Integration Solution, accelerates the adoption of new big data technologies and efficiently integrates them into your existing IT infrastructure. It is able to do this because of its intuitive graphical language