您好,欢迎光临本网站![请登录][注册会员]  
文件名称: 标准送审稿2019DevOps研发运营(3).pdf
  所属分类: 互联网
  开发工具:
  文件大小: 1mb
  下载次数: 0
  上传时间: 2019-07-05
  提 供 者: zl3***
 详细说明:标准送审稿2019DevOps研发运营(3).pdfYDT1756T2018 7.11配置对象 ..11 7.12配置数据 11 8容量和成本管理 81容量管理…… 12 81.1基础设施容量 12 812业务容量 12 8,2成本管理… 13 821成本合理性 822预算与核算 13 9高可用管理 4 91应用高可用管理, 14 911弹性能力 14 912柔性能力 15 913运行与维护管理 .15 92数据高可用管理…. 16 921数据库高可用 16 922缓存高可用 17 10业务连续性管理 :.: ……,……………17 10.1风险管理 18 1011RTO和RPO衡量 18 10.12业务影响分析 18 1013风险分析 18 10.2危机管理 19 1021灾备管理 19 1022组织机制 19 103应急管玛 1031应急预案 1032应急演练 20 1033组织机制.… ::::::...:.::: 20 11用户体验管理∴ 11业务认知管理 21 11.1业务学习与考核 112体验管理………………………………………………22 1121体验数据管理 着重 22 11.22体验优化管理 ..22 YD/T17562018 前 硏发运营一体化是指在IT软件及相关服务的硏发及交付过程中,将应用的需求、开发、测试、部 署和运营统一起来,基于整个组织的协作和应用架构的优化,实现敏捷开发、持续交付和应用运营的 无缝集成。帮助个业提升T效能,在保讦稳定的同时,快速交付高质量的软件及服务,灵活应对快速 变化的业务需求和市场环境。 本标准是“研发运营一体化( DevOps)能力成熟度模型”系列标准的第韶分;技运带,该系列 标准的结构和名称如下 第1部分:总体架构 第2部分:敏捷开发管理 第3部分:持续交付 第4部分:技术运营 第5部分:应用设计 第6部分:安全及风险管理 第7部分:评估方法 第8部分:系统和工具技术要求 本标准/本部分按照GB/T1.1-2009给出的规则起草 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。 本标准/本部分由中国通信标准化协会提出并归口。 本标准/本部分起草单位:中国信息通信研究院、深圳市腾讯计算机系统有限公司、北京京东世纪 贸易有限公司、北京华佑科技有限公司、平安科技(深圳)有限公司、中国太平洋保险集团、中国电 信集团公司、中信银行股份有限公司信用卡中心、中兴通讯投份有限公司、中国银行股份有限公司、 中国银联股份有限公司、广州虎牙信息科技有限公司、中国移动苏州研发中心广州技术支持中心、携 程国际有限公司。 本标准/本部分主要起草人:梁定安、徐奇琛、王超、栗蔚、刘梄铜、萧囗国、牛晓玲、党受辉、 杨军、车盺、杨文兵朱平、范品晶、吴树生、陈亚殊、胡罡、杜颖君、陈靖翔、张珣、曾庆辉、闫 林、吴新颖、刘扬清、冮明、毛茂德、燕杰、雍浩淼、潘晓明。 YDT1756T2018 研发运营一体化(Dev0ps)能力成熟度模型 第4部分:技术运营 1范围 本标准规定了硏发运营一体化(υevOs)能力成熟度模型下技术运营管理的能力成熟度要求和评 价方法。 本标准适用于具备I软件研发交付运营能力的组织实施IT软件开发和服务过稈的能力进行评价和 指导;可供其他相关行业或组织进行参考;也可作为第三方权威评估机构衡量欤件开发交付成熟的标 准依据。 2规范性引用文件 下列文件对丁木文件的应用是必不可少的。凡是注目期的引用文件,仅所注日期的版木适用丁木 文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。 ]GB/T324002015信息技术云计算概览与词江 2]GB/T32399-2016信息技术云计算参考架构 3]YD/2441-2013互联网数据中心技术及分级分类标准 「4GBT3136-2016信息技术服务数据中心服务能力成熟度模型 3术语和定义及缩略语 3.1术语和定义 下列术语和定义适用于本标准。 3.1.1配置项 configuration item 即纳入配置管理范畴的工作成果,是保存系统和项目的相关配置 3.1.2制品 artifact 即构建过程的输出物,包括软件包,测试报告,应用配置文件等。 3.1.3代码复杂度 code comp 主要度量指标为圈复杂度,即代码中线性独立路径的数量 3.1.4部署流水线 dep l oyment pipe line YD/T17562018 是对软件从设计、开发、构建和测试等过程的建模,在持续集成和发布管理工具上,体现为攴持 査看并控制流程,包括每次变史从提交到版本库控制开始,通过各类测试和部署,冉都发布给用户的 过程。 3.1.5研发运营一体化 DevOps DevOps是 Development和 Operations的组合词,它是一组过程、方法与系统的统称,用J促进开发 (应用稈序/软件工稈)、技术运营和质量保障(αA)部门之间的沟通、协作与整合。它的出现是由于 软件行业认识到为了按时交付软件产品和服务,开发和运营上作必须紧密合作。 3.2缩略语 下列缩略语适用于本文件 Artificial Intelligence 人工智能 AAas Application Platform as a Service 应用部署和运行台 Application Performance Management 应用性能管理 AP⊥ Application Programming Interface 应用程序编程接「 BA Business analysist 平务分析师 BIA Business Impact analysis 业务影响分析 CI Continuous Integration 持续集成 Continuous delivery 持续交付 Content delivery network 内容分发树络 ETL Extract trans form Load 数据仓库技术 Enterprise service Bus 企业服务总线 NPM Network Performance moni toring 网终性能监控 Infrastructure as a service 基础设施即服务 IDC Internet Data Center 互联网数据中心 IPD Integrated Product Development 集成产品开发 QA Quality assurance 质量保证 SNMP Simple network Management Protocol 简单网络管理协议 oftware Development kit 软件开发工只包 TPS < Transactions per second 事务数/秒 IAas tegration platform as a service 集成平台 MTTR Mean time to recovery 平均修复时间 Key Performance Indicator 关键绩效指标 RPO Recovery point objective 恢复点日标 RTO Recovery Time Objective 恢复时间目标 User interface 用户界面 UE User Experience 用户体验 UED ser experience 用户体验设计 SMART Specific Measurable attainable re levant time具体的、可度量度、可实现的、 相关性和时效性原则 2PC Two-phasc Commit 二阶段提交, YDT1756T2018 4技术运营管理过程概述 技术运营管理过程是技术运营能力建设的一个过程,包括监控管理、事件与变更管理、配置管理、 容量与成木管理、高可用管理、业务连续性管理、用户体验管理等,它以业务为中心,交付稳定、安 全、高效的技术运营服务,构建业界领先的技术运营能力,支撑企业的持续发展和战略成功。技术运 营不仅关注“稳定”、“安全”、“可靠”,更要关注“体验”、“效率”、“效益”,具体过程如 表1所示。 表↑技术运营管理过程 监控管理事件与变配置管理容量与成高可用管业务连续用户体验 更管理 本管理 理 性管理 管理 监控采集事件管理运营配置容量管理应用高可风险管迎业务认知 管理 用管理 管理 数据管理变吏管理 成木管理 数据高可危机管理体验管理 用管理 数据应用 应急管理 5监控管理 监控管理是对研发运营过程中的对象进行状态数据采集数据处理分析和存储、异常识别和通知 及对象状态可视化呈现的过程,其成熟度决定了技术运营工作的立体性、及时性和有效性。 监控管理从数据流的维度展开分析,包括3个部分:监控采集、数据管理和数据应用。 5.1监控釆集 监控采集是指通过主动采集或被动收集方式获取监控数据,并保证采集数据的质量、采集过程的 可靠性和安全性。监控采集的能力指标包括采集服务和数据传输,如表2所示。 5.1.1采集服务 采集服务是指将数据采集能力服务化,从采集的手段、支持的协议、兼容性、颗粒度、采集端的 基础逻辑和扩展逻辑等角度对采集能力进行量化评估。 5.1.2数据传输 采集能力的数据传输能力原子化,从传输数据质量保障、传输的可用性、传输过程中支持的功能 特性的纬度来评估其能力成熟度。 注1:高可用:指一个系统经过专门的设计,从而减少停工时间,保持其服务的高度可用性:高可靠指数据传输 过程中的致性和准确性 表2监控采集 级别 采集服务 数据传输 具备操作系统级监控指标的采集能力,如CPU、内 存等。 通过标准协议传输数据。 YD/T17562018 同上,且需达到以下要求: 1)具备系统日志、应用日志、接口日志等至少3 种数据类型的采集能力,相关采集方式如嵌同上,且需达到以下要求 入SDK、API、私有协议等。 1)可传输不同数据格式,如int、char 2)量化管理采集服务,如能反映企业应用的覆 binary等格式。 2)支持单份数据多份订阅及分发传输。 3)数据采集上报到多个服务端,支持可扩展, 高可用的采集架杓。 同上,且需达到以下要求 1)统一的数据采集及跨平台兼容。 2)支持提供开放式、自定义的数据内容采集上同上,且需达到以下要求: 报方案。 1)高可靠数据传输通道和高可用容灾方案 3)集中式的采集配置,包括但不限于采集内 支持多和传输方案,如同时具各pu11l、 容、开关等。 push数据的能力 4)采集管控、发送延退、数据校验、统计等管|2)数据采集架构具备平行扩展、数据汇聚和 理能力,可通过插件化扩展采集逻缉 高效传输等能力。 5)支持自定义监控内容,具备对采集服务的管 理方法,如:采集限制、采集限频等方法, 同上,且需达到以下要求 同上赳需达到以下要求: 1)采集频率可自定义配置调节 1)数据传输质量保障,如支持数据分片、压 2)部分数据采集通过智能化技术动态调整,如 缩、断点续传等传输特性 减少采集内容、降低频率等。 2)保障数据传输安全性,如数据加密、解密 炇校验等。 同上,且需达到以下要求 1)具备动态调整采集规则,支持与拉术运营活 动联动,如压力测试活动时,将采集频率动 态调整为秒级。 2)可配置关联运维事件,实现同一运维对象的 不同采集内容变化 5.2数据管理 数据管理是指对数据进行过滤、转换、提取、聚合和存储等操作,是数据监控的核心能力。按数 据管理过程的三个坏带,来量化具体的能力模型,包括数据接收、数据处理和数据存储,如表3所示 注2:本章介绍的数据多指运维数据(非敏感务数据),由多个纬度组织而成,可看作大数据处理平台的能力 521>数据接收 作汋数据处理服务端的数据接收服务,承接数据釆集服务传输米的数据,需要拥有良好的吞吐性 能和可扩展的架构,并且具备区分数据类型和相应处理的功能逻辑 5.2.2数据处理 数据处理指大数据处理的逻辑,支持逻辑运算、统计方法、机器学习等计算能力,可结合技术运 营的场景,灵活实堄数据的扩展与关联分析。同时,需考量数据处理的规模、性能及架构的能力。 5.2.3数据存储 YDT1756T2018 数据存储指针对监控数据的存储场景,对存储的方案、架构、存储成本、数据髙可用等纬度综合 评估 表3数据管理 级别 数据接收 数据处理 数据存储 1 具备对原始数据源预处理的 可正常接收数据,具备一定的统能力 计和反向查询能力。 2、具备对异常数据识别与校对具备基本的数据存储能力 的能力。 同上,且需达到如下要求: 同上,且需达到如下要求 同上,且需达到如下要求: 1)具备对基础数据的筛选能1)具备常用逻辑还算的能力,1)提供统一的数提存储 力,如支持数据转发、丢 如自定义数据四则运算,统|2)备可扩展的架构支持根 弃、复制等。 计(分类、聚类)等。 据数据类型、容量等扩展方 2)可对原始数据进行规则化处2)可对外提供数据接口服务。 理,如数据清洗、数据校对|3)具备可扩展的ETL,实现如3)具备数据一致性、完整性和 数据清洗、转换、导入和加 可用性等管理特性。 3)数据接收架构具备可扩展 载等操作 ④可存储多种数据类型,如文 4)具备对异构数据源的处理及 本、数值型和位图等 4)可对异构数据源集屮接收 关联分析的能力 5)具备对时序数据的存储能 力 同上,且需达到如下要求: 1)具备可扩展的架构能力。 2)具备实时计算与离线统计的同上,同时需达到如下要求: 同上,且需达到如下要求 能刀,实时计算数据处理延1)提供高频查询的吞吐能力, 1)对外提供统一的数据上报服 时小于1分钟。 如通过SSD或缓存技术实现 务,支持多协议多格式的数3)具备处理结构化与半结构化 高并发查询。 据源,如文本、字符串和打 数据的能力,如时序数据处2)按数据使用场景的冷热数据 密协议等。 理、自定义日志字段解析 分离。 2)具备数据校验的能力,如空 3)具备结构化与半结构化数据 值检测、乱码校验和属性恔卡4)具备数据校正、数据持久 的存储与快速检索能力。 验等。 化、保证数据完整性的能|4)具备时序数据的统计能力。 3)具备过载保护的能力。 5)数据安全管理,如数据容 5)具备数据处理过程的监控和 灾,各份、仓库容量等 告警能力,如作业异常、数 据比对异常等。 同上,且需达到如下要求 1)具备可配置、可视化和可编 同,且需达到如下要求 排作业的能力 1)全网数据秒级上报。 2)具备数据处理逻辑插件化疒/同上,月需达到如下要求 展的能力。 1)提供成本合理的原始数据存 2)可根据数据上报量,动态管 理数据接收容量与此忙|3)掘供灵活的数据建模能力 储方案。 能 可关联不同数据源,按业多/2)可根据业务场景动态设置存 场景组织多源数据 储周期 4)提供接入机器学习框架的平 台能力。 YDT1756T2018 5 同上,且需达到如下要求: 同上,且需达到如下要求 1)支撑百万次s请求量的数)具各智能化数据处理能力 如智能数据分析、事件预测 上,且需达到如下要求 据接收与筛选; 存储模型具备使用AI技术所需的 2)具备海量数据(如PB级) 的存储能力。 )数据处理能力达到每分/数据集规模 PB级。 5.3数据应用 数据应用是根据对监控薮据的加工、分析,达到异常识别、告警分级、数据可视化展示等应用 按照应用场景分为告警与管控、数据服务和可视化管理,如表4所小。 5.3.1告警与管控 告警与管控指监控对异常识别的能力,包括对异常判断逻辑、管控能力与业务场景的关联等 5.3.2数据服务 数据服务指需具备可丌放的数据服务能力,为其他系统整合与关联技术运营的数据提供支持。 5.3.3可视化管理 可视化是监控数据指导技术运营工作开展的重要能力之包括了对展现灵活性、可定制性、 智能化和运维场景结合度的评估 表4_数据应用 级别 告警与管控 数据服务 可视化管理 1)具备按照阈值规则实塊异 常告警的能力。 2)具备多通道发送告警信息据供基础的数据存储肢务。 具备在线数据图表展示的能力 的能力。 同上,且需达到如下要求 1)具备告警分级及简单收敛同上,且需达到如下要求: 方案 1)提供面向应用场景的数据服 2)/支持告警的统计分析,如 务化能力 告警触达、告警准确率2)具备常规数据处理的能力,同上,且需达到如下要求 包括但不限于最大值、平均1)具备自定义图表的能力。 具备告警明细的记录存储值等。 2)提供指标强化展示的特性 和告警统计数据导出的能|3)具备按条件导出数据接口的 如业务监控指标的重点展 力。 能力 4)针对标准告警信息,关联|4)具备数捱迁移的能力,如复|3)支持场景化的在线数据查 提供标准运维操作的提示制、同步或传输数据到其他 询 性建议。 存储介质。 5)自动告警升级,能够将告5)提供自定义数据查询接口, 警通知、升级与组织架构和数据内容的功能。 关联 同上,且需达到如下要求 同上,且需达到如下要求: 同上,且需达到如下要求 1)标准化的告警关联自动化1)具备大规模数据计算的能|1)具备基于业务拓扑架构或调 工具,实现常见技术运营 力 用关系的可视化能力,并能 场景下的故璋自愈。 2)提供在线自定义数据统计分 标示出监控异常点。
(系统自动生成,下载前可以参看下载内容)

下载文件列表

相关说明

  • 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
  • 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度
  • 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
  • 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
  • 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
  • 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.
 输入关键字,在本站1000多万海量源码库中尽情搜索: