行程码累计查询突破458亿次!中国信通院:系统峰值容量较去年提升10倍以上遇突发情况将保障系统不中断服务

  **平台又崩了……生活中,我们不时就会碰到这类常用APP出现宕机的事件。

  随着各领域数字化转型推进,数字系统应用场景范围逐步扩大,承载业务愈发关键,用户高频访问成为常态,系统复杂度呈指数上升,明显地增加了稳定性方面的风险。

  2021年,谷歌、亚马逊、微软、特斯拉等大规模的公司数据系统均发生过宕机事件,不仅对自身造成巨大损失,也极度影响全世界用户的正常生产和生活。

  4月27日,由中国信息通信研究院和中国通信标准化协会指导,中国通信标准化协会大数据技术标准推进委员会(CCSA TC601)主办的首届“全球数据系统稳定性峰会”以线上线下结合的形式召开。

  《每日经济新闻》记者从峰会上获悉,大会旨在助力我国数字化的经济发展“又快又稳”,推动全球数据系统稳定性迈上新台阶。

  中国信通院云计算与大数据研究所所长何宝宏在峰会上介绍,2021年全球发生多起严重的信息系统宕机事件,其中不乏互联网基础设施、金融核心业务系统等,这些关键系统的宕机事件不仅造成大量经济损失,也影响了社会的平稳运行,同时也给其他系统建设运营者、监督管理的机构敲响警钟,系统的稳定性保障成为当前热点问题。

  事实上,在我国,保障关键系统的平稳运行一直受到格外的重视。记者发现,《关键信息基础设施安全保护条例》自2021年9月1日起正式实施,明确要求关键基础设施的运营者要依照条例和有关法律和法规保障关键信息基础设施的安全稳定运行。

  何宝宏表示,互联网等数字原生企业为提升数字能力、使用户得到满足需求,不断扩大系统规模,引入敏捷开发流程,导致信息系统复杂性直线上升,稳定性风险点增多。

  此外,金融、电信等科技密集型行业系统在线化程度不断的提高,新技术不断引入,信息系统功能范围和复杂度一直在升级。而政务、能源等传统行业也在政策推动下,将服务模式从原来5×8小时的线小时的线上模式,导致系统稳定性压力激增。

  与此同时,当前信息系统稳定性保障领域在技术、管理等方面仍存在不足。比如技术方面,随着新技术新架构应用存在异构软硬件兼容问题,分布式架构普及集群规模扩大导致硬件故障更普遍、通信交互更不稳定。在管理方面,由于系统涉及的部门机构增多,带来大量的沟通成本,导致稳定性保障链路变长,跨团队协作更加困难。

  为助力我国各领域数据系统稳定性提升,中国信通院在2020年启动了稳定性相关工作。以通信大数据行程卡(俗称“行程码”)为例,何宝宏介绍,行程码至今已经运行了近2年,累计查询突破458亿次,近期单日查询量维持在3亿次左右,其使用量随全国疫情变化波动,成为疫情防控重要工具。

  为保障大数据行程卡系统长期稳定平稳运行,相关团队实施了很多保障稳定性的措施。

  具体而言,首先,通过优化技术架构,对不同访问渠道的服务资源进行隔离,将三大运营商的服务通道解耦,实现各渠道及各运营商之间服务互不影响。

  其次,对服务器负载均衡、带宽、数据资源等进行多次扩容,以满足一直增长的网络请求,目前系统峰值容量较去年已经提升10倍以上,并通过周期性压测随时确认系统的容量情况。

  第三,行程码建立的备份容灾系统开展了多次应急演练,可以每时每刻进行主备切换。团队开发了全链路监控系统,能够监控各环节流量变化。为应对流量高峰,团队建立了突发情况的限流机制,保障系统不中断服务。

  最后,行程卡还建立健全了运营维护的管理制度,形成了日常运维、重点保障、应急处置三位一体的运维保障体系。

  谈及今后持续推动信息系统的稳定性保障工作,中国工程院院士廖湘科认为,应当从以下几方面着手:

  廖湘科说,对于软件系统稳定性的相关研究历时已久,随着软件技术及研发理念的深度变革,对于稳定性工作的研究也在持续革新。当前,在引进外部创新理论及开源技术工作的同时,也应当坚持自主创新路线,夯实自身理论基础,强化技术创新,形成自主可控的稳定性保障技术能力。

  “技术的创新突破不可能凭空产生,需要产学研用各方更进一步深入合作,形成可持续的密切合作模式。”廖湘科建议,由应用方提供真实的需求和场景,以真实的系统稳定性问题引导产学研产出可以实际落地应用的技术和技术创新。

  廖湘科表示,我国软件技术目前在各个行业高度分散,缺乏统一标准和平台,在保障信息系统平稳运行时也缺乏跨行业可共享的经验和方法论。行业内、行业间的认知也存在碎片化、差异化的现象。

  “通过统一行业认知,形成规范化系统的稳定性支持体系,系统保障体系和技术工具,以及共享化的系统监测及运营服务平台,有利于降低建设成本,为中小企业提供普惠支持。”

  此外,还要着力人才教育培训,扩大产业革命。“人才是可持续发展的基础,各层面的技术专业人才是信息系统稳定性保障工作可持续发展的动力源泉。”

  廖湘科说,在信息系统稳定性这一领域,人才能力往往来自大量实践经验积累,因此对人才的培养需要产业界和高校共建,把行业积累的知识和实践案例投入到教学和实践中,同时也需要加大对系统稳定性相关产业的投入,通过扩大产业规模留住更多专业人才,甚至吸引更多人才进入这个领域。

  对于信息系统的稳定运行,中央网信办信息化发展局副局长张望也提出了三点建议。

  一是要注重制度建设和管理。信息系统运营单位理应当在充分的发挥各方技术能力基础上,更看重制度建设和落实,最大限度地保障信息系统的平稳运行。

  二是提高技术保障能力。信息系统安全稳定运行是一项复杂的技术工作,既要加强技术能力建设,也要加强产学研用的协作,推动信息系统稳定性保障的理论研究和技术实践走向深入。

  “信息系统运行过程中难以防止突发情况,及时有效地发现、及时处置,是保障系统长期稳定运行的关键一环。”张望说,信息系统的运营单位理应当制定针对各类问题的应急预案,适时开展应急演练,在突发情况时能快速响应、高效处置。


上一篇:【48812】轿车单向阀图片
下一篇:天玛智控: 公司不制造导引车

液动执行器的电阻电容毛病处理方法

没有了