下载此beplayapp体育下载

基于混部技术的金融云平台资源集约化和稳定性提升研究报告.docx


beplayapp体育下载分类:论文 | 页数:约19页 举报非法beplayapp体育下载有奖
1 / 19
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该beplayapp体育下载所得收入归上传者、原创者。
  • 3.下载的beplayapp体育下载,不会出现我们的网址水印。
1 / 19 下载此beplayapp体育下载
beplayapp体育下载列表 beplayapp体育下载介绍
该【基于混部技术的金融云平台资源集约化和稳定性提升研究报告 】是由【琥珀】上传分享,beplayapp体育下载一共【19】页,该beplayapp体育下载可以免费在线阅读,需要了解更多关于【基于混部技术的金融云平台资源集约化和稳定性提升研究报告 】的内容,可以使用beplayapp体育下载的站内搜索功能,选择自己适合的beplayapp体育下载,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此beplayapp体育下载到您的设备,方便您编辑和打印。目 录一、研究背景及目标 1(一)研究背景 1(二)研究目标 2二、国内外应用现状 2三、技术方案 3(一)系统总体架构 3(二)混部调度框架 4(三)混部资源隔离 9四、验证场景 11(一)应用混部 12(二)干扰检测与驱逐 13(三)干扰隔离 15五、应用成果 17六、总结和展望 17一、研究背景及目标(一)研究背景大规模数据中心是当今企业级互联网应用和云计算系统的关键支撑。为保障日益增长的互联网应用和云计算系统的计算需求,数据中心需要不断横向扩容,其规模和服务器总量呈现快速增长趋势。然而,伴随着数据中心的急速扩容,其资源利用率却始终处于较低状态。统计数据表明,目前全球数据中心资源利用率仅为10—20,如此低的资源利用率意味着大量的资源浪费。因此,如何把这些浪费的资源合理利用起来成为一个亟需解决的关键性技术问题。想要解决这个问题首先要研究其产生的根本原因。通常而言,数据中心承载着各种类型的业务,包括交易、办公类等在线服务、大数据、实时计算等,从业务对资源质量要求来看,可对不同类型的应用按优先级分级,业界比较典型的划分场景为在线和离线。在线作业通常是处理用户请求的服务,典型的有网页搜索、即时通信、语音识别、流式计算、电子商务等,通常可为企业带来直接的经济利益,具有如下特点:一是运行时间长。在线作业通常以服务的形态持续运行,以请求为单位触发计算任务,因此也被称为长服务。二是资源使用呈现动态变化。在线作业的资源使用量与用户并发请求量呈正相关,会伴随用户并发请求量发生动态变化。三是对性能变化敏感。在线作业的性能通常决定了对外服务质量,而服务质量则直接影响企业的经济利益和用户体验。因此,在线作业又被称为延时敏感型作业。为保证应用运行的稳定可靠,往往会为在线应用分配大量的服务器资源。后果就是,虽然能够很好保障其运行质量,但也造成了在大部分时间服务器处于空闲的状态,导致数据中心整体资源利用率很低。解决这个问题的最佳方案是“混部”,顾名思义,就是把不同优先级的应用进行混合部署,比如在线应用和离线应用混部,高优先级和低优先级在线应用混部。当在线应用的资源使用量处于低谷时,将离线应用或者低优先级的在线作业部署到空闲的节点上,大幅提高整个集群的资源利用率。(二)研究目标通过对业界混部技术的主流方案和技术原理进行研究,结合金融行业应用的实际情况,基于K8S技术基础,研究适合金融行业的容器混部方案,实现资源利用率的明显提升,在保证应用服务质量的同时,实现混部节点50以上部署密度的提升,资源利用率提升至30以上。对于高优先级应用,相较于混部前,干扰控制在5的范围之内。二、国内外应用现状混部已成为业界提升资源利用率的主流方法,以空闲的在线资源满足离线作业和低优先级作业的计算需求,来实现资源利用率的提升。中率先尝试了大规模在离线混部,国内百度、腾讯、阿里等均在混部集群上也有所实践。经对业界实践调研,精细化的混部调度和严格的资源隔离是亟待解决的技术难点。混部调度方面,和腾讯的YARD采用了统一调度的架构,即在线作业和离线作业由一个调度器统一调度,而百度Matrix和阿里Fuxi则采用了在离线分离调度的方式,即在离线作业由各自的调度器调度。从调度算法来看,Borg和Sigma采用了基于打分规则的调度算法。Fuxi、Matrix、YARD则是对YARN调度算法的改进,在调度时考虑了节点空余资源,并使用作业画像、节点画像等预测作业的资源需求和节点未来可用资源。资源隔离方面,业界均采用了多种资源隔离技术。容器技术作为轻量级的虚拟化技术被广泛使用;CPU作为最重要的计算资源,CPU隔离和抢占式调度成为所有混部系统的选择;CAT(cacheallocationtechnology)技术也被较多地采用。三、技术方案(一)系统总体架构基于金融业应用的情况,本课题设计了一套基于应用高低优先级的混部系统,整体架构如图1所示。图1整体架构图系统整体分为两部分:混部调度框架,由资源画像、混部调度以及每个节点上运行的Agent等组件构成,基于应用分级和资源超卖实现高低优先级应用的混合部署。混部资源隔离,提供增强型资源隔离特性,面向混部场景,解决容器隔离性不足导致的相互干扰问题,在提升资源使用率的同时,保证应用服务质量不受影响。(二)。图2详细功能图资源画像:基于CPU、内存等指标数据,通过统计分析、机器学****等手段对应用资源使用进行画像,为资源调度系统提供混部调度所需的关键信息。混部调度:基于高优先级应用的空闲资源和应用负载类型,根据调度策略完成高低优先级应用的混部调度;实时判断高优先级应用的受干扰程度并及时进行规避处理,保证应用服务质量不受影响。,data等工具采集CPU、内存、磁盘等资源,基于应用的历史数据,利用数据分析、机器学****等技术对应用进行周期性地画像,包括:应用资源密集型分类,对应用历史CPU、内存、磁盘和网络IO使用总量分别进行归一化,计算得到应用每个维度的密集系数,用来衡量该应用在该维度的资源需求量;应用负载趋势预测,根据应用历史CPU和内存使用数据,使用时序预测算法XGBoost预测应用未来的负载情况;应用CPI健康阈值,基于3-sigma准则计算应用的CPI(cyclesperinstruction),将输出的上限作为应用CPI的健康阈值线。,混部系统实现了更精细化的调度,根据混部节点上高优先级应用负载情况动态调整节点的可混部资源,通过混部标签识别低优先级应用,并根据混部调度策略进行节点的筛选和打分,完成混部应用调度到混部节点的过程,并实时监测应用的干扰情况,根据受干扰程度进行相应的避让处理。节点资源扩展。对节点空闲资源和高优先级应用的闲置资源进行抽象,基于混部资源标签,扩展节点的资源属性,如图4所示。图4节点资源应用属性扩展。对应用进行优先级划分并写入应用属性,低优先级应用又可按更细粒度划分1-5级,可作为驱逐筛选条件,如图5所示。图5应用属性混部调度策略。通过扩展k8s原生的调度框架,实现自定义Scoring扩展:混部资源均衡调度,使混部节点在集群内均衡分布,避免混部节点堆积;同质资源均衡调度,基于应用资源密集型调度,避免多个相同类型的应用调度到同一个节点,如图6所示。图6调度器原理混部资源计算。结合节点上应用当前负载情况和未来负载趋势预测数据周期性并计算混部节点可混部资源,计算流程如图7所示。图7计算流程水位线评估。如图8所示,设计调度水位线和驱逐水位线:节点压力达到调度水位线后,设置节点不能继续调度混部应用;达到驱逐水位线后,驱逐混部应用,使节点压力稳定在驱逐水位线之下。图8水位线评估干扰驱逐。持续监控节点CPI指标,当应用的CPI持续超过健康阈值后,向节点发起驱逐请求。混部调控模块监听混部节点的驱逐事件,根据请求类型执行驱逐操作,获取主机上所有混部业务的pod,根据pod的优先级、数量、使用率等因素计算最优驱逐节点进行驱逐,CPI指标正常后则停止驱逐操作。(三)混部资源隔离在混部过程中,由于低优先级应用竞争CPU、内存、网络带宽等共享资源以及由于进程在不同CPU频繁切换及负载流量突发等情况,会导致应用性能受损,为了保障应用服务质量,防范关键业务QoS受损,引入增强的内核隔离机制,提供多重保障以提升工作负载的运行效率及稳定性,如图9所示。

基于混部技术的金融云平台资源集约化和稳定性提升研究报告 来自beplayapp体育下载www.apt-nc.com转载请标明出处.

相关beplayapp体育下载 更多>>
非法内容举报中心
beplayapp体育下载信息
  • 页数19
  • 收藏数0收藏
  • 顶次数0
  • 上传人琥珀
  • 文件大小5.07 MB
  • 时间2024-03-27