13518219792

建站动态

根据您的个性需求进行定制 先人一步 抢占小程序红利时代

一文了解-云原生大数据知识地图

一文了解-云原生大数据知识地图

作者:迟慧 2023-02-06 18:21:00

云计算

云原生

大数据 云原生大数据是大数据平台新一代架构和运行形态,是一种以平台云原生化部署、计算云原生调度、存储统一负载为特点,可以支持多种计算负载,计算调度更弹性,存储效能更高的大数据处理和分析平台。

10年积累的网站设计制作、做网站经验,可以快速应对客户对网站的新想法和需求。提供各种问题对应的解决方案。让选择我们的客户得到更好、更有力的网络服务。我虽然不认识你,你也不认识我。但先建设网站后付款的网站建设流程,更有荔波免费网站建设让你可以放心的选择与我们合作。

一、大势所趋:云原生大数据

随着行业的快速发展和业务的高速迭代,数据量也呈爆炸式增长,传统的大数据架构在资源利用、高效运维、可观测性等方面存在诸多不足,已经越来越无法适应当下的发展需求。具体来讲,传统大数据架构主要存在以下几方面的问题:

  1. 传统大数据组件繁多,安装运维复杂,在生产使用中需要大量的人力支持;
  2. 在线业务和大数据业务各自使用独立的资源池,使得资源流转困难,利用率低,成本上升;
  3. 传统大数据架构没有 CICD 机制,缺少测试和质量控制流程;
  4. 传统大数据缺少开箱即用的高可用、多租户、日志、监控、告警、认识、授权、审计、计费等能力。

云原生大数据是大数据平台新一代架构和运行形态,是一种以平台云原生化部署、计算云原生调度、存储统一负载为特点,可以支持多种计算负载,计算调度更弹性,存储效能更高的大数据处理和分析平台。云原生大数据带来了大数据在使用和运维方面的巨大变化,从以下三个角度来看:

二、“3+1”架构模式:三大平台一大支撑体系

云原生大数据平台的功能架构可以总结为“三大平台和一大支撑体系”。三大平台分别是平台服务层核心引擎层资源调度层

一大支撑体系是运维管理平台,是集开源组件、服务生命周期、集群、容灾、可观测性于一体的一站式管理平台。

1. 平台服务层

平台服务层由开源组件插件化集成,灵活配置选用,这是整个平台架构的一个关键设计。

为了尊重现有用户使用习惯,将用户习惯使用的开源组件以插件化的形式进行了集成。现有主流的大数据工作场景主要包括信息门户数据工程和数据科学三种,每个场景下都有许多用户常用的开源组件:

上述三个场景是大数据工作中非常常见的场景,云原生大数据平台通过插件化的方式集成这些开源组件,即开即用,具备极大的便捷性和灵活性。

2. 核心引擎层

核心引擎层具备了存算分离的特点。

在计算方面,集成主流大数据计算引擎包括 Flink、Spark,同时集成了云原生消息中间件、实时服务分析引擎和云原生日志搜索服务;

在存储方面,采取统一存储,兼容 HDFS 语义,支持 TOS 透明加速、缓存加速和数据湖管理。

自动调优

大数据向云原生发展需要推动计算引擎与云原生深度融合,向着自动调优方向演进。从我们的经验来看,这个过程可分为四个阶段:

#部署和管理 K8s 集群

#应用自己管理容器和镜像

      #资源池化:对底层 K8s 资源无感知

      #资源混部:在离线作业共享集群资源

      #只关注作业资源的额度和并行度

      #平滑演进:YARN 作业和 K8s 作业混部

      #虚拟队列:支持跨集群和机房作业自动调度

      #利用闲置资源:利用超发和驱逐机制利用空闲资源

      #引擎半自动调优:利用智能团队推荐任务配置参数,人工确认下发

     #全局自动容灾:实现跨机房自动调度和容灾

     #资源自动优化:没有负载的时候资源使用可以减低到0;毫秒级的冷启动延时

     #引擎自动调优:混合不使用 AI 技术优化使用资源,包括计算网络和内存

存算分离

云原生化具体工作主要包括了三个部分:

统一管理和调度

存储能力共用

存算分离负载

3. 资源调度层

资源调度层主要起到统一计算资源调度,统一引擎云原生生命周期管理的作用,包含以下四个模块:

传统的资源调度系统向云原生演进,有两种并行的方式,可供二选一:

统一资源池(左图);支持跨集群、跨机房、跨地域的全局资源湖(右图)

在调度层面,实现云原生化需要做的两件事情:

统一资源池

对于虚拟的资源池的概念,我们认为它需要一些基本的要求,包括:

全局资源湖

例如,当前在集群 A 有一个资源池,在集群 B 有一个资源池,为了容灾的需求,我们可能把这两个资源池作为一个主备的资源池,抽象出来一个虚拟队列的概念。这样在任务提交时,用户就可以不关注资源池,只提交到虚拟队列上即可,至于分配到 A 集群/机房还是分配到 B 集群/机房,会自动根据下面集群/机房的运行状态来判断。

4. 运维管理平台

集开源组件、服务生命周期、集群、容灾、可观测性于一体的一站式管理平台。

大数据平台应当具备可观测性开源组件管理服务生命周期管理集群管理、 容灾管理的功能和服务,图中标蓝部分是云原生计算进行了特别增强的部分,下面来重点阐述一下:

三、降本增效:用户场景与价值

1. 混合部署提升资源利用率

在混部的用户场景下,云原生大数据平台支持很多的业务场景,包括在线、流式、离线、查询分析和批处理等。

由于不同业务场景对于底层资源响应的核心指标不同,对底层资源的优化需求也会存在区别。如果要满足这些不同场景的业务指标要求,在混部的时候就要有重点地进行对应的优化。以下是混部的两个典型场景:

  1. Flink  Spark 的混部。即 Flink 不使用资源,或负载低的时候,资源可以出让给 Spark,Spark 执行完批式计算后,空闲的资源也可以出让给流式计算(Flink)用。
  2. APP 实时调用和大数据场景的混部。在上图提到的5个场景中,右侧4个都是大数据场景。大数据场景可以和 APP 实时调用场景进行资源复用——当 APP 在线资源使用量较少时,可以出让给大数据场景使用,反之亦然。

以字节跳动为例,我们在通过这样多种计算资源混合部署调度之后,获得了不俗的收益。

2. 多云部署实现多云成本最优复用

在多云的用户场景下,我们可以提供多云部署和调度,实现多云成本最优复用和跨云队列容灾:


文章标题:一文了解-云原生大数据知识地图
标题来源:http://cdbrznjsb.com/article/dphjhpi.html

其他资讯

让你的专属顾问为你服务