MapReduce 服务详解
MapReduce服务(MRS)是一种基于云计算平台的企业级大数据集群云服务,旨在提供高可靠、高安全、易使用的运行维护平台,它对外提供大容量的数据存储和分析能力,解决企业在数据存储和处理方面的需求,本文将深入探讨MRS的各个方面,包括其特性、优势、架构以及应用场景。
MRS介绍
什么是MapReduce服务?
MapReduce服务(MRS)是一个开源开放、租户完全可控的企业级Hadoop大数据集群云服务,通过MRS,用户可以轻松运行Hadoop、Spark、HBase、Kafka、Storm等大数据组件,MRS提供了一键式集群安装部署和扩容功能,用户无需关注硬件的购买和维护,从而大大降低了使用门槛。
MRS的主要特性
高可靠性:MRS采用先进的计算存储分离架构,提供大数据全引擎的On OBS方案,确保数据的高可靠性。
高安全性:支持多种安全机制,保障数据的安全性。
易用性:可视化的企业级集群管理系统,节点状态实时监控,告警短信提醒,补丁主动推送,一键安装,业务不中断。
弹性伸缩:资源灵活配比,支持裸金属、虚拟机不同部署方式,单集群支持裸金属和虚拟机混合部署,峰谷任务可通过预先配置策略,按需自动弹性伸缩。
MRS的产品优势
一键式集群安装部署和扩容:用户无需关注硬件的购买和维护,只需通过简单的操作即可完成集群的安装和扩展。
可视化管理:企业级集群管理系统提供节点状态实时监控、告警短信提醒等功能,使管理更加便捷。
先进的计算存储分离架构:提供大数据全引擎的On OBS方案,降低成本,提高性能。
多版本选择:支持多种操作系统和数据库版本,满足不同企业的需求。
MRS的架构与组件
MRS集群分类
集群类型 | 集群版本 | 集群发放模式 |
ECS集群 | MRS 3.2.1-LTS.1 | 通过MRS Console以及相应版本的镜像安装完毕后,直接创建基于弹性云服务器ECS的MRS集群 |
BMS集群 | MRS 3.2.1-LTS.1 | 通过MRS Console以及相应版本的镜像安装完毕后,直接创建基于裸金属服务器BMS的MRS集群 |
物理机集群 | MRS 3.2.1-LTS.1_offline | MRS服务与独立的MRS物理机集群分别安装完毕后,将MRS物理机集群纳管到MRS管理控制台上进行统一管理 |
MRS集群系统逻辑架构
MRS对开源组件进行了封装和增强,集群中包含Manager和众多组件,分别提供以下功能:
CDL:一种简单、高效、数据实时集成服务。
ClickHouse:用于联机分析(OLAP)的列式数据库管理系统(DBMS)。
DBService:为Hive、Hue、Oozie、Loader、Metadata和Redis组件提供元数据存储服务。
Elasticsearch:兼有搜索引擎和NoSQL数据库功能的开源系统,基于JAVA/Lucene构建。
Flink:批处理和流处理结合的统一计算框架。
Flume:分布式、可靠和高可用的海量日志聚合系统。
FTP-Server:通过通用的FTP客户端、传输协议提供对HDFS文件系统的基本操作。
Guardian:提供访问OBS的临时认证凭据。
GraphBase:基于HBase和Elasticsearch的分布式图数据库。
HBase:构建在HDFS之上的分布式、面向列的存储系统。
HDFS:Hadoop分布式文件系统,适合大规模数据集的应用。
HetuEngine:华为自研高性能交互式SQL分析及数据虚拟化引擎。
Hive:建立在Hadoop基础上的数据仓库。
Hue:MRS应用的图形化用户Web界面。
IoTDB:一体化收集、存储、管理与分析物联网时序数据的软件系统。
JobGateway:提供作业提交的REST API服务。
Kafka:分布式、分区的、多副本的实时消息发布和订阅系统。
KMS:基于KeyProvider API编写的密钥管理服务器。
Loader:实现关系型数据库、文件系统之间交换数据和文件的数据加载工具。
Manager:作为运维系统,提供高可靠、安全、容错、易用的集群管理能力。
Mapreduce:提供快速并行处理大量数据的能力。
Metadata:为数据仓库类型的组件提供元数据的抽取能力。
Oozie:提供对开源Hadoop组件的任务编排、执行功能。
Ranger:集中式框架,提供复杂数据监控、操作、管理等权限管控接口。
Redis:开源的高性能key-value分布式存储数据库。
RTD:容器化业务处理单元。
Solr:高性能全文检索服务器。
Storm:分布式实时计算系统。
Tez:DAG模型计算框架。
Yarn:Hadoop的资源管理器。
ZooKeeper:分布式协调服务。
MRS的应用场景
海量数据分析场景
在现代大数据系统中,海量数据分析是主要场景之一,企业通常包含多种数据源,接入后需要对数据进行ETL处理形成模型化数据,以便提供给各个业务模块进行分析梳理,这类业务通常有以下特点:
对执行实时性要求不高,作业执行时间在数十分钟到小时级别。
数据量巨大,数据来源和格式多种多样。
数据处理通常由多个任务构成,对资源需要进行详细规划。
车联网数据分析场景
在车联网数据分析场景中,MRS服务的Spark组件可以用于车主驾驶行为分析统计,得到用户驾驶行为的分析结果,这种分析可以帮助优化车辆性能和驾驶体验。
常见问题解答(FAQs)
Q1: MRS支持哪些操作系统和数据库版本?
A1: MRS支持多种操作系统和数据库版本,具体如下:
| x86 | Red Hat/CentOS/中标麒麟/BC-Linux-7.x | FusionInsight_Manager_8.2.1.1_RHEL.tar.gz | FusionInsight_Manager_8.2.1.1_RHEL.tar.gz.cms | FusionInsight_Manager_8.2.1.1_RHEL.tar.gz.crl | FusionInsight_BASE_8.2.1.1_RHEL.tar.gz | FusionInsight_BASE_8.2.1.1_RHEL.tar.gz.cms | FusionInsight_BASE_8.2.1.1_RHEL.tar.gz.crl | FusionInsight_CDL_8.2.1.1_RHEL.tar.gz | FusionInsight_CDL_8.2.1.1_RHEL.tar.gz.cms | FusionInsight_CDL_8.2.1.1_RHEL.tar.gz.crl | FusionInsight_ClickHouse_8.2.1.1_RHEL.tar.gz | FusionInsight_ClickHouse_8.2.1.1_RHEL.tar.gz.cms | FusionInsight_ClickHouse_8.2.1.1_RHEL.tar.gz.crl | FusionInsight_Elasticsearch_8.2.1.1_RHEL.tar.gz | FusionInsight_Elasticsearch_8.2.1.1_RHEL.tar.gz.cms | FusionInsight_Elasticsearch_8.2.1.1_RHEL.tar.gz.crl | FusionInsight_Flink_8.2.1.1_RHEL.tar.gz | FusionInsight_Flink_8.2.1.1_RHEL.tar.gz.cms | FusionInsight_Flink_8.2.1.1_RHEL.tar.gz.crl | FusionInsight_GraphBase_8.2.1.1_RHEL.tar.gz | FusionInsight_GraphBase_8.2.1.1_RHEL.tar.gz.cms | FusionInsight_GraphBase_8.2.1.1_RHEL.tar.gz.crl | FusionInsight_Guardian_8.2.1.1_RHEL.tar.gz | FusionInsight_Guardian_8.2.1.1_RHEL.tar.gz.cms | FusionInsight_Guardian_8.2.1.1_RHEL.tar.gz.crl | FusionInsight_HBase_8.2.1.1_RHEL.tar.gz | FusionInsight_HBase_8.2.1.1_RHEL.tar.gz.cms | FusionInsight_HBase_8.2.1.1_RHEL.tar.gz.crl | FusionInsight_HDFS_8.2.1.1_RHEL.tar.gz | FusionInsight_HDFS_8.2.1.1_RHEL.tar.gz.cms | FusionInsight_HDFS_8.2.1.1_RHEL.tar.gz.crl | FusionInsight_HetuEngine_8.2.1.1_RHEL.tar.gz | FusionInsight_HetuEngine_8.2.1.1_RHEL.tar.gz.cms | FusionInsight_HetuEngine_8.2.1.1_RHEL.tar.gz.crl | FusionInsight_Hive_8.2.1.1_RHEL.tar.gz | FusionInsight_Hive_8.2.1.1_RHEL.tar.gz.cms | FusionInsight_Hive_8.2.1.1_RHEL.tar.gz.crl | FusionInsight_Hue_8.2.1.1_RHEL.tar.gz | FusionInsight_Hue_8.2.1.1_RHEL.tar.gz.cms | FusionInsight_Hue_8.2.1.1_RHEL.tar.gz.crl | FusionInsight_IoTDB_8.2.1.1_RHEL.tar.gz | FusionInsight_IoTDB_8.2.1.1_RHEL.tar.gz.cms | FusionInsight_IoTDB_8.2.1.1_RHEL.tar.gz.crl | FusionInsight_KMS_8.2.1.1_RHEL.tar.gz | FusionInsight_KMS_8.2.1.1_RHEL.tar.gz.cms | FusionInsight_KMS_8.2.1.1_RHEL.tar.gz.crl | FusionInsight_Loader_8.2.1.1_RHEL.tar.gz | FusionInsight_Loader_8.2.1.1_RHEL.tar.gz.cms | FusionInsight_Loader_8.2.1.1_RHEL.tar.gz.crl | FusionInsight_Manager_8.2.1.1_RHEL.tar.gz | FusionInsight_Manager_8.2.1.1_RHEL.tar.gz.cms | FusionInsight_Manager_8.2.1.1_RHEL.tar.gz.crl | FusionInsight_Mapreduce_8.2.1.1_RHEL.tar.gz | FusionInsight_Mapreduce_8.2.1.1_RHEL.tar.gz.cms | FusionInsight_Mapreduce_8.2.1.1_RHEL.tar.gz.crl | FusionInsight_Metadata_8.2.1.1_RHEL.tar.gz | FusionInsight_Metadata_8.2.1.1_RHEL.tar.gz.cms | FusionInsight_Metadata_8.2.1.1_RHEL.tar.gz.crl | FusionInsight_Oozie_8.2.1.1_RHEL.tar.gz | FusionInsight_Oozie_8.2.1.1_RHEL.tar.gz.cms | FusionInsight_Oozie_8.2.1.1_RHEL.tar.gz.crl | FusionInsight_Ranger_8.2.1.1_RHEL.tar.gz | FusionInsight_Ranger_8.2.1.1_RHEL.tar.gz.cms | FusionInsight_Ranger_8.2.1.1_RHEL.tar.gz.crl | FusionInsight_Redis_8.2 MapReduce服务 (MRS)打造了高可靠、高安全、易使用的运行维护平台,对外提供大容量的数据存储和分析能力,可解决各大企业的数据存储和处理需求,用户可以独立申请和使用托管Hadoop、Spark、HBase和Hive服务,用于快速在主机上创建集群,提供海量数据的实时性要求不高的批量数据存储和计算能力。
Q2: MRS如何实现弹性伸缩和自动弹性伸缩?
A2: MRS提供自动弹性伸缩功能,可以在业务繁忙时自动申请额外资源,在业务不繁忙时释放闲置资源,降低使用成本,MRS还支持包周期集群扩容,只需点几下鼠标即可完成扩容,扩容过程无需后台人工介入,MRS对接SMN,实时发送集群健康状态。
以上内容就是解答有关“mapreduce服务 mrs_MapReduce服务 MRS”的详细内容了,我相信这篇文章可以为您解决一些疑惑,有任何问题欢迎留言反馈,谢谢阅读。