【深入浅出 Yarn 架构与实现】2-1 Yarn 基础库概述
2022/11/27 1:23:54
本文主要是介绍【深入浅出 Yarn 架构与实现】2-1 Yarn 基础库概述,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
一、主要使用的库
- Protocol Buffers:是 Google 开源的序列化库,具有平台无关、高性能、兼容性好等优点。YARN 将其用到了 RPC 通信中,默认情况 下,YARN RPC 中所有参数采用 Protocol Buffers 进行序列化 / 反序列化。
- Apache Avro:是 Hadoop 生态系统中的 RPC 框架,具有平台无关、支持动态模式(无需编译)等优点,Avro 的最初设计动机是解决 YARN RPC 兼容性和扩展性 差等问题。
- RPC 库:YARN 仍采用了 MRv1 中的 RPC 库,但其中采用的默认序列化方法被替换成了 Protocol Buffers。
- 服务库和事件库 :YARN 将所有的对象服务化,以便统一管理(比创建、销毁等), 而服务之间则采用事件机制进行通信,不再使用类似 MRv1 中基于函数调用的方式。
- 状态机库:YARN 采用有限状态机描述一些对象的状态以及状态之间的转移。引入状态机模型后,相比 MRv1, YARN 的代码结构更加清晰易懂。
二、第三方开源库介绍
一)Protocol Buffers
1、简要介绍#
Protocol Buffers 是 Google 开源的一个语言无关、平台无关的通信协议,其小巧、高效和友好的兼容性设计,使其被广泛使用。
【可以类比 java 自带的 Serializable 库,功能上是一样的。】
Protocol buffers are Google’s language-neutral, platform-neutral, extensible mechanism for serializing structured data – think XML, but smaller, faster, and simpler. You define how you want your data to be structured once, then you can use special generated source code to easily write and read your structured data to and from a variety of data streams and using a variety of languages.
核心特点:
- 语言、平台无关
- 简洁
- 高性能
- 兼容性好
2、安装环境#
以 mac 为例(其他平台方式请自查)
# 1) brew安装 brew install protobuf # 查看安装目录 $ which protoc /opt/homebrew/bin/protoc # 2) 配置环境变量 vim ~/.zshrc # protoc (for hadoop) export PROTOC="/opt/homebrew/bin/protoc" source ~/.zshrc # 3) 查看protobuf版本 $ protoc --version libprotoc 3.19.1
3、写个 demo#
1)创建个 maven 工程,添加依赖
<dependencies> <dependency> <groupId>com.google.protobuf</groupId> <artifactId>protobuf-java</artifactId> <version>3.19.1</version> <!--版本号务必和安装的protoc版本一致--> </dependency> </dependencies>
2)根目录新建 protobuf 的消息定义文件 student.proto
syntax = "proto3"; // 声明为protobuf 3定义文件 package tutorial; option java_package = "com.shuofxz.learning.student"; // 生成文件的包名 option java_outer_classname = "StudentProtos"; // 类名 message Student { // 待描述的结构化数据 string name = 1; int32 id = 2; optional string email = 3; //optional 表示该字段可以为空 message PhoneNumber { // 嵌套结构 string number = 1; optional int32 type = 2; } repeated PhoneNumber phone = 4; // 重复字段 }
3)使用 protoc
工具生成消息对应的Java类(在 proto 文件目录执行)
protoc -I=. --java_out=src/main/java student.proto
可以在对应的文件夹下找到 StudentProtos.java
类,里面写了序列化、反序列化等方法。
标签:Yarn,架构,基础库概,数据,java 来源:
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。
这篇关于【深入浅出 Yarn 架构与实现】2-1 Yarn 基础库概述的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-11-15JavaMailSender是什么,怎么使用?-icode9专业技术文章分享
- 2024-11-15JWT 用户校验学习:从入门到实践
- 2024-11-15Nest学习:新手入门全面指南
- 2024-11-15RestfulAPI学习:新手入门指南
- 2024-11-15Server Component学习:入门教程与实践指南
- 2024-11-15动态路由入门:新手必读指南
- 2024-11-15JWT 用户校验入门:轻松掌握JWT认证基础
- 2024-11-15Nest后端开发入门指南
- 2024-11-15Nest后端开发入门教程
- 2024-11-15RestfulAPI入门:新手快速上手指南