flink1.12 2 2.zip



《Flink 1.12 on CDH 6.3.2: 源码编译与 parcel 包制作详解》 Apache Flink 是一个开源流处理和批处理框架,以其高效、低延迟的特性在大数据领域备受青睐。本文将详细讲解如何在 CentOS 7.5 上,结合 Cloudera Data Hub (CDH) 6.3.2,使用 Scala 2.12 编译 Flink 1.12 源码,并制作成 parcel 包,以供 CDH 集群部署使用。 一、Flink 1.12 简介 Flink 1.12 版本引入了多项优化和改进,包括增强的状态后恢复机制、新的连接器、以及性能提升等。此版本对 SQL 支持更加完善,增强了对时间窗口和窗口聚合的支持,同时也优化了对 State 的管理,使得在大规模流处理任务中能更稳定、高效地运行。 二、环境准备 1. 操作系统:CentOS 7.5 2. 开发环境:Java Development Kit (JDK) 8 或更高版本 3. 构建工具:Apache Maven 4. Scala 编程语言:Scala 2.12 5. CDH 集群:CDH 6.3.2,包含 Hadoop 和 YARN 组件 三、源码编译 1. 获取 Flink 源码:从 Apache Flink 官方仓库克隆最新 1.12 分支到本地。 2. 配置 Maven:在 `pom.xml` 文件中,根据 CDH 版本调整相关依赖,确保与集群兼容。 3. 编译 Flink:运行 `mvn clean package -DskipTests` 命令,编译并生成可执行 JAR 包。 四、 parcel 包制作 1. 创建 parcel 文件夹结构:按照 CDH parcel 格式,创建目录 `flink-1.12.2/FLINK-1.12.2/`,并将编译生成的 Flink 相关文件放入相应目录。 2. 编写 parcel-descriptor.properties 文件:定义 parcel 的元数据,包括 parcel 的名称、版本、依赖等信息。 3. 创建 parcel-repo:将 parcel 文件夹上传至 CDH 集群的 parcel 仓库,如 `/var/cdh/parcel_repo/`。 4. 验证 parcel:使用 `cloudera-manager parcel` 命令进行校验,确保 parcel 包的完整性和可部署性。 五、CDH 集群部署 1. 分发 parcel:通过 Cloudera Manager 启动 parcel 分发,将 parcel 文件分发到集群中的所有节点。 2. 启动 Flink:配置 Flink 在 CDH 中的 YARN 集成,启动 Flink 集群服务。 3. 配置 Flink:在 Cloudera Manager 中设置 Flink 的相关参数,如资源分配、日志级别等。 4. 测试部署:编写简单的 Flink 流处理或批处理作业,验证 Flink 在 CDH 集群上的正确运行。 六、注意事项 1. 确保 JDK 版本与 CDH 集群兼容。 2. 在 parcel 制作过程中,遵循 CDH 对 parcel 文件的命名和目录结构规范。 3. 注意 Flink 与 CDH 中的 Hadoop 版本兼容性,避免因版本差异导致的问题。 4. 定期更新 Flink 到最新维护版本,以获取最新的功能和安全修复。 总结:通过以上步骤,我们成功地在 CentOS 7.5 环境下,使用 Scala 2.12 编译了 Flink 1.12 源码,并将其转化为适用于 CDH 6.3.2 的 parcel 包。这一过程不仅加深了对 Flink 内部机制的理解,也为在 CDH 集群上高效运行 Flink 提供了基础。对于那些希望在 CDH 平台上使用 Flink 进行大数据处理的开发者,这是一个值得参考的实践过程。










- 1































- 粉丝: 1042
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助


最新资源
- 数学建模与计算机的关系研究.docx
- 基于PLC立体仓库——keshine物流咨询方案部仓储管理培训.doc
- XX中华新天地项目管理推广建议案.doc
- 基于 PyTorch 框架的卷积神经网络手写字体分类与识别系统
- 嵌入式车载设备中存储系统抗干扰专业技术研究.doc
- 涉密信息系统集成资质保密知识检测测验题(20160112更新).doc
- 想象、现实、工具:基于人工智能文艺创作的多重思考.docx
- 大学生网络游戏成瘾案例分析与思考.docx
- 大数据时代人工智能的创新与发展研究.docx
- 计算机图形学实验五直线段裁剪.doc
- 基于深度学习的初中物理实验教学策略初探.docx
- 计算机UG软件在《机械基础》课上的应用.docx
- 51单片机只能家用电热水器方案设计书.doc
- RockwellPLC在十层电梯控制系统中的应用.doc
- PLC控制系统总体设计方案.doc
- CS、CSS架构应用的软件性能测试模型研究.doc



评论2