作业调度-369IT编程

admin管理员组
文章数量:1031973

作业调度

1.定义

Flink作业调度是将Flink作业提交到Flink集群上，并根据作业的执行计划和资源需求等信息对作业进行优化、调度和分配，从而实现高效、可靠的作业执行的过程

2.设计思路：

作业提交：Flink作业调度的第一步是将作业提交到集群上，提交方式可以通过命令行、Web界面或API等实现。
作业分析：在作业提交后，Flink会对作业进行分析，包括作业的执行计划、算子的依赖关系、资源需求等信息。
作业优化：Flink会根据作业的执行计划和资源需求等信息对作业进行优化，例如合并相邻的算子、优化任务并行度等，以提高作业的执行效率。
任务调度：Flink会根据作业的执行计划和资源需求等信息对任务进行调度，以便作业可以在Flink集群中高效执行。
资源分配：Flink会为每个任务分配所需的资源，包括CPU、内存、网络带宽等，以保证作业能够高效地执行。
故障恢复：Flink会根据作业的故障恢复策略，在出现故障时对作业进行恢复，例如任务重启、恢复到指定的检查点等，以保证作业的可靠性。
作业监控：Flink会对作业进行监控，包括任务的执行状态、作业的运行时间、数据量等信息，以便用户可以及时了解作业的执行情况。总体而言，Flink作业调度的设计思路旨在提高作业的执行效率和可靠性，为Flink提供高性能、分布式的数据处理能力。

3.调度流程

Flink 通过 Task Slots 来定义执行资源。每个 TaskManager 有一到多个 task slot，每个 task slot 可以运行一条由多个并行 task 组成的流水线。这样一条流水线由多个连续的 task 组成，比如并行度为 n 的 MapFunction 和并行度为 n 的 ReduceFunction。需要注意的是 Flink 经常并发执行连续的 task，不仅在流式作业中到处都是，在批量作业中也很常见。

下图很好的阐释了这一点，一个由数据源、MapFunction 和 ReduceFunction 组成的 Flink 作业，其中数据源和 MapFunction 的并行度为 4 ，ReduceFunction 的并行度为 3 。流水线由一系列的 Source - Map - Reduce 组成，运行在 2 个 TaskManager 组成的集群上，每个 TaskManager 包含 3 个 slot，整个作业的运行如下图所示。

Flink 内部通过 SlotSharingGroup 和 CoLocationGroup 来定义哪些 task 可以共享一个 slot，哪些 task 必须严格放到同一个 slot。

本文参与腾讯云自媒体同步曝光计划，分享自作者个人站点/博客。原始发表：2023-03-11，如有侵权请联系 cloudcommunity@tencent 删除监控教程优化flink集群

作业调度

1.定义

2.设计思路：

作业提交：Flink作业调度的第一步是将作业提交到集群上，提交方式可以通过命令行、Web界面或API等实现。
作业分析：在作业提交后，Flink会对作业进行分析，包括作业的执行计划、算子的依赖关系、资源需求等信息。
作业优化：Flink会根据作业的执行计划和资源需求等信息对作业进行优化，例如合并相邻的算子、优化任务并行度等，以提高作业的执行效率。
任务调度：Flink会根据作业的执行计划和资源需求等信息对任务进行调度，以便作业可以在Flink集群中高效执行。
资源分配：Flink会为每个任务分配所需的资源，包括CPU、内存、网络带宽等，以保证作业能够高效地执行。
故障恢复：Flink会根据作业的故障恢复策略，在出现故障时对作业进行恢复，例如任务重启、恢复到指定的检查点等，以保证作业的可靠性。
作业监控：Flink会对作业进行监控，包括任务的执行状态、作业的运行时间、数据量等信息，以便用户可以及时了解作业的执行情况。总体而言，Flink作业调度的设计思路旨在提高作业的执行效率和可靠性，为Flink提供高性能、分布式的数据处理能力。

3.调度流程

Flink 内部通过 SlotSharingGroup 和 CoLocationGroup 来定义哪些 task 可以共享一个 slot，哪些 task 必须严格放到同一个 slot。

本文参与腾讯云自媒体同步曝光计划，分享自作者个人站点/博客。原始发表：2023-03-11，如有侵权请联系 cloudcommunity@tencent 删除监控教程优化flink集群

本文标签：作业调度

版权声明：本文标题：作业调度内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://it.en369.cn/jiaocheng/1747895456a2224175.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

369IT编程

作业调度

作业调度

1.定义

2.设计思路：

3.调度流程

作业调度

1.定义

2.设计思路：

3.调度流程

更多相关文章

作业调度

发表评论

推荐文章

用 Transformers + Diffusers 部署 AI 图像生成服务（含 Stable Diffusion 报错处理大全）

使用benchmarksql测试数据库处理能力

数学开窍最佳方法

基于图嵌入的推荐算法那些？

Quick start tutorials for 23 common design patterns

热门文章

Proxmox VE 8.4 显卡直通完整指南：NVIDIA 2080 Ti 实战

用 Ollama 打造你的本地 AI 小助手：LLaMAMistral 部署全流程

Windows 11 安装 SQLSERVER 出现问题解决

GLPI资产管理系统安装Fusioninventory插件发现Windows和Linux主机

5G网络安全全解析——新机遇与潜在风险

ArkUI

细胞凋亡的流式检测？实验步骤+结果解读，速戳！

分享一次关于RabbitMQ重复消费的故障

windows 安装 pygame（ pycharm）

使用最新的 Flutter SDK 3.22.1 构建 HarmonyOS 应用

最新文章

Java中的信号量semaphore

开源工作流引擎Flowable的面试题

Flowable面试题

Quick start tutorials for 23 common design patterns

CountDownLatch使用指南

程序员刚毕业，先去大厂镀金还是先去小厂攒经验？

万象2008清空boss账户密码

【Tools】GitBook简明教程

oracle exadata celldisk 闪存盘受损导致性能下降

SDUT 2138 图结构练习——BFSDFS——判断可达性

javascript - Type &#39;undefined&#39; is not assignable to type &#39;menuItemProps[]&#39; - Stack Overflow

javascript - VS 2015 Angular 2 import modules cannot be resolved - Stack Overflow

javascript - Get the JSON objects that are not present in another array - Stack Overflow

javascript - How to dismiss a phonegap notification programmatically - Stack Overflow

c - Solaris 10 make Error code 1 Fatal Error when trying to build python 2.7.16 - Stack Overflow

javascript - Type 'undefined' is not assignable to type 'menuItemProps[]' - Stack Overflow