Apache DolphinScheduler分布式工作流任务调度系统
Apache DolphinScheduler(Incubator, 原 Easy Scheduler) 是一个可视化的分布式大数据工作流任务调度系统,DolphinScheduler 致力于 “可视化操作工作流 (任务) 之间的依赖关系,并可视化监控整个数据处理过程”。DolphinScheduler 以有向无环图 (DAG) 的方式将任务组装起来,可实时监控任务的运行状态,同时支持重试、从指定节点恢复失败、暂停及 Kill 任务等操作。
DolphinScheduler 的起源 - 需求决定
大数据任务调度需要解决以下痛点,市面上难以找到满足需求的开源大数据调度,这是 DolphinScheduler 诞生的原因
DolphinScheduler 设计特点
一个分布式易扩展的可视化 DAG 工作流任务调度系统。致力于解决数据处理流程中错综复杂的依赖关系,使调度系统在数据处理流程中开箱即用。 其
主要目标如下
以 DAG 图的方式将 Task 按照任务的依赖关系关联起来,可实时可视化监控任务的运行状态
支持丰富的任务类型:Shell、MR、Spark、SQL (mysql、postgresql、hive、sparksql),Python,Sub_Process、Procedure 等
支持工作流定时调度、依赖调度、手动调度、手动暂停 / 停止 / 恢复,同时支持失败重试 / 告警、从指定节点恢复失败、Kill 任务等操作
支持工作流优先级、任务优先级及任务的故障转移及任务超时告警 / 失败
支持工作流全局参数及节点自定义参数设置
支持资源文件的在线上传 / 下载,管理等,支持在线文件创建、编辑
支持任务日志在线查看及滚动、在线下载日志等
实现集群 HA,通过 Zookeeper 实现 Master 集群和 Worker 集群去中心化
支持对 Master/Worker cpu load,memory,cpu 在线查看
支持工作流运行历史树形 / 甘特图展示、支持任务状态统计、流程状态统计
支持补数
支持多租户
支持国际化
-
Apache DolphinScheduler(工作流任务调度系统)
DolphinScheduler官方版是专业的可视化工作流任务调度系统。处理工作调度,有效解决数据处理流程中错综复杂的依赖关系,使调度系统在数据处理流程中开箱即用。支持多租户,更好的应对大数据的使用场
-
Apache DolphinScheduler如何部署?
1. 分布式易扩展的可视化工作流任务调度平台Apache DolphinScheduler是一个分布式去中心化,易扩展的可视化DAG工作流任务调度平台。致力于解决数据处理流程中错综复杂的依赖关系,使调
-
Apache DolphinScheduler和Apache Airflow任务调度系统对比
目前世界上最流行的两款任务调度系统是 Apache DolphinScheduler 和 Apache Airflow。什么是任务调度系统呢?它类似于平时工作与生活中使用的日程表,可以让某一类型的任务
关注公众号:拾黑(shiheibook)了解更多
赞助链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

随时掌握互联网精彩
- 【杂谈快报】抖音要收购饿了么?抖音相关负责人:没有这个计划;小米集团:三名前员工擅自参与外部“小米汽车研讨会”,已做辞退处理
- 英镑兑人民币2023年6月6日
- ChatGPT能取代多少程序员?| 行业洞察
- 前沿科技 | 混合现实(MR):数字化的未来
- 电脑报恭祝全国读者新春快乐!
- 泽布替尼击败伊布替尼,王者之争更有看头
- 中共中央 国务院印发《扩大内需战略规划纲要(2022-2035年)》
- 云逛展 | Microsoft Ignite 创新解决方案展馆,邀您来玩!
- nosql是什么?
- 西电、成电的风雨往事
- 解读腾讯安全MSS服务:三大硬核能力,让企业安全建设“化繁为简”
- 苏州创“芯”:在细分领域做大优势 在优势领域做强特色|强链补链在行动