Skip to content

Commit fb1cb04

Browse files
committed
add powerjob
1 parent 8c2d6b6 commit fb1cb04

File tree

13 files changed

+264
-0
lines changed

13 files changed

+264
-0
lines changed

README.md

+1
Original file line numberDiff line numberDiff line change
@@ -29,6 +29,7 @@
2929
6. [有了这个开源 Java 项目,开发出炫酷的小游戏好像不难?](contents/Java/FXGLGames/content.md)
3030
7. [躁!DJ 风格 Java 桌面音乐播放器](contents/Java/XR3Player/content.md)
3131
8. [和付费网盘说再见,跟着本文自己起个网盘](contents/Java/netdisc/content.md)
32+
9. [分布式任务调度平台 PowerJob](contents/Java/PowerJob/catalog.md)
3233

3334

3435
#### JS 系列

contents/Java/PowerJob/1/1.png

18.3 KB
Loading

contents/Java/PowerJob/1/content.md

+106
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,106 @@
1+
# PowerJob 的故事开篇:“玩够了,才有激情做开源啊!”
2+
3+
> 本文适合有 Java 基础知识的人群
4+
5+
![](../cover.png)
6+
7+
作者:HelloGitHub-**Salieri**
8+
9+
HelloGitHub 推出的[《讲解开源项目》](https://github.com/HelloGitHub-Team/Article)系列。
10+
11+
经过几番的努力和沟通,终于邀请到分布式任务调度与计算框架:PowerJob 的作者 Salieri,加入 HG 的开源讲解系列,开启了他的 PowerJob 讲解系列 🎉。**后续每周三将更新一篇,希望你能从本系列中学到有用的知识提高自己的技术水平。**
12+
> 项目地址:
13+
>
14+
> https://github.com/KFCFans/PowerJob
15+
16+
## 一、起因
17+
18+
大家好我是 PowerJob 的作者 Salieri,关于 PowerJob 故事要从一年前说起了。
19+
20+
一年前,我前往阿里巴巴集团,开启了自己的暑期实习。机缘巧合的是,我接到的第一个正式的开发类任务,就与分布式任务调度与计算紧密相关。
21+
22+
当时,集团内部研发出了一款全新的任务调度中间件(SchedulerX 2.0,也就是 README 中提到的本框架的参考对象),需要从老版本的 DTS 迁移到 SchedulerX 2.0。而这个光荣而伟大的任务,自然也被师兄委派到了我身上。也从那时候开始我开始正式接触并使用这种分布式任务调度与计算中间件。
23+
24+
迁移完毕后很长一段时间内,算是我和 SchedulerX 的蜜月期,不得不说 SchedulerX 的设计理念极其先进,比如通过控制台或 OpenAPI 动态传递运行时参数能让传统的任务变得非常灵活,无需更改代码即可实现不同的功能,再比如 MapReduce 处理器的存在使得开发者只需要寥寥数行代码就能实现分布式计算,解决大量数据的处理需求。然而好景不长,在即将迎来双十一之际,发生了两个比较悲伤的故事。
25+
26+
双十一临近,由于需要处理的数据量激增,之前在 SchedulerX 上运行完美的离线任务开始频频失败,整个双十一前夕报警电话的频率甚至能超过微信提醒的频率(好吧有一部分原因是没人找我 T_T)。经过与相关开发人员的一通排查,初步断定问题的原因在于我们的应用内存占用过高,导致 SchedulerX 没有足够的内存去完成必要的任务,进而导致任务失败。这个锅,SchedulerX 显然是不背的,也很合理,不符合最低运行要求嘛,就好比你买一台 Macbook Air 装个 Windows 准备玩 PUBG 结果发现连欢迎界面都看不到,你能说什么呢?人家最低运行要求写的明明白白,达不到配置要求无法运行只能怪你自己,你能做的只有接受。最后实在没办法,只能拆东墙补西墙勉勉强强撑过了双十一。
27+
28+
另一件事是限流。为了监控任务的运行状态,我在另一个应用单独写了轮询查询 SchedulerX 任务运行状态的逻辑,该功能一直四平八稳地运行着。直到某一天,我完成一个微小改动的发布后,本着安全生产的原则,登上在线日志平台查看应用的运行时日志。不看不知道一看吓一跳,满屏幕的 RuntimeException 甚至让我怀疑我是不是不小心删掉了某个模块,还是不小心把数据库删了,还是不小心发布错代码分支了。慌乱过后冷静下来看异常信息,才发现一直以来我调用的 SchedulerX 提供的查看任务运行状态接口报错了,被限流了。理由是双十一保障。嗯,因为需要保障双十一稳定性所以先弄挂一个虽然不在双十一圈内但好歹站在边上的应用。沟通无果,只能一顿魔改代码,自己去实现任务的状态监控。
29+
30+
其实这两件事情呢,SchedulerX 团队确实没有什么问题。毕竟服务于整个集团所有业务线,不做一些限制任由大家肆无忌惮使用是不可能的。但是中台模式下,某些个体的需求无法得到满足也是确实存在的现象。对于大部分接入用户来说,只需要依赖个 Jar 包,写点代码,去控制台一配置,任务就能跑起来,使用体验极好。毕竟,并不是所有用户都有我们这种动辄几百万子任务的变态需求......
31+
32+
双十一过后,实习期满,我也就从阿里离职回家,开启混吃等死模式,每天不是在打游戏就是在想怎么打游戏,对了,还有告诉自己明天一定要好好学习。
33+
34+
浑浑噩噩过了 N 个月后,终于想起还有毕业论文这事。没办法,为了卑微的学位,我只能暂时金盆洗手,投入到论文的撰写之中去。写完论文,疫情差不多结束了,一起“送人头”的小伙伴都差不多上班去了,构成我充满打游戏欲望的条件(人数==5)被破坏,我也就彻底闲了下来。重拾自己的传统艺能——Reading。
35+
36+
在看了很多本奇奇怪怪的书(甚至包括一本言情小说)以后,终于想起了以前一直想做但是一直被慵懒的自己所搁置的事情:自研一个 SchedulerX,万一哪天 SchedulerX 满足不了需求,至少还能自己就自己抢救一下~于是,OhMyScheduler 诞生了~(没错,一开始叫 OhMyScheduler,后面改名为 **PowerJob**
37+
38+
![](1.png)
39+
40+
## 二、介绍
41+
42+
实在是没事儿干了,也是时候扛起是“新一代分布式任务调度与计算框架”的大旗了(当然要走的路还很长),废话不多说接下来开始正文。
43+
44+
### 2.1 任务调度框架
45+
46+
定时任务相信大家都接触过,比如经典的 Linux crontab。定时调度、定时执行已经渐渐成为了各个系统普遍需要依赖的中间系统。在 Java 领域,也出现了许多优秀的任务调度框架。
47+
48+
当前市面上流行的作业调度框架有老牌的 Quartz、基于 Quartz 的 elastic-job 和原先基于 Quartz 后面移除依赖的 xxl-job,这里分别谈一些这些框架现存的缺点。
49+
50+
Quartz 可以视为第一代任务调度框架,基本上是现有所有分布式调度框架的“祖宗”。由于历史原因,它不提供Web界面,只能通过API完成任务的配置,使用起来不够方便和灵活,同时它仅支持任务的单机执行,无法有效利用整个集群的计算能力。 同时,Quartz 需要的调度和执行耦合在同一个应用中,没有平台化服务的能力。
51+
52+
xxl-job 可以视为第二代任务调度框架,在一定程度上解决了 Quartz 的不足,在过去几年中是个非常优秀的调度框架,不过放到今天来看,还是存在着一些不足的,具体如下:
53+
54+
- 数据库支持单一:仅支持 MySQL,使用其他DB需要自己魔改代码
55+
- 有限的分布式计算能力:仅支持静态分片,无法很好的完成复杂任务的计算
56+
- 不支持工作流:无法配置各个任务之间的依赖关系,不适用于任务之间存在复杂依赖的场景
57+
58+
正所谓长江后浪推前浪,在如今这个数据量日益增长、业务越来越复杂的年代,急需一款更为强大的任务调度框架来解决上诉问题,而 PowerJob 因此应运而生。
59+
60+
### 2.2 PowerJob 闪亮登场
61+
62+
PowerJob 可以被认为是第三代任务调度框架,在任务调度的基础上,还额外提供了分布式计算和工作流功能,其主要特性如下:
63+
64+
- 使用简单:提供 Web 界面,允许开发者可视化地完成调度任务的管理(增、删、改、查)、任务运行状态监控和运行日志查看等功能。
65+
- 定时策略完善:支持 CRON 表达式、固定频率、固定延迟和API四种定时调度策略。
66+
- 执行模式丰富:支持单机、广播、Map、MapReduce 四种执行模式,其中 Map/MapReduce 处理器能使开发者寥寥数行代码便获得集群分布式计算的能力。
67+
- 工作流(workflow)支持:支持在线配置任务依赖关系,可视化得对任务进行编排,同时还支持上下游任务间的数据传递
68+
- 执行器支持广泛:支持 Spring Bean、内置/外置 Java 类、Shell、Python 等处理器,应用范围广。
69+
- 运维便捷:支持在线日志功能,执行器产生的日志可以在前端控制台页面实时显示,降低 debug 成本,极大地提高开发效率。
70+
- 依赖精简:最小仅依赖关系型数据库(MySQL/PostgreSQL/Oracle/MS SQLServer 等),同时支持所有 Spring Data JPA 所支持的关系型数据库。
71+
- 高可用&高性能:调度服务器经过精心设计,一改其他调度框架基于数据库锁的策略,实现了无锁化调度。部署多个调度服务器可以同时实现高可用和性能的提升(支持无限的水平扩展)。
72+
- 故障转移与恢复:任务执行失败后,可根据配置的重试策略完成重试,只要执行器集群有足够的计算节点,任务就能顺利完成。
73+
74+
### 2.3 PowerJob 适用场景
75+
76+
综上所述,PowerJob 是全新一代分布式调度与计算框架,能让您轻松完成任务的调度与繁杂任务的分布式计算。适用于各个有任务调度需求的企业,统一部署 Server 做为整个公司的公共调度平台,成为分布式调度的中间件。
77+
78+
- 有定时执行需求的业务场景:如每天凌晨全量同步数据、生成业务报表等。
79+
- 有需要全部机器一同执行的业务场景:如使用广播执行模式清理集群日志。
80+
- 有需要分布式处理的业务场景:比如需要更新一大批数据,单机执行耗时非常长,可以使用 Map/MapReduce 处理器完成任务的分发,调动整个集群加速计算。
81+
82+
## 三、大纲
83+
84+
后面会逐步**从上手使用讲到核心技术剖析**,希望大家可以持续关注,从中有所收获,同时欢迎小伙伴们可以贡献代码哦!大纲太长了(10+篇)所以下面只简单罗列了一部分:
85+
86+
- 快速上手
87+
- PowerJob 技术综述
88+
- 技术剖析:Akka 框架
89+
- Actor模型
90+
- Akka-remote 简化通讯代码
91+
- Akka API 介绍
92+
- 技术剖析:任务的调度与派发
93+
- 时间轮算法
94+
- 调度层:OmsSchedulerService
95+
- 派发层:DispatchService
96+
- 技术剖析:Spring AOP 技术的应用
97+
- 拦截
98+
- exclude
99+
- 等等
100+
101+
102+
## 四、总结与预告
103+
104+
本章主要阐述了 PowerJob 诞生的故事,同时简单介绍了 PowerJob 这个框架的功能和适用场景,本系列的大纲。下一章节,我将会介绍 PowerJob 的快速入门,帮助大家快速熟悉并使用这款强大的分布式任务调度与计算框架。
105+
106+
那我们下期再见喽~

contents/Java/PowerJob/2/1.png

111 KB
Loading

contents/Java/PowerJob/2/2.png

722 KB
Loading

contents/Java/PowerJob/2/3.png

188 KB
Loading

contents/Java/PowerJob/2/4.png

90 KB
Loading

contents/Java/PowerJob/2/5.png

212 KB
Loading

contents/Java/PowerJob/2/6.png

211 KB
Loading

contents/Java/PowerJob/2/content.md

+151
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,151 @@
1+
## Java 分布式任务调度平台:PowerJob 快速开始+配置详解
2+
> 本文适合有 Java 基础知识的人群
3+
4+
![](../cover.png)
5+
6+
作者:HelloGitHub-**Salieri**
7+
8+
## 引言
9+
10+
HelloGitHub 推出的[《讲解开源项目》](https://github.com/HelloGitHub-Team/Article)系列。
11+
12+
> 项目地址:
13+
>
14+
> https://github.com/KFCFans/PowerJob
15+
16+
PowerJob 的设计目标为企业级的分布式任务调度平台,即成为公司内部的调度中间件。整个公司统一部署调度中心 powerjob-server,旗下所有业务线应用只需要依赖 'powerjob-worker' 即可接入获取任务调度与分布式计算能力。
17+
18+
因此,PowerJob 由调度服务器(powerjob-server)和执行器(powerjob-worker)两部分组成,powerjob-server 负责提供 Web 服务和完成任务的调度,powerjob-worker 则负责执行用户所编写的任务代码,同时提供分布式计算能力。
19+
20+
以下为在本地开发环境快速搭建并试用 PowerJob 的教程。
21+
22+
## 一、STEP1: 初始化项目
23+
24+
1. `git clone https://github.com/KFCFans/PowerJob.git`
25+
2. 导入 IDE,源码结构如下,我们需要启动调度服务器(powerjob-server),同时在 samples 工程中编写自己的处理器代码
26+
![](1.png)
27+
28+
29+
30+
## 二、STEP2: 启动调度服务器
31+
1. 创建数据库(不需要建表,只需要创建数据库)powerjob-daily
32+
33+
2. 修改配置文件,配置文件的说明[官方文档](https://www.yuque.com/ohmyscheduler/guidence/bdvp1u#4DTFD)写的非常详细,此处不再赘述。由于是在本地 IDE 搭建测试环境,因此我们选择使用开发环境的配置文件 `application-daily.properties` 来修改并使用。需要修改的地方为数据库配置:
34+
- `spring.datasource.core.jdbc-url`
35+
- `spring.datasource.core.username`
36+
- `spring.datasource.core.password`
37+
- 当然,有 mongoDB 的同学也可以修改 `spring.data.mongodb.uri` 以获取完全版体验。
38+
39+
3. 完成配置文件的修改后,可以直接通过启动类 `OhMyApplication` 启动调度服务器,观察启动日志,查看是否启动成功~启动成功后,访问 http://127.0.0.1:7700/ ,如果能顺利出现 Web 界面,则说明调度服务器启动成功!
40+
41+
4. 注册应用:点击主页**应用注册**按钮,填入 `oms-test` 和控制台密码(用于进入控制台),注册示例应用(当然你也可以注册其他的 appName,只是别忘记在示例程序中同步修改~)
42+
![](2.png)
43+
44+
## 三、STEP3: 编写示例代码
45+
46+
> 进入示例工程(powerjob-worker-samples),修改配置文件连接 powerjob-server 并编写自己的处理器代码。
47+
48+
1. 修改 powerjob-worker-samples 的启动配置类 `OhMySchedulerConfig`**`appName` 修改为刚刚在控制台注册的名称**
49+
50+
2. 编写自己的处理器:在示例工程中新建一个类,继承你想要使用的处理器(各个处理器的介绍可见[官方文档](https://www.yuque.com/ohmyscheduler/guidence/hczm7m)),这里为了简单演示,选择使用单机处理器 `BasicProcessor` ,以下代码示例演示了在线日志功能的使用。
51+
```java
52+
@Slf4j
53+
@Component
54+
public class StandaloneProcessorDemo implements BasicProcessor {
55+
56+
@Override
57+
public ProcessResult process(TaskContext context) throws Exception {
58+
59+
OmsLogger omsLogger = context.getOmsLogger();
60+
omsLogger.info("start process,context is {}.", context);
61+
System.out.println("jobParams is " + context.getJobParams());
62+
63+
return new ProcessResult(true, "process successfully~");
64+
}
65+
}
66+
```
67+
68+
3. 启动示例程序,即直接运行主类 `SampleApplication`,观察控制台输出信息,判断是否启动成功。
69+
70+
## 四、STEP4: 任务的配置与运行
71+
72+
调度服务器与示例工程都启动完毕后,再次前往 Web 页面( http://127.0.0.1:7700/ ),进行任务的配置与运行。
73+
74+
1. 在首页输入框输入配置的应用名称,成功操作后会正式进入前端管理界面。
75+
![](3.png)
76+
77+
2. 点击任务管理 -> 新建任务(右上角),开始创建任务。
78+
![](4.png)
79+
80+
3. 完成任务创建后,即可在控制台看到刚才创建的任务,如果觉得等待调度太过于漫长,可以直接点击**运行**按钮,立即运行本任务。
81+
![](5.png)
82+
83+
4. 前往**任务示例**边栏,查看任务的运行状态和在线日志
84+
![](6.png)
85+
86+
87+
### 4.1 基本配置
88+
- 任务名称:名称
89+
- 任务描述:描述
90+
- 任务参数:任务处理时能够获取到的参数(即各个 Processor的process 方法入参 `TaskContext` 对象的 jobParams 属性)(进行一次处理器开发就能理解了)
91+
- 定时信息:该任务的触发方式,由下拉框和输入框组成
92+
- API -> 不需要填写任何参数,表明该任务由 OpenAPI 触发
93+
- CRON -> 填写 CRON 表达式([在线生成网站](https://cron.qqe2.com/))
94+
- 固定频率 -> 填写整数,单位**毫秒**
95+
- 固定延迟 -> 填写整数,单位**毫秒**
96+
- 工作流 -> 不需要填写任何参数,表明该任务由工作流(workflow)触发
97+
98+
### 4.2 执行配置
99+
由执行类型(单机、广播和 MapReduce)、处理器类型和处理器参数组成,后两项相互关联。
100+
101+
- 内置 Java 处理器 -> 填写该处理器的**全限定类名**(eg,`com.github.kfcfans.oms.processors.demo.MapReduceProcessorDemo`)
102+
- Java(容器) -> 填写**容器ID#处理器全限定类名**(eg,`18#com.github.kfcfans.oms.container.DemoProcessor`)
103+
- SHELL -> 填写需要处理的脚本(直接复制文件内容)或脚本下载链接(http://xxx)
104+
- PYTHON -> 填写完整的 python 脚本或下载链接(http://xxx)
105+
106+
### 4.3 运行配置
107+
- 最大实例数:该任务同时执行的数量
108+
- 单机线程并发数:该实例执行过程中每个 Worker 使用的线程数量(MapReduce 任务生效,其余无论填什么,都只会使用必要的线程数...
109+
- 运行时间限制:限定任务的最大运行时间,超时则视为失败,单位**毫秒**0 代表不限制超时时间(**不建议不限制超时时间**)。
110+
111+
### 4.4 重试配置
112+
113+
- Instance 重试次数:实例级别,失败了整个任务实例重试,会更换 TaskTracker(本次任务实例的Master节点),代价较大,大型 Map/MapReduce 慎用。
114+
- Task重试次数:Task 级别,每个子 Task 失败后单独重试,会更换 ProcessorTracker(本次任务实际执行的 Worker 节点),代价较小,推荐使用。
115+
- 注:**请注意同时配置任务重试次数和子任务重试次数之后的重试放大**,比如对于单机任务来说,假如任务重试次数和子任务重试次数都配置了 1 且都执行失败,实际执行次数会变成 4 次!推荐任务实例重试配置为 0,子任务重试次数根据实际情况配置。
116+
117+
### 4.5 机器配置
118+
用来标明允许执行任务的机器状态,避开那些摇摇欲坠的机器,0 代表无任何限制。
119+
120+
- 最低 CPU 核心数:填写浮点数,CPU 可用核心数小于该值的 Worker 将不会执行该任务。
121+
- 最低内存(GB):填写浮点数,可用内存小于该值的 Worker 将不会执行该任务。
122+
- 最低磁盘(GB):填写浮点数,可用磁盘空间小于该值的 Worker 将不会执行该任务。
123+
124+
### 4.6 集群配置
125+
126+
- 执行机器地址:指定集群中的某几台机器执行任务(debug 的好帮手),多值英文逗号分割,如`192.168.1.1:27777,192.168.1.2:27777`
127+
- 最大执行机器数量:限定调动执行的机器数量
128+
129+
### 4.7 报警配置
130+
选择任务执行失败后报警通知的对象,需要事先录入。
131+
132+
133+
基础的教程到这里也就结束了~更多功能示例可见[官方文档](https://www.yuque.com/ohmyscheduler/guidence/ysug77),工作流、MapReduce、容器等高级特性等你来探索!
134+
135+
## 五、总结与预告
136+
137+
本章详细介绍了 PowerJob 的快速入门,根据本文能够快速搭建起本地开发/测试环境。下一章节,我将会对PowerJob 整体的架构做一个介绍,为后面的技术剖析做准备。
138+
139+
那我们下期再见喽~
140+
141+
## 作者游记
142+
143+
![](last.jpeg)
144+
145+
“常在河边走,哪有不湿鞋”,然而,这句话在茶卡盐湖却属于奢望。
146+
147+
稍有不慎,隐秘的盐窟便对你敞开怀抱,瞬间将你吞噬~
148+
149+
盐湖如此,人生亦是如此。
150+
151+
难免不幸时,也要对着美好的明天微笑~

contents/Java/PowerJob/2/last.jpeg

658 KB
Loading

contents/Java/PowerJob/catalog.md

+6
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,6 @@
1+
# 分布式任务调度平台 PowerJob
2+
3+
![](cover.png)
4+
5+
- 1、[PowerJob 的故事开篇:“玩够了,才有激情做开源啊!”](1/content.md)
6+
- 2、[Java 分布式任务调度平台:PowerJob 快速开始+配置详解](2/content.md)

contents/Java/PowerJob/cover.png

1.47 MB
Loading

0 commit comments

Comments
 (0)