网站首页 > 技术文章 正文
在上一期我们对datax进行了技术调研DataX数据异构、数据同步神器,这一次我们集成一个RocketMQ写插件,能够非常方便对将mysql数据同步到MQ中,下面来总结下具体步骤。
1.下载datax源码,下载地址:https://github.com/alibaba/DataX
2.按照已有插件的代码结构建立rocketmqwriter的代码目录如下:
package.xml:定义了插件具体的打包路径
<assembly
xmlns="http://maven.apache.org/plugins/maven-assembly-plugin/assembly/1.1.0"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://maven.apache.org/plugins/maven-assembly-plugin/assembly/1.1.0 http://maven.apache.org/xsd/assembly-1.1.0.xsd">
<id></id>
<formats>
<format>dir</format>
</formats>
<includeBaseDirectory>false</includeBaseDirectory>
<fileSets>
<fileSet>
<directory>src/main/resources</directory>
<includes>
<include>plugin.json</include>
</includes>
<outputDirectory>plugin/writer/ons-rocketmqwriter</outputDirectory>
</fileSet>
<fileSet>
<directory>target/</directory>
<includes>
<include>ons-rocketmqwriter-0.0.1-SNAPSHOT.jar</include>
</includes>
<outputDirectory>plugin/writer/ons-rocketmqwriter</outputDirectory>
</fileSet>
</fileSets>
<dependencySets>
<dependencySet>
<useProjectArtifact>false</useProjectArtifact>
<outputDirectory>plugin/writer/ons-rocketmqwriter/libs</outputDirectory>
<scope>runtime</scope>
</dependencySet>
</dependencySets>
</assembly>
- Key类:获取配置文件json传递的参数;
- MQColumn类:获取属性column[]的值;
- MQFieldType类:获取属性column[]值的类型;
- MQWriterErrorCode类:定义MQ解析过程中的异常错误码;
- ONS_RocketMQWriter类:核心实现,数据解析以及MQ消息统一推送。
plugin.json:配置插件统一扫描文件实现类,即扫描ONS_RocketMQWriter类,配置如下:
{
"name": "ons-rocketmqwriter",
"class": "com.alibaba.datax.plugin.writer.ons_rocketmqwriter.ONS_RocketMQWriter",
"description": "适用于: 阿里云版RocketMQ",
"developer": "wenqi"
}
完成以上步骤,还需要修改Datax主工程配置文件package.xml,添加rocketmqwriter模块,代码如下:
<fileSet>
<directory>ons-rocketmqwriter/target/datax/</directory>
<includes>
<include>**/*.*</include>
</includes>
<outputDirectory>datax</outputDirectory>
</fileSet>
3.插件代码完成后,本地调试的话,需要修改core包下的Engine类,1)设置运行的datax的home目录;2)设置datax的运行脚本信息。截图如下:
4.本地调试完成后进行maven打包,在idea的terminal中执行 mvn -U clean package assembly:assembly -Dmaven.test.skip=true
5.编写json文件,mysql-mq.json
{
"job": {
"setting": {
"speed": {
"channel": 1,
"record": -1,
"byte": -1
}
},
"content": [{
"reader": {
"name": "mysqlreader",
"parameter": {
"username": "root",
"password": "******",
"connection": [
{
"querySql": [
"select id from table where id<7506000;"
],
"jdbcUrl": [
"jdbc:mysql://pc-xxx.rwlb.rds.aliyuncs.com:3306/db"
]
}
]
}
},
"writer": {
"name": "ons-rocketmqwriter",
"parameter": {
"nameServer": "http://xxx.mq-internet.aliyuncs.com:80",
"accessKey": "xxxxxx",
"secretKey": "xxxxxx",
"topic": "topic_name",
"tags": "*",
"batchSize":1000,
"column": [
{"name": "tableId", "type": "string"}
]
}
}
}]
}
}
6.执行脚本命令便可以完成mysql数据按照规则同步给RocketMQ了
bin/datax.py job/mysql-mq.json
不断分享开发过程用到的技术和面试经常被问到的问题,如果您也对IT技术比较感兴趣可以「关注」我
猜你喜欢
- 2025-01-09 精通Spring Boot 3 : 13. Spring Cloud 与 Spring Boot (4)
- 2025-01-09 Spring Boot集成Redis Search快速入门Demo
- 2025-01-09 Spring Boot 3.x嵌入MongoDB 进行测试
- 2025-01-09 java安全之fastjson链分析
- 2025-01-09 MyBatis初级实战之五:一对一关联查询
- 2025-01-09 精通Spring Boot 3 : 8. Spring Boot 测试 (2)
- 2025-01-09 DevSecOps 管道: 使用Jenkins实现安全的多语言应用程序
- 2025-01-09 Liquibase+Spring+Maven: 管理数据库轻松搞定
- 2025-01-09 比较一下JSON与XML两种数据格式?
- 2025-01-09 Java批量导入时,如何去除重复数据并返回结果?
- 02-21走进git时代, 你该怎么玩?_gits
- 02-21GitHub是什么?它可不仅仅是云中的Git版本控制器
- 02-21Git常用操作总结_git基本用法
- 02-21为什么互联网巨头使用Git而放弃SVN?(含核心命令与原理)
- 02-21Git 高级用法,喜欢就拿去用_git基本用法
- 02-21Git常用命令和Git团队使用规范指南
- 02-21总结几个常用的Git命令的使用方法
- 02-21Git工作原理和常用指令_git原理详解
- 最近发表
- 标签列表
-
- cmd/c (57)
- c++中::是什么意思 (57)
- sqlset (59)
- ps可以打开pdf格式吗 (58)
- phprequire_once (61)
- localstorage.removeitem (74)
- routermode (59)
- vector线程安全吗 (70)
- & (66)
- java (73)
- org.redisson (64)
- log.warn (60)
- cannotinstantiatethetype (62)
- js数组插入 (83)
- resttemplateokhttp (59)
- gormwherein (64)
- linux删除一个文件夹 (65)
- mac安装java (72)
- reader.onload (61)
- outofmemoryerror是什么意思 (64)
- flask文件上传 (63)
- eacces (67)
- 查看mysql是否启动 (70)
- java是值传递还是引用传递 (58)
- 无效的列索引 (74)