作业中目的连接为时,即导入数据到华为云OBS时,目的端作业参数如所示。
高级属性里的参数为可选参数,默认隐藏,单击界面上的“显示高级属性”后显示。
写入数据的OBS桶名。 |
写入数据到OBS服务器的目录,目录前面不加“/”。 该参数支持配置为时间宏变量,且一个路径名中可以有多个宏定义变量。使用时间宏变量和定时任务配合,可以实现定期同步新增数据,详细说明请参见。 |
写入后的文件格式,可选择以下文件格式:
如果是文件类数据源(FTP/SFTP/NAS/HDFS/OBS)之间相互迁移数据,此处的“文件格式”只能选择与源端的文件格式一致。 |
只有文件名和文件大小都相同才会判定为重复文件。写入时如果出现文件重复,可选择如下处理方式: |
选择是否对上传的数据进行KMS(Key Management Service,密钥管理服务)加密。如果启用KMS加密则无法进行数据的MD5校验,具体请参见。 |
上传时加密使用的密钥。需先在密钥管理服务中创建密钥,这里才能选择。 |
“文件格式”为“二进制”,且源端、目的端都为对象存储时,才有该参数。 选择“是”后,迁移对象文件时会复制源文件的Content-Type属性,主要用于静态网站的迁移场景。 归档存储的桶不支持设置Content-Type属性,所以如果开启了该参数,目的端选择写入的桶时,必须选择非归档存储的桶。 |
文件中的换行符,默认自动识别“\n”、“\r”或“\r\n”。“文件格式”为“二进制格式”时该参数值无效。 |
文件中的字段分隔符。“文件格式”为“二进制格式”时该参数值无效。 |
源端为数据库时该参数才显示,支持按大小分成多个文件存储,避免导出的文件过大,单位为MB。 |
使用“二进制格式”传输文件时,才能校验MD5值。选择校验MD5值时,无法使用KMS加密。 计算源文件的MD5值,并与OBS返回的MD5值进行校验。如果源端已经存在MD5文件,则直接读取源端的MD5文件与OBS返回的MD5值进行校验,具体请参见。 |
当选择校验MD5值时,可以选择是否记录校验结果。 |
可以指定任意一个OBS连接,将MD5校验结果写入该连接的桶下。 |
写入MD5校验结果的OBS桶。 |
写入MD5校验结果的目录。 |
文件编码类型,例如:“UTF-8”或“GBK”。“文件格式”为“二进制格式”时该参数值无效。 |
“文件格式”为“CSV格式”,才有该参数,用于将数据库的表迁移到文件系统的场景。 选择“是”时,如果源端数据表中的某一个字段内容包含字段分隔符或换行符,写入目的端时CDM会使用双引号(")作为包围符将该字段内容括起来,作为一个整体存储,避免其中的字段分隔符误将一个字段分隔成两个,或者换行符误将字段换行。例如:数据库中某字段为hello,world,使用包围符后,导出到CSV文件的时候数据为"hello,world"。 |
当作业执行成功时,会在写入目录下生成一个标识文件,文件名由用户指定。不指定时默认关闭该功能。 |
作业中目的连接为时,即导入数据到以下数据源时,目的端作业参数如所示。
写入数据到HDFS服务器的目录。 该参数支持配置为时间宏变量,且一个路径名中可以有多个宏定义变量。使用时间宏变量和定时任务配合,可以实现定期同步新增数据,详细说明请参见。 |
写入后的文件格式,可选择以下文件格式:
如果是文件类数据源(FTP/SFTP/NAS/HDFS/OBS)之间相互迁移数据,此处的“文件格式”只能选择与源端的文件格式一致。 |
只有文件名和文件大小都相同才会判定为重复文件。写入时如果出现文件重复,可选择如下处理方式: |
写入文件后,选择对文件的压缩格式。支持以下压缩格式:
|
文件中的换行符,默认自动识别“\n”、“\r”或“\r\n”。“文件格式”为“二进制格式”时该参数值无效。 |
文件中的字段分隔符。“文件格式”为“二进制格式”时该参数值无效。 |
HDFS文件编码只能为“UTF-8”,故HDFS不支持设置文件编码类型。
版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。