2012-07-05
http://abloz.com date:2012.7.5 update:2012.8.8
rsync是一个很好用远程同步工具。相较scp而言,在Hadoop类似的分布式部署中,rsync更加强大好用。
示例,同步hbase-env.sh配置。
[zhouhh@Hadoop48 ~]$ cd hbase-0.94.0/conf
[zhouhh@Hadoop48 conf]$ vi hbase-env.sh
#将HBase缺省内存改为4G
# The maximum amount of heap to use, in MB. Default is 1000.
export HBASE_HEAPSIZE=4000
同步到Hadoop46,47,-v参数可以看到详细情况:
[zhouhh@Hadoop48 conf]$ rsync -v hbase-env.sh Hadoop46:~/hbase-0.94.0/conf/.
[zhouhh@Hadoop48 conf]$ rsync -v hbase-env.sh Hadoop47:~/hbase-0.94.0/conf/.
还可以同步目录
[zhouhh@Hadoop48 conf]$ rsync -ave ssh ./ Hadoop46:~/hbase-0.94.0/conf/.
building file list ... done
./
hadoop-metrics.properties
hbase-env.sh
hbase-policy.xml
hbase-site.xml
log4j.properties
regionservers
sent 563 bytes received 284 bytes 1694.00 bytes/sec
total size is 12833 speedup is 15.15
可以指定协议和端口。如指定ssh协议的50022端口.-a 参数表示归档文件archive:
rsync -av -e 'ssh -p 50022' hbase-env.sh Hadoop47:~/hbase-0.94.0/conf/.
同步目录,注意尾部的“/”。源目录尾部不加”/”,会在目标中创建源的目录。源目录尾部加“/”,则复制的是源目录中的内容,不会在目标中创建相应目录
[zhouhh@Hadoop48 ~]$ rsync -uavz ./hbase-0.94.0 h185:~/
-u: update,没变的文件不更新。 -a: archive,相当于-rlptgoD -z:压缩 该命令相当于将hbase-0.94.0整个目录都移到h185的zhouhh目录下。 相当于
[zhouhh@Hadoop48 ~]$ rsync -uavz ./hbase-0.94.0/ h185:~/hbase-0.94.0/
包含和布包含多个目录或文件: –include, –exclude 如果从远端同步到本地,还可以用 rsync -av host:’dir1/file1 dir2/file2’ /dest
写成make脚本Makefile,同步test目录
[zhouhh@h185 test]$ vi Makefile
get:
rsync -avuzb --exclude '*~' Hadoop48:~/test/ .
put:
rsync -Cavuzb ./ Hadoop48:~/test/
sync: get put
[zhouhh@h185 test]$ make get
rsync -avuzb --exclude '*~' Hadoop48:~/test/ .
...
sent 654 bytes received 25839 bytes 5887.33 bytes/sec
total size is 85601 speedup is 3.23
-C 表示不同步cvs获取文件时的做法。会忽略一些cvs自动生成的文件,适合做cvs目录同步备份。
相关参数说明,也可以用man获得:
客户端同步命令
v, –verbose 详细模式输出
-q, –quiet 精简输出模式
-c, –checksum 打开校验开关,强制对文件传输进行校验
-a, –archive 归档模式,表示以递归方式传输文件,并保持所有文件属性,等于-rlptgoD
-r, –recursive 对子目录以递归模式处理
-R, –relative 使用相对路径信息
rsync foo/bar/foo.c remote:/tmp/
则在/tmp目录下创建foo.c文件,而如果使用-R参数:
rsync -R foo/bar/foo.c remote:/tmp/
则会创建文件/tmp/foo/bar/foo.c,也就是会保持完全路径信息。
-b, –backup 创建备份,也就是对于目的已经存在有同样的文件名时,将老的文件重新命名为~filename。可以使用–suffix选项来指定不同的备份文件前缀。
–backup-dir 将备份文件(如~filename)存放在在目录下。
-suffix=SUFFIX 定义备份文件前缀
-u, –update 仅仅进行更新,也就是跳过所有已经存在于DST,并且文件时间晚于要备份的文件。(不覆盖更新的文件)
-l, –links 保留软链结
-L, –copy-links 想对待常规文件一样处理软链结
–copy-unsafe-links 仅仅拷贝指向SRC路径目录树以外的链结
–safe-links 忽略指向SRC路径目录树以外的链结
-H, –hard-links 保留硬链结
-p, –perms 保持文件权限
-o, –owner 保持文件属主信息
-g, –group 保持文件属组信息
-D, –devices 保持设备文件信息
-t, –times 保持文件时间信息
-S, –sparse 对稀疏文件进行特殊处理以节省DST的空间
-n, –dry-run现实哪些文件将被传输
-W, –whole-file 拷贝文件,不进行增量检测
-x, –one-file-system 不要跨越文件系统边界
-B, –block-size=SIZE 检验算法使用的块尺寸,默认是700字节
-e, –rsh=COMMAND 指定替代rsh的shell程序
–rsync-path=PATH 指定远程服务器上的rsync命令所在路径信息
-C, –cvs-exclude 使用和CVS一样的方法自动忽略文件,用来排除那些不希望传输的文件
–existing 仅仅更新那些已经存在于DST的文件,而不备份那些新创建的文件
–delete 删除那些DST中SRC没有的文件
–delete-excluded 同样删除接收端那些被该选项指定排除的文件
–delete-after 传输结束以后再删除
–ignore-errors 及时出现IO错误也进行删除
–max-delete=NUM 最多删除NUM个文件
–partial 保留那些因故没有完全传输的文件,以是加快随后的再次传输
–force 强制删除目录,即使不为空
–numeric-ids 不将数字的用户和组ID匹配为用户名和组名
–timeout=TIME IP超时时间,单位为秒
-I, –ignore-times 不跳过那些有同样的时间和长度的文件
–size-only 当决定是否要备份文件时,仅仅察看文件大小而不考虑文件时间
–modify-window=NUM 决定文件是否时间相同时使用的时间戳窗口,默认为0
-T –temp-dir=DIR 在DIR中创建临时文件
–compare-dest=DIR 同样比较DIR中的文件来决定是否需要备份
-P 等同于 –partial
–progress 显示备份过程
-z, –compress 对备份的文件在传输时进行压缩处理
–exclude=PATTERN 指定排除不需要传输的文件模式
–include=PATTERN 指定不排除而需要传输的文件模式
–exclude-from=FILE 排除FILE中指定模式的文件
–include-from=FILE 不排除FILE指定模式匹配的文件
–version 打印版本信息
–address 绑定到特定的地址
–config=FILE 指定其他的配置文件,不使用默认的rsyncd.conf文件
–port=PORT 指定其他的rsync服务端口
–blocking-io 对远程shell使用阻塞IO
-stats 给出某些文件的传输状态
–progress 在传输时现实传输过程
–log-format=formAT 指定日志文件格式
–password-file=FILE 从FILE中得到密码
–bwlimit=KBPS 限制I/O带宽,KBytes per second
-h, –help 显示帮助信息
如非注明转载, 均为原创. 本站遵循知识共享CC协议,转载请注明来源
FEATURED TAGS
css
vc6
http
automake
linux
make
makefile
voip
乱码
awk
flash
vista
vi
vim
javascript
pietty
putty
ssh
posix
subversion
svn
windows
删除
编译
多线程
wxwidgets
ie
ubuntu
开源
c
python
bash
备份
性能
scp
汉字
log
ruby
中文
bug
msn
nginx
php
shell
wordpress
mqueue
android
eclipse
java
mac
ios
html5
js
mysql
protobuf
apache
hadoop
install
iocp
twisted
centos
mapreduce
hbase
thrift
tutorial
hive
erlang
lucene
hdfs
sqoop
utf8
filter
草原
yarn
ganglia
恢复
scrapy
django
fsimage
flume
tail
flume-ng
mining
scala
go
kafka
gradle
cassandra
baas
spring
postgres
maven
mybatis
mongodb
https
nodejs
镜像
心理学
机器学习
Keras
theano
anaconda
docker
spark
akka-http
json
群论
区块链
加密
抽象代数
离散对数
同余
欧拉函数
扩展欧几里德算法
ES6
node-inspect
debug
win10
vscode
挖矿