Linux下快速比较两个目录的不同
2022/8/28 5:22:58
本文主要是介绍Linux下快速比较两个目录的不同,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
Linux下快速比较两个目录的不同
玩linux编程,文件对比还是经常用的;
[root@node1 ~]# tree directory1 directory2 directory1 ├── 1.png ├── 2.png └── 3.png directory2 ├── 2.png ├── 3.png └── 4.png
1.命令行输出的结果
方法一:使用diff
diff -r directory1 directory2
但是diff会对每个文件中的每一行都做比较,所以文件较多或者文件较大的时候会非常慢。请谨慎使用。
方法二:使用diff结合tree
diff <(tree -Ci --noreport /mnt/f/自然马) <(tree -Ci --noreport /mnt/i/自然马) < /mnt/f/自然马 --- > /mnt/i/自然马 87a88 > xyz.avi 488d488 < rsync.txt 534d533 < 542D0.mp4
说明:
- tree的
-C
选项是输出颜色,如果只是看一下目录的不同,可以使用该选项,但在结合其他命令使用的时候建议不要使用该选项,因为颜色也会转换为对应的编码而输出; -i
是不缩进,建议不要省略-i
,否则diff的结果很难看,也不好继续后续的文件操作;--noreport
是不输出报告结果,建议不要省略该选项。- 该方法效率很高。
方法三:find结合diff
find directory1 -printf "%Pn" | sort > file1 find directory2 -printf "%Pn" | sort | diff file1 - 2d1 < 1.png 4a4 > 4.png
说明:
<
代表的行是directory1中有而directory2没有的文件,>
则相反,是directory2中有而directory1中没有。- 不要省略
-printf "%Pn"
,此处的%P表示find的结果中去掉前缀路径,详细内容man find
。例如,find /root/ -printf "%Pn"
的结果中将显示/root/a/xyz.txt中去掉/root/后的结果:a/xyz.txt。 - 效率很高,输出也简洁。
如果不想使用-printf
,那么先进入各目录再find也行。
[root@node1 ~]# (cd /root/a;find . | sort >/tmp/file1) [root@node1 ~]# (cd /root/b;find . | sort | diff /tmp/file1 -) 2d1 < ./1.png 4a4 > ./4.png
上面将命令放进括号中执行是为了在子shell中切换目录,不用影响当前所在目录。
方法四:使用rsync
rsync -rvn --delete directory1/ directory2 | sed -n '2,/^$/{/^$/!p}' deleting a/xyz.avi rsync.txt 新建文件夹/542D0.mp4
其中deleting所在的行就是directory2中多出的文件。其他的都是directory中多出的文件。
如果想区分出不同的是目录还是文件。可以加上"-i"选项。
rsync -rvn -i --delete directory1/ directory2 | sed -n '2,/^$/{/^$/!p}' *deleting a/xyz.avi >f+++++++++ rsync.txt >f+++++++++ 新建文件夹/542D0.mp4
其中>f+++++++++
中的f代表的是文件,d代表的目录。
上面的rsync比较目录有几点要说明:
- 一定不能缺少-n选项,它表示dry run,也就是试着进行rsync同步,但不会真的同步。
- 第一个目录(directory1/)后一定不能缺少斜线,否则表示将directory1整个目录同步到directory2目录下。
- 其它选项,如"-r -v --delete"也都不能缺少,它们的意义想必都知道。
- sed的作用是过滤掉和文件不相关的内容。
- 以上rsync假定了比较的两个目录中只有普通文件和目录,没有软链接、块设备等特殊文件。如果有,请考虑加上对应的选项或者使用-a替代-r,否则结果中将出现skipping non-regular file的提示。但请注意,如果有软链接,且加了对应选项(-l或-a或其他相关选项),则可能会出现
fileA-->fileB
的输出。 - 效率很高,因为rsync的原因,筛选的可定制性也非常强。
2.图形化的比较结果
方法一:使用vimdiff
vimdiff <(cd directory1; find . | sort) <(cd directory2; find . | sort) # 或者 vimdiff <(find directory1 -printf "%Pn"| sort) <(find directory2 -printf "%Pn"| sort)
方法二:使用meld
meld是python写的一个图形化文件/目录比较工具,所以必须先安装图形界面或设置好图形界面接受协议。它的功能非常丰富,和win下的beyond compare有异曲同工之妙。
meld具体的使用方式就不介绍了。
3.将两目录中不同的文件筛选出来
个人建议使用命令行输出的结果中的方法方法三和方法四,因为它们都能很好地保留目录前缀。
以方法三为例:
find directory1 -printf "%Pn" | sort > file1 find directory2 -printf "%Pn" | sort | diff file1 -
以下是实验所需目录结构:
[root@node1 ~]# tree /root/a;tree /root/b /root/a ├── 1.png ├── 2.png └── 3.png 0 directories, 3 files /root/b ├── 2.png ├── 3.png ├── 4.png └── xen └── scripts └── block-drbd
首先比较这两个目录得到文件列表的差异。
find /root/a -printf "%Pn" | sort > /tmp/file1 find /root/b -printf "%Pn" | sort | diff /tmp/file1 - >diff.txt
然后从diff.txt中过滤出/root/a中多出的文件和/root/b中多出的文件。
# /root/a中多出的文件 awk '/</{printf("%s%sn","/tmp/etc/",$2)}' diff.txt /tmp/etc/1.png # /root/b中多出的文件 awk '/>/{printf("%s%sn","/tmp/etc/",$2)}' diff.txt /tmp/etc/4.png /tmp/etc/xen /tmp/etc/xen/scripts /tmp/etc/xen/scripts/block-drbd
需要注意的是,如果多了某个目录,则这个目录和其内所有文件都会列出来。如果要将多出的文件复制到其他地方,应当要注意这一点。
如果只想要比较出/root/a和/root/b下的文件和目录的不同,不再递归到子目录中比较。那么可以在find上继续加工一番:
find /root/a -maxdepth 1 -printf "%Pn" | sort > /tmp/file1 find /root/b -maxdepth 1 -printf "%Pn" | sort | diff /tmp/file1 - >diff.txt # /root/a中多出的文件 awk '/</{printf("%s%sn","/tmp/etc/",$2)}' diff.txt /tmp/etc/1.png # /root/b中多出的文件 awk '/>/{printf("%s%sn","/tmp/etc/",$2)}' diff.txt /tmp/etc/4.png /tmp/etc/xen
这样一来,/root/b中多出的文件就是4.png和xen,xen目录中的文件不再列出。
这篇关于Linux下快速比较两个目录的不同的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-12-18git仓库有更新,jenkins 自动触发拉代码怎么配置的?-icode9专业技术文章分享
- 2024-12-18Jenkins webhook 方式怎么配置指定的分支?-icode9专业技术文章分享
- 2024-12-13Linux C++项目实战入门教程
- 2024-12-13Linux C++编程项目实战入门教程
- 2024-12-11Linux部署Scrapy教程:新手入门指南
- 2024-12-11怎么将在本地创建的 Maven 仓库迁移到 Linux 服务器上?-icode9专业技术文章分享
- 2024-12-10Linux常用命令
- 2024-12-06谁看谁服! Linux 创始人对于进程和线程的理解是…
- 2024-12-04操作系统教程:新手入门及初级技巧详解
- 2024-12-04操作系统入门:新手必学指南