【转】linux命令详解:md5sum命令

转自:http://blog.itpub.net/29320885/viewspace-1710218/

前言

在网络传输、设备之间转存、复制大文件等时,可能会出现传输前后数据不一致的情况。这种情况在网络这种相对更不稳定的环境中,容易出现。那么校验文件的完整性,也是势在必行的。

使用说明

md5sum命令用于生成和校验文件的md5值。它会逐位对文件的内容进行校验。是文件的内容,与文件名无关,也就是文件内容相同,其md5值相同。md5值是一个128位的二进制数据,转换成16进制则是32(128/4)位的进制值。

md5校验,有很小的概率不同的文件生成的md5可能相同。比md5更安全的校验算法还有SHA*系列的。

在网络传输时,我们校验源文件获得其md5sum,传输完毕后,校验其目标文件,并对比如果源文件和目标文件md5 一致的话,则表示文件传输无异常。否则说明文件在传输过程中未正确传输。

重要的选项:

-b 以二进制模式读入文件内容

-t 以文本模式读入文件内容

-c 根据已生成的md5值,对现存文件进行校验

--status 校验完成后,不生成错误或正确的提示信息,可以通过命令的返回值来判断。

使用举例

生成文件md5值

md5sum file

 1: [root@master lianxi]# md5sum data 
 2: 0a6de444981b68d6a049053296491e49  data

使用通配对多个文件进行md5

 1: [root@master lianxi]# md5sum *
 2: 0a6de444981b68d6a049053296491e49  data
 3: 13df384c47dd2638fd923f60c40224c6  data2

md5sum校验的是文件内容,与文件名无关

相同内容的文件的md5一样。如下我先对文件进行复制,然后对同内容不同名的文件进行md5,md5值一样

 1: [root@master lianxi]# cp data  data.bak
 2: [root@master lianxi]# ls
 3: data  data.bak
 4: [root@master lianxi]# md5sum *
 5: 0a6de444981b68d6a049053296491e49  data
 6: 0a6de444981b68d6a049053296491e49  data.bak

以文本模式或二进制模式读入文件并对其进行校验

-b 以二进制模式读入内容

-t 以文本模式读入文件内容进行校验

虽然是不同的读入模式,但是在进行求md5的时候,是一样的,因为是逐位校验的。

如下文本文件,无论通过哪种模式读取md5都一致。

 1: [root@master lianxi]# file data
 2: data: ASCII text
 3: [root@master lianxi]# md5sum data
 4: 0a6de444981b68d6a049053296491e49  data
 5: [root@master lianxi]# md5sum -b data
 6: 0a6de444981b68d6a049053296491e49 *data
 7: [root@master lianxi]# md5sum -t data
 8: 0a6de444981b68d6a049053296491e49  data

md5值重定向

将生成md5值重定向到指定的文件,通常文件的扩展名我们会命为.md5

 1: [root@master lianxi]# md5sum data > data.md5
 2: [root@master lianxi]# md5sum data
 3: 0a6de444981b68d6a049053296491e49  data
 4: [root@master lianxi]# cat data.md5 
 5: 0a6de444981b68d6a049053296491e49  data

将多个文件的md5重定向到指定的文件

每个文件的md5生成为一行

 1: [root@master lianxi]# ls
 2: data  data.bak  data.md5  d.md5
 3: [root@master lianxi]# md5sum data* > d.md5
 4: [root@master lianxi]# cat d.md5 
 5: 0a6de444981b68d6a049053296491e49  data
 6: 0a6de444981b68d6a049053296491e49  data.bak
 7: 0bd94658869c53cdcdf35a0f7de93e01  data.md5

重定向追加

这里新增文件ls,单独求其md5,将其md5追加到文件中

 1: [root@master lianxi]# cp /bin/ls .
 2: [root@master lianxi]# ls
 3: data  data.bak  data.md5  d.md5  ls
 4: [root@master lianxi]# md5sum ls >> d.md5 
 5: [root@master lianxi]# cat d.md5 
 6: 0a6de444981b68d6a049053296491e49  data
 7: 0a6de444981b68d6a049053296491e49  data.bak
 8: 0bd94658869c53cdcdf35a0f7de93e01  data.md5
 9:c6337b20f3c159544bff5cf622391f9e  ls

md5校验

-c选项来对文件md5进行校验。校验时,根据已生成的md5来进行校验。生成当前文件的md5,并和之前已经生成的md5进行对比,如果一致,则返回OK,否则返回错误信息

md5sum –c d.md5

 1: [root@master lianxi]# md5sum -c d.md5 
 2: data: OK
 3: data.bak: OK
 4: data.md5: OK
 5: ls: OK

修改文件后,文件md5变化

 1: [root@master lianxi]# ls
 2: data
 3: [root@master lianxi]# md5sum data 
 4:2360752c3368ca4f89169f5ecc06e383  data
 5: [root@master lianxi]# md5sum data  > data.md5
 6: [root@master lianxi]# echo "lwg" >> data
 7: [root@master lianxi]# md5sum data
 8:287d237083a42f09785daa46a5fa3afe  data
 9: [root@master lianxi]# md5sum -c data.md5 
 10: data: FAILED
 11:md5sum: WARNING: 1 of 1 computed checksum did NOT match

--status,不显示校验信息,以命令返回值来判断

校验一致返回0,不一致返回1

 1: [root@master lianxi]# md5sum -c data.md5 
 2: data: FAILED
 3: md5sum: WARNING: 1 of 1 computed checksum did NOT match
 4: [root@master lianxi]# md5sum -c --status data.md5 
 5: [root@master lianxi]# echo $?
 6: 1

多个文件文件校验和grep连用

通过grep将正确的信息过滤掉

 1: [root@master lianxi]# md5sum -c ../value.md5 
 2: acpid: OK
 3: acpid.1: OK
 4: anaconda.log: OK
 5: anaconda.syslog: OK
 6: anaconda.xlog: OK
 7: boot.log: OK
 8: boot.log.1: OK
 9: ...
 10: ...
 11: 省略中间部分
 12: ...
 13: ...
 14: yum.log.2: OK
 15: md5sum: WARNING: 1 of 56 computed checksums did NOT match
 1: [root@master lianxi]# md5sum -c ../value.md5 | grep -v OK 
 2: md5sum: WARNING: 1 of 56 computed checksums did NOT match
 3: cron.1: FAILED

特殊说明

1)md5sum 是校验文件内容,与文件名是否相同无关

2)md5sum值逐位校验,所以文件越大,校验时间越长。

总结

通过md5sum来校验生成文件校验码,来发现文件传输(网络传输、复制、本地不同设备间的传输)异常造成的文件内容不一致的情况。

 

原网页地址:http://www.th7.cn/system/lin/201311/46777.shtml#0-...

【转】linux命令详解:md5sum命令的更多相关文章

  1. Linux CAT与ECHO命令详解 <<EOF EOF

    Linux CAT与ECHO命令详解 cat命令是Linux下的一个文本输出命令,通常是用于观看某个文件的内容的: cat主要有三大功能: .一次显示整个文件. $ cat filename .从键盘 ...

  2. Linux下chkconfig命令详解(转)

    Linux下chkconfig命令详解 chkconfig命令主要用来更新(启动或停止)和查询系统服务的运行级信息.谨记chkconfig不是立即自动禁止或激活一个服务,它只是简单的改变了符号连接. ...

  3. linux history 命令详解

    linux history 命令详解 显示命令执行时间 linux shell 具有history 功能,即会记录已经执行过的命令,但是默认是不显示命令的执行时间,命令的执行时间,history 已经 ...

  4. Linux知识积累(4) Linux下chkconfig命令详解

    Linux下chkconfig命令详解 chkconfig命令主要用来更新(启动或停止)和查询系统服务的运行级信息.谨记chkconfig不是立即自动禁止或激活一个服务,它只是简单的改变了符号连接. ...

  5. Linux下top命令详解

    Linux下top命令详解 top命令是Linux下常用的性能分析工具,能够实时显示系统中各个进程的资源占用状况,类似于Windows的任务管理器.top是一个动态显示过程,即可以通过用户按键来不断刷 ...

  6. AIX topas命令详解

    本文转载于:AIX topas命令详解 topas命令默认2秒更新一次 一.topas命令以区域形式表现系统各项指标性能,如下图: 1. CPU:反应CPU性能区域,如果有多个 CPU,按 c 键两次 ...

  7. Linux netstat详解

    做计算机管理员,我们都必要了解一下netstat这个命令,它是一个查看网络连接状态的工具,在windows下也默认有这个工具.Netstat命令详解 netstat命令怎样使用 如何关闭TIME_WA ...

  8. linux yum命令详解

    yum(全称为 Yellow dog Updater, Modified)是一个在Fedora和RedHat以及SUSE中的Shell前端软件包管理器.基於RPM包管理,能够从指定的服务器自动下载RP ...

  9. Linux下ps命令详解 Linux下ps命令的详细使用方法

    http://www.jb51.net/LINUXjishu/56578.html Linux下的ps命令比较常用 Linux下ps命令详解Linux上进程有5种状态:1. 运行(正在运行或在运行队列 ...

随机推荐

  1. Spark Streaming源码解读之Driver容错安全性

    本期内容 : ReceivedBlockTracker容错安全性 DStreamGraph和JobGenerator容错安全性 Driver的安全性主要从Spark Streaming自己运行机制的角 ...

  2. 每日Scrum(5)

    进入冲刺第五天,软件的界面设计成为主打,收集学校的很多美图是我们组的任务: 问题在于软件已很难有很大的改进,大方向也都是变不了的

  3. 回调函数通俗解析(之前看了很久都不理解,今天终于ok啦)

    自学jquery的时候,看到一英文词(Callback),顿时背部隐隐冒冷汗.迅速google之,发现原来中文翻译成回调.也就是回调函数了.不懂啊,于是在google回调函数,发现网上的中文解释实在是 ...

  4. ADF_Database Develop系列3_设计数据库表之Reconcile Database/Reverse Objects

    2013-05-01 Created By BaoXinjian

  5. 【转】Java八种基本数据类型的比较及其相互转化

    java中有且仅有八种基本数据类型,记住就行,共分为四类: 第一类:整型-->byte     short      int     long 第二类:浮点-->float    doub ...

  6. MySql数据库1【概念】

    [mysql] mysql是目前最主流的跨平台.开放源代码的关系型数据库,由瑞曲的mysql ab公司开发,已经被SUN公司收购,标识是一只名为sakila的海豚,代表mysql的速度.能力.精确优秀 ...

  7. unix c 02

    环境变量 - 存储在内存中的信息,格式是映射,作用就是 帮助系统 进行一些工作,一般是 查找某个东西. 预处理指令:#warning #error #pragma 使用程序直接调用库文件的函数(动态编 ...

  8. 芝麻HTTP: Python爬虫利器之Requests库的用法

    前言 之前我们用了 urllib 库,这个作为入门的工具还是不错的,对了解一些爬虫的基本理念,掌握爬虫爬取的流程有所帮助.入门之后,我们就需要学习一些更加高级的内容和工具来方便我们的爬取.那么这一节来 ...

  9. AngularJS学习之旅—AngularJS 事件(十四)

    1.AngularJS 事件 ng-click ( 适用标签 :所有,触发事件:单击): ng-dblclick( 适用标签 :所有,触发事件:双击): ng-blur(适用标签 : a,input, ...

  10. codeforces675D

    Tree Construction CodeForces - 675D During the programming classes Vasya was assigned a difficult pr ...