linux基础(四)—-linux命令系统学习—-文件处理命令

文件处理命令：file、mkdir、grep、dd、find、mv、ls、diff、cat、ln； Linux系统信息存放在文件里，文件与普通的公务文件类似。每个文件都有自己的名字、内容、存放地址及其它一些管理信息，如文件的用户、文件的大小等。文件可以是一封信、一个通讯录，或者是程序的源语句、程序的数据，可以包括可执行的程序和其它非正文内容。 Linux文件系统具有良好的结构，系统提供了很多文件处理程序。这里主要介绍常用的文件处理命令。 ## file ### 作用通过探测文件内容判断文件类型，使用权限是所有用户。 ### 格式 file [options] 文件名 [options]主要参数 -v：在标准输出后显示版本信息，并且退出。 -z：探测压缩过的文件类型。 -L：允许符合连接。 -f name：从文件namefile中读取要分析的文件名列表。 ### 简单说明使用file命令可以知道某个文件究竟是二进制（ELF格式）的可执行文件, 还是Shell Script文件，或者是其它的格式。 file能识别的文件类型有目录、Shell脚本、英文文本、二进制可执行文件、C语言源文件、文本文件、DOS的可执行文件。 ### 应用实例如果我们看到一个没有后缀的文件grap，可以使用下面命令： $ file grap grap： English text 此时系统显示这是一个英文文本文件。需要说明的是，file命令不能探测包括图形、音频、视频等多媒体文件类型。 ## mkdir ### 作用 mkdir命令的作用是建立名称为dirname的子目录，与MS DOS下的md命令类似，它的使用权限是所有用户。 ### 格式 mkdir [options] 目录名 [options]主要参数－m, －－mode=模式：设定权限，与chmod类似。－p, －－parents：需要时创建上层目录；如果目录早已存在，则不当作错误。－v, －－verbose：每次创建新目录都显示信息。－－version：显示版本信息后离开。 ### 应用实例在进行目录创建时可以设置目录的权限，此时使用的参数是“－m”。假设要创建的目录名是“tsk”，让所有用户都有rwx(即读、写、执行的权限)，那么可以使用以下命令： $ mkdir －m 777 tsk ## grep ### 作用 grep命令可以指定文件中搜索特定的内容，并将含有这些内容的行标准输出。 grep全称是Global Regular Expression Print，表示全局正则表达式版本，它的使用权限是所有用户。 ### 格式 grep [options] [options]主要参数：－c：只输出匹配行的计数。－I：不区分大小写（只适用于单字符）。－h：查询多文件时不显示文件名。－l：查询多文件时只输出包含匹配字符的文件名。－n：显示匹配行及行号。－s：不显示不存在或无匹配文本的错误信息。－v：显示不包含匹配文本的所有行。 pattern正则表达式主要参数： \：忽略正则表达式中特殊字符的原有含义。 ^：匹配正则表达式的开始行。 $: 匹配正则表达式的结束行。 \：到匹配正则表达式的行结束。 [ ]：单个字符，如[A]即A符合要求。 [ - ]：范围，如[A-Z]，即A、B、C一直到Z都符合要求。。：所有的单个字符。 * ：有字符，长度可以为0。正则表达式是Linux/Unix系统中非常重要的概念。正则表达式（也称为“regex”或“regexp”）是一个可以描述一类字符串的模式（Pattern）。如果一个字符串可以用某个正则表达式来描述，我们就说这个字符和该正则表达式匹配（Match）。这和DOS中用户可以使用通配符“*”代表任意字符类似。在Linux系统上，正则表达式通常被用来查找文本的模式，以及对文本执行“搜索－替换”操作和其它功能。 ### 应用实例查询DNS服务是日常工作之一，这意味着要维护覆盖不同网络的大量IP地址。有时IP地址会超过2000个。如果要查看nnn.nnn网络地址，但是却忘了第二部分中的其余部分，只知到有两个句点，例如nnn nn..。要抽取其中所有nnn.nnn IP地址，使用[0－9 ]\{3\}\.[0－0\{3\}\。含义是任意数字出现3次，后跟句点，接着是任意数字出现3次，后跟句点。 $grep '[0－9 ]\{3 \}\.[0－0\{3\}\' ipfile 补充说明，grep家族还包括fgrep和egrep。 fgrep是fix grep，允许查找字符串而不是一个模式； egrep是扩展grep，支持基本及扩展的正则表达式，但不支持\q模式范围的应用及与之相对应的一些更加规范的模式。 ## dd ### 作用 dd命令用来复制文件，并根据参数将数据转换和格式化。 ### 格式 dd [options] [opitions]主要参数 bs=字节：强迫 ibs=及obs=。 cbs=字节：每次转换指定的。 conv=关键字：根据以逗号分隔的关键字表示的方式来转换文件。 count=块数目：只复制指定的输入数据。 ibs=字节：每次读取指定的。 if=文件：读取内容，而非标准输入的数据。 obs=字节：每次写入指定的。 of=文件：将数据写入，而不在标准输出显示。 seek=块数目：先略过以obs为单位的指定的输出数据。 skip=块数目：先略过以ibs为单位的指定的输入数据。 ### 应用实例 dd命令常常用来制作Linux启动盘。先找一个可引导内核，令它的根设备指向正确的根分区，然后使用dd命令将其写入软盘： $ rdev vmlinuz /dev/hda $dd if＝vmlinuz of＝/dev/fd0 上面代码说明，使用rdev命令将可引导内核vmlinuz中的根设备指向/dev/hda，请把“hda”换成自己的根分区，接下来用dd命令将该内核写入软盘。 ## find ### 作用 find命令的作用是在目录中搜索文件，它的使用权限是所有用户。 ### 格式 find [path][options][expression] path指定目录路径，系统从这里开始沿着目录树向下查找文件。它是一个路径列表，相互用空格分离，如果不写path，那么默认为当前目录。 [options]参数：－depth：使用深度级别的查找过程方式，在某层指定目录中优先查找文件内容。－maxdepth levels：表示至多查找到开始目录的第level层子目录。level是一个非负数，如果level是0的话表示仅在当前目录中查找。－mindepth levels：表示至少查找到开始目录的第level层子目录。－mount：不在其它文件系统（如Msdos、Vfat等）的目录和文件中查找。－version：打印版本。 [expression]是匹配表达式，是find命令接受的表达式，find命令的所有操作都是针对表达式的。它的参数非常多，这里只介绍一些常用的参数。－name：支持统配符*和?。－atime n：搜索在过去n天读取过的文件。－ctime n：搜索在过去n天修改过的文件。－group grpoupname：搜索所有组为grpoupname的文件。－user 用户名：搜索所有文件属主为用户名（ID或名称）的文件。－size n：搜索文件大小是n个block的文件。－print：输出搜索结果，并且打印。 ### 应用技巧 find命令查找文件的几种方法： ### 根据文件名查找例如，我们想要查找一个文件名是lilo.conf的文件，可以使用如下命令： find / －name lilo.conf find命令后的“/”表示搜索整个硬盘。 ### 快速查找文件根据文件名查找文件会遇到一个实际问题，就是要花费相当长的一段时间，特别是大型Linux文件系统和大容量硬盘文件放在很深的子目录中时。如果我们知道了这个文件存放在某个目录中，那么只要在这个目录中往下寻找就能节省很多时间。比如smb.conf文件，从它的文件后缀“.conf”可以判断这是一个配置文件，那么它应该在/etc目录内，此时可以使用下面命令： find /etc －name smb.conf 这样，使用“快速查找文件”方式可以缩短时间。 ### 根据部分文件名查找方法有时我们知道只某个文件包含有abvd这4个字，那么要查找系统中所有包含有这4个字符的文件可以输入下面命令： find / －name '*abvd*' 输入这个命令以后，Linux系统会将在/目录中查找所有的包含有abvd这4个字符的文件（其中*是通配符），比如abvdrmyz等符合条件的文件都能显示出来。 ### 使用混合查找方式查找文件 find命令可以使用混合查找的方法，例如，我们想在/etc目录中查找大于500000字节，并且在24小时内修改的某个文件，则可以使用-and (与)把两个查找参数链接起来组合成一个混合的查找方式。 find /etc -size +500000c -and -mtime +1 ## mv ### 作用 mv命令用来为文件或目录改名，或者将文件由一个目录移入另一个目录中，它的使用权限是所有用户。该命令如同DOS命令中的ren和move的组合。 ### 格式 mv[options] 源文件或目录目标文件或目录 [options]主要参数－i：交互方式操作。如果mv操作将导致对已存在的目标文件的覆盖，此时系统询问是否重写，要求用户回答“y”或“n”，这样可以避免误覆盖文件。－f：禁止交互操作。mv操作要覆盖某个已有的目标文件时不给任何指示，指定此参数后i参数将不再起作用。 ### 应用实例（1）将/usr/cbu中的所有文件移到当前目录（用“.”表示）中： $ mv /usr/cbu/ * . （2）将文件cjh.txt重命名为wjz.txt： $ mv cjh.txt wjz.txt ## ls ### 作用 ls命令用于显示目录内容，类似DOS下的dir命令，它的使用权限是所有用户。 ### 格式 ls [options][filename] options主要参数－a, －－all：不隐藏任何以“.” 字符开始的项目。－A, －－almost－all：列出除了“ . ”及 “.. ”以外的任何项目。－－author：印出每个文件著作者。－b, －－escape：以八进制溢出序列表示不可打印的字符。－－block－size=大小：块以指定的字节为单位。－B, －－ignore－backups：不列出任何以 ~ 字符结束的项目。－f：不进行排序，－aU参数生效，－lst参数失效。－F, －－classify：加上文件类型的指示符号 (*/=@| 其中一个)。－g：like －l, but do not list owner。－G, －－no－group：inhibit display of group information。－i, －－inode：列出每个文件的inode号。－I, －－ignore=样式：不印出任何符合Shell万用字符的项目。－k：即－－block－size=1K。－l：使用较长格式列出信息。－L, －－dereference：当显示符号链接的文件信息时，显示符号链接所指示的对象，而并非符号链接本身的信息。－m：所有项目以逗号分隔，并填满整行行宽。－n, －－numeric－uid－gid：类似－l，但列出UID及GID号。－N, －－literal：列出未经处理的项目名称，例如不特别处理控制字符。－p, －－file－type：加上文件类型的指示符号 (/=@| 其中一个)。－Q, －－quote－name：将项目名称括上双引号。－r, －－reverse：依相反次序排列。－R, －－recursive：同时列出所有子目录层。－s, －－size：以块大小为序。 ### 应用举例 ls命令是Linux系统使用频率最多的命令，它的参数也是Linux命令中最多的。使用ls命令时会有几种不同的颜色，其中蓝色表示是目录，绿色表示是可执行文件，红色表示是压缩文件，浅蓝色表示是链接文件，加粗的黑色表示符号链接，灰色表示是其它格式文件。 ls最常使用的是ls- l。使用ls-l命令文件类型开头是由10个字符构成的字符串。其中第一个字符表示文件类型，它可以是下述类型之一：－（普通文件）、d（目录）、l（符号链接）、b（块设备文件）、c（字符设备文件）。后面的9个字符表示文件的访问权限，分为3组，每组3位。第一组表示文件属主的权限，第二组表示同组用户的权限，第三组表示其他用户的权限。每一组的三个字符分别表示对文件的读（r）、写（w）和执行权限（x）。对于目录，表示进入权限。s表示当文件被执行时，把该文件的UID或GID赋予执行进程的UID（用户ID）或GID（组ID）。 t表示设置标志位（留在内存，不被换出）。如果该文件是目录，那么在该目录中的文件只能被超级用户、目录拥有者或文件属主删除。如果它是可执行文件，那么在该文件执行后，指向其正文段的指针仍留在内存。这样再次执行它时，系统就能更快地装入该文件。接着显示的是文件大小、生成时间、文件或命令名称。 ## diff ### 作用 diff命令用于两个文件之间的比较，并指出两者的不同，它的使用权限是所有用户。 ### 格式 diff [options] 源文件目标文件 [options]主要参数 -a：将所有文件当作文本文件来处理。 -b：忽略空格造成的不同。 -B：忽略空行造成的不同。 -c：使用纲要输出格式。 -H：利用试探法加速对大文件的搜索。 -I：忽略大小写的变化。 -n --rcs：输出RCS格式。 ## cmp ### 作用 cmp（“compare”的缩写）命令用来简要指出两个文件是否存在差异，它的使用权限是所有用户。 ### 格式 cmp[options] 文件名 [options]主要参数 -l: 将字节以十进制的方式输出，并方便将两个文件中不同的以八进制的方式输出。 ## cat ### 作用 cat（“concatenate”的缩写）命令用于连接并显示指定的一个和多个文件的有关信息，它的使用权限是所有用户。 ### 格式 cat [options] 文件1 文件2…… [options]主要参数－n：由第一行开始对所有输出的行数编号。－b：和－n相似，只不过对于空白行不编号。－s：当遇到有连续两行以上的空白行时，就代换为一行的空白行。 ### 应用举例（1）cat命令一个最简单的用处是显示文本文件的内容。例如，我们想在命令行看一下README文件的内容，可以使用命令： $ cat README （2）有时需要将几个文件处理成一个文件，并将这种处理的结果保存到一个单独的输出文件。 cat命令在其输入上接受一个或多个文件，并将它们作为一个单独的文件打印到它的输出。例如，把README和INSTALL的文件内容加上行号（空白行不加）之后，将内容附加到一个新文本文件File1 中： $ cat README INSTALL File1 （3）cat还有一个重要的功能就是可以对行进行编号。这种功能对于程序文档的编制，以及法律和科学文档的编制很方便，打印在左边的行号使得参考文档的某一部分变得容易，这些在编程、科学研究、业务报告甚至是立法工作中都是非常重要的。使用cat命令/etc/named.conf文件进行编号对行进行编号功能有-b（只能对非空白行进行编号）和-n（可以对所有行进行编号）两个参数： $ cat -b /etc/named.conf ## ln ### 作用 ln命令用来在文件之间创建链接，它的使用权限是所有用户。 ### 格式 ln [options] 源文件 [链接名] 参数－f：链结时先将源文件删除。－d：允许系统管理者硬链结自己的目录。－s：进行软链结(Symbolic Link)。－b：将在链结时会被覆盖或删除的文件进行备份。链接有两种，一种被称为硬链接（Hard Link），另一种被称为符号链接（Symbolic Link）。默认情况下，ln命令产生硬链接。硬连接指通过索引节点来进行的连接。在Linux的文件系统中，保存在磁盘分区中的文件不管是什么类型都给它分配一个编号，称为索引节点号(Inode Index)。在Linux中，多个文件名指向同一索引节点是存在的。一般这种连接就是硬连接。硬连接的作用是允许一个文件拥有多个有效路径名，这样用户就可以建立硬连接到重要文件，以防止“误删”的功能。其原因如上所述，因为对应该目录的索引节点有一个以上的连接。只删除一个连接并不影响索引节点本身和其它的连接，只有当最后一个连接被删除后，文件的数据块及目录的连接才会被释放。也就是说，文件才会被真正删除。与硬连接相对应，Lnux系统中还存在另一种连接，称为符号连接（Symbilc Link），也叫软连接。软链接文件有点类似于Windows的快捷方式。它实际上是特殊文件的一种。在符号连接中，文件实际上是一个文本文件，其中包含的有另一文件的位置信息。