grep(global search regular expression(RE) and print out the line,全面搜索正则表达式并把行打印出来)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。
grep可用于shell脚本,因为grep通过返回一个状态值来说明搜索的状态,如果模板搜索成功,则返回0,如果搜索不成功,则返回1,如果搜索的文件不存在,则返回2。我们利用这些返回值就可进行一些自动化的文本处理工作。
选项
1 | -a 不要忽略二进制数据。 |
规则表达式
grep的规则表达式:
^ #锚定行的开始 如:’^grep’匹配所有以grep开头的行。
$ #锚定行的结束 如:’grep$’匹配所有以grep结尾的行。
. #匹配一个非换行符的字符 如:’gr.p’匹配gr后接一个任意字符,然后是p。
- #匹配零个或多个先前字符 如:’*grep’匹配所有一个或多个空格后紧跟grep的行。
.* #一起用代表任意字符。
[] #匹配一个指定范围内的字符,如’[Gg]rep’匹配Grep和grep。
#匹配一个不在指定范围内的字符,如:’A-FH-Zrep’匹配不包含A-F和H-Z的一个字母开头,紧跟rep的行。
(..) #标记匹配字符,如’(love)‘,love被标记为1。
\< #锚定单词的开始,如:’\<grep’匹配包含以grep开头的单词的行。
> #锚定单词的结束,如’grep>‘匹配包含以grep结尾的单词的行。
x{m} #重复字符x,m次,如:’0{5}‘匹配包含5个o的行。
x{m,} #重复字符x,至少m次,如:’o{5,}‘匹配至少有5个o的行。
x{m,n} #重复字符x,至少m次,不多于n次,如:’o{5,10}‘匹配5–10个o的行。
\w #匹配文字和数字字符,也就是[A-Za-z0-9],如:’G\w*p’匹配以G后跟零个或多个文字或数字字符,然后是p。
\W #\w的反置形式,匹配一个或多个非单词字符,如点号句号等。
\b #单词锁定符,如: ‘\bgrep\b’只匹配grep。
POSIX字符:
为了在不同国家的字符编码中保持一至,POSIX(The Portable Operating System Interface)增加了特殊的字符类,如[:alnum:]是[A-Za-z0-9]的另一个写法。要把它们放到[]号内才能成为正则表达式,如[A- Za-z0-9]或[[:alnum:]]。在linux下的grep除fgrep外,都支持POSIX的字符类。
[:alnum:] #文字数字字符
[:alpha:] #文字字符
[:digit:] #数字字符
[:graph:] #非空字符(非空格、控制字符)
[:lower:] #小写字符
[:cntrl:] #控制字符
[:print:] #非空字符(包括空格)
[:punct:] #标点符号
[:space:] #所有空白字符(新行,空格,制表符)
[:upper:] #大写字符
[:xdigit:] #十六进制数字(0-9,a-f,A-F)
常用实例
1)查找指定进程
1 | ps -ef|grep svn |
2)查找指定进程个数
1 | # ps -ef|grep -c svn |
3)从文件中读取关键词进行搜索
1 | # cat test.txt |
说明:
输出test.txt文件中含有从test2.txt文件中读取出的关键词的内容行
4)从文件中读取关键词进行搜索且显示行号
1 | # cat test.txt |
说明:
输出test.txt文件中含有从test2.txt文件中读取出的关键词的内容行,并显示每一行的行号
5)从文件中查找关键词
1 | # grep 'linux' test.txt |
6)从多个文件中查找关键词
1 | # grep -n 'linux' test.txt test2.txt |
说明:
多文件时,输出查询到的信息内容行时,会把文件的命名在行最前面输出并且加上”:”作为标示符
7)grep不显示本身进程
1 | # ps aux|grep ssh |
8)找出已u开头的行内容
1 | # cat test.txt |grep ^u |
9)输出非u开头的行内容
1 | # cat test.txt |grep ^[^u] |
10)输出以hat结尾的行内容
1 | # cat test.txt |grep hat$ |
11)查服务器ip地址所在行
1 | # ifconfig eth0|grep "[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}" |
12)显示包含ed或者at字符的内容行
1 | # cat test.txt |grep -E "peida|com" |
13)显示当前目录下面以.txt 结尾的文件中的所有包含每个字符串至少有7个连续小写字符的字符串的行
1 | # grep '[a-z]\{7\}' *.txt |
14)在多级目录中对文本进行递归搜索
1 | #grep "text" . -r -n # .表示当前目录。 |
15)显示过滤注释( # ; 开头) 和空行后的配置信息
1 | # grep -Ev "^$|^[#;]" server.conf |
参考链接:
http://www.cnblogs.com/peida/archive/2012/12/17/2821195.html