博客
关于我
Linux基础之正则表达式
阅读量:642 次
发布时间:2019-03-14

本文共 2055 字,大约阅读时间需要 6 分钟。

正则表达式:又称规则表达式(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。

正则表达式是对字符串(包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为“元字符”))操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。正则表达式是一种文本模式,该模式描述在搜索文本时要匹配的一个或多个字符串。

给定一个正则表达式和另一个字符串,我们可以达到如下的目的:

1. 给定的字符串是否符合正则表达式的过滤逻辑(称作“匹配”):

2. 可以通过正则表达式,从字符串中获取我们想要的特定部分。

我们可以使用 grep 命令来测试我们的正则表达式,grep命令去尝试匹配指定文件的每一行,并将至少有一处匹配表达式的所有行显示出来。

grep 命令说明:

常用的选项OPTION:

-c 显示匹配到的行数之和-o 仅显示匹配本身 -v 显示非匹配,取反 -i 不区分大小写-E 支持扩展表达式 -q 静默模式 -n 显示匹配到的行的行号-A 2 显示匹配到的行的后2行-B 2 显示匹配到的行的前2行-C 2 显示匹配到的行的前后2行-V 显示版本信息

使用语法:

grep [OPTION]... PATTERN [FILE]...

grep "[匹配字符]匹配出现次数" /PATH/TO/SOMEFILE

字符匹配:

. 任意单个字符[] 指定范围内的单个字符[^] 指定范围外的的单个字符,取反.* 任意长度的任意字符[:alnum:] 所有的字母和数字      [:alpha:] 所有的字母[:blank:] 所有呈水平排列的空白字符[:cntrl:] 所有的控制字符[:digit:] 所有的数字[:graph:] 所有的可打印字符,不包括空格[:lower:] 所有的小写字母     [:print:] 所有的可打印字符,包括空格[:punct:] 所有的标点字符 [:space:] 所有呈水平或垂直排列的空白字符[:upper:] 所有的大写字母    [:xdigit:] 所有的十六进制数[=字符=] 所有和指定字符相等的字符

匹配次数 :

* 其前面的字符出现任意次,0次或1次,或者多次\? 其前面的字符出现0次或1次\+ 其前面的字符出现1次或多次,至少出现1次\{m\} 指定字符出现次数\{m,n\} 至少出现m次,至多出现n次,范围取次 \{0,n\} 出现最多n次          \{m,\} 出现最少m次

位置锚定:

^ 行首锚定,用于模式的最左侧 $ 行尾锚定,用于模式的最右侧 ^……$ 整行, ^$ 空白行,^[[:space:]]*$  空行或者有空白字符的行\< 或 \b  词首锚定\> 或 \b  词尾锚定\<……\>  精确锚定单词

分组及引用:

\{xy\}*ab     表示多个字符出现0,1或多次。 \ 在这里作为转义符使用\(abcd\){1,3}    表示包含abcd字符串最少出现1次,最多出现3次\(1..2\).* \1      \1 是指引用从左侧起第一个()之间的字符\(1..2\).* \(3..4\)\2    \2 是指引用从左侧起第二个()之间的字符\(1..2\).* \(3..4\).*\(5..6\)\3   \3 是指引用从左侧起第三个()之间的字符

 

使用实例:

查看显示 /etc/fstab 文件以 # 注释开头的行:

这里也可以不加【】:

-v 取反,即显示不以#注释的行,-o 选项为只显示匹配到的字符串:

显示 /etc/fstab 文件非注释的行,锚定行首为 # 注释的行,取反:

显示 /etc/fstab 文件以#号开头,后面跟一个空格,后面为任意长度任意字符的行, -c 选项可以统计匹配到的行数:

在 /tmp/fstab 文件中加入多个空白行,以#号开头,后面仅跟一个空格,且不以空白符结尾的行:

显示 /tmp/sshd_config 文件中不以#注释、空白行以及有空白字符的行:

显示 /etc/passwd 文件中用户名和用户SHELL为一样的行:

显示 /tmp 目录下,以非字母开头,后面跟一个字母,后面为任意长度任意字符的文件或者目录:

显示 /tmp 目录下以非字母开头,后面仅跟一个字母,然后以非字母结尾的文件和目录:

显示 /etc 目录下以p开头不以数字结尾的所有文件和目录:

显示 ip a 或者 ifconfig 命令中的IP地址,-E 选项为支持扩展正则表达式:

-l 选项可以列出包含字符串的文件列表:

-w 精确锚定字符串,相当于\<...|> :

egrep 的使用方法跟 grep 基本一致,不需要转义符 \ 看起来更简洁:

 

 

转载地址:http://hnjlz.baihongyu.com/

你可能感兴趣的文章
NIFI1.21.0最新版本安装_连接phoenix_单机版_Https登录_什么都没改换了最新版本的NIFI可以连接了_气人_实现插入数据到Hbase_实际操作---大数据之Nifi工作笔记0050
查看>>
NIFI1.21.0通过Postgresql11的CDC逻辑复制槽实现_指定表多表增量同步_增删改数据分发及删除数据实时同步_通过分页解决变更记录过大问题_02----大数据之Nifi工作笔记0054
查看>>
NIFI1.21.0通过Postgresql11的CDC逻辑复制槽实现_指定表多表增量同步_插入修改删除增量数据实时同步_通过分页解决变更记录过大问题_01----大数据之Nifi工作笔记0053
查看>>
NIFI1.21.0通过Postgresql11的CDC逻辑复制槽实现_指定表或全表增量同步_实现指定整库同步_或指定数据表同步配置_04---大数据之Nifi工作笔记0056
查看>>
NIFI1.23.2_最新版_性能优化通用_技巧积累_使用NIFI表达式过滤表_随时更新---大数据之Nifi工作笔记0063
查看>>
NIFI从MySql中增量同步数据_通过Mysql的binlog功能_实时同步mysql数据_根据binlog实现数据实时delete同步_实际操作04---大数据之Nifi工作笔记0043
查看>>
NIFI从MySql中增量同步数据_通过Mysql的binlog功能_实时同步mysql数据_配置binlog_使用处理器抓取binlog数据_实际操作01---大数据之Nifi工作笔记0040
查看>>
NIFI从MySql中增量同步数据_通过Mysql的binlog功能_实时同步mysql数据_配置数据路由_实现数据插入数据到目标数据库_实际操作03---大数据之Nifi工作笔记0042
查看>>
NIFI从MySql中增量同步数据_通过Mysql的binlog功能_实时同步mysql数据_配置数据路由_生成插入Sql语句_实际操作02---大数据之Nifi工作笔记0041
查看>>
NIFI从MySql中离线读取数据再导入到MySql中_03_来吧用NIFI实现_数据分页获取功能---大数据之Nifi工作笔记0038
查看>>
NIFI从MySql中离线读取数据再导入到MySql中_不带分页处理_01_QueryDatabaseTable获取数据_原0036---大数据之Nifi工作笔记0064
查看>>
NIFI从MySql中离线读取数据再导入到MySql中_无分页功能_02_转换数据_分割数据_提取JSON数据_替换拼接SQL_添加分页---大数据之Nifi工作笔记0037
查看>>
NIFI从PostGresql中离线读取数据再导入到MySql中_带有数据分页获取功能_不带分页不能用_NIFI资料太少了---大数据之Nifi工作笔记0039
查看>>
nifi使用过程-常见问题-以及入门总结---大数据之Nifi工作笔记0012
查看>>
NIFI分页获取Mysql数据_导入到Hbase中_并可通过phoenix客户端查询_含金量很高的一篇_搞了好久_实际操作05---大数据之Nifi工作笔记0045
查看>>
NIFI分页获取Postgresql数据到Hbase中_实际操作---大数据之Nifi工作笔记0049
查看>>
NIFI同步MySql数据_到SqlServer_错误_驱动程序无法通过使用安全套接字层(SSL)加密与SQL Server_Navicat连接SqlServer---大数据之Nifi工作笔记0047
查看>>
NIFI同步MySql数据源数据_到原始库hbase_同时对数据进行实时分析处理_同步到清洗库_实际操作06---大数据之Nifi工作笔记0046
查看>>
Nifi同步过程中报错create_time字段找不到_实际目标表和源表中没有这个字段---大数据之Nifi工作笔记0066
查看>>
NIFI大数据进阶_FlowFile拓扑_对FlowFile内容和属性的修改删除添加_介绍和描述_以及实际操作---大数据之Nifi工作笔记0023
查看>>