网站首页 > 技术文章 正文
正则表达式RE
========================================================
重要的文本处理工具:vim、sed、awk、grep
mysql、oracle、php、python、Apache、Nginx ...
一、什么是正则表达式? 匹配字符串
正则表达式(regular expression, RE)是一种字符模式,用于在查找过程中匹配指定的字符。
在大多数程序里,正则表达式都被置于两个正斜杠之间;例如/l[oO]ve/就是由正斜杠界定的正则表达式,
它将匹配被查找的行中任何位置出现的相同模式。在正则表达式中,元字符是最重要的概念。
二、元字符
定义:元字符是这样一类字符,它们表达的是不同于字面本身的含义
shell元字符(也称为通配符) 由shell来解析,如rm -rf *.pdf,元字符* Shell将其解析为任意多个字符
正则表达式元字符 由各种执行模式匹配操作的程序来解析,比如vi、grep、sed、awk、python
[root@tianyun ~]# rm -rf *.pdf
[root@tianyun ~]# grep 'abc*' /etc/passwd
abrt:x:173:173::/etc/abrt:/sbin/nologin
1. 正则表达式元字符:
===基本正则表达式元字符
元字符 功能 示例
========================================================
^ 行首定位符 ^love grep '^root' /etc/passwd
$ 行尾定位符 love$ grep 'root#39; /etc/passwd
. 匹配单个字符 l..e grep '^r..t' /etc/passwd
* 匹配前导符0到多次 ab*love grep 'ro*t' /etc/passwd
.* 任意多个字符 grep 'r*ot' /etc/passwd grep 'r**t' /etc/passwd
[] 匹配指定范围内的一个字符 [lL]ove grep '[rx]oot' /etc/passwd
[ - ] 匹配指定范围内的一个字符 [a-z0-9]ove grep '[a-z0-9]oot' /etc/passwd
[^] 匹配不在指定组内的字符 [^a-z0-9]ove grep '[^a-z0-9]oot' /etc/passwd
^ 符号,在字符类符号(括号[])之内与之外是不同的! 在 [] 内代表『反向选择』,在 [] 之外则代表定位在行首的意义!以什么开头的, 重点!!!
\ 用来转义元字符 love\.
\< 词首定位符 \<love 无用
\> 词尾定位符 love\> 无用
\(..\) 匹配稍后使用的字符的标签 :% s/172.16.130.1/172.16.130.5/
:% s/\(172.16.130.\)1/\15/
:% s/\(172.\)\(16.\)\(130.\)1/\1\2\35/
:3,9 s/\(.*\)/#\1/
x\{m\} 字符x重复出现m次 o\{5\}
x\{m,\} 字符x重复出现m次以上 o\{5,\}
x\{m,n\} 字符x重复出现m到n次 o\{5,10\}
===扩展正则表达式元字符
+ 匹配一个或多个前导字符 [a-z]+ove
? 匹配零个或一个前导字符 lo?ve
a|b 匹配a或b love|hate
() 组字符 loveable|rs love(able|rs) ov+ ov+ (ov)+
(..)(..)\1\2 标签匹配字符 (love)able\1er
grep 'bash#39; /etc/passwd
grep ‘^root’ /etc/passwd
grep 'r..t' /etc/passwd
2. POSIX字符类:
表达式 功能 示例
[:alnum:] 字母与数字字符 [[:alnum:]]+
[:alpha:] 字母字符(包括大小写字母) [[:alpha:]]{4}
[:blank:] 空格与制表符 [[:blank:]]*
[:digit:] 数字字母 [[:digit:]]?
[:lower:] 小写字母 [[:lower:]]{5,}
[:upper:] 大写字母 [[:upper:]]+
[:punct:] 标点符号 [[:punct:]]
[:space:] 包括换行符,回车等在内的所有空白[[:space:]]+
三、正则匹配示例:vim
/love/
/^love/
/love$/
/l.ve/
/lo*ve/
/[Ll]ove/
/love[a-z]/
/love[^a-zA-Z0-9]/
/.*/
/^$/
/^[A-Z]..$/
/^[A-Z][a-z ]*3[0-5]/
/[a-z]*\./
/^ *[A-Z][a-z][a-z]$/
/^[A-Za-z]*[^,][A-Za-z]*$/
/\<fourth\>/
/\<f.*th\>/
/5{2}2{3}\./
空行
/^$/
^代表行首
$代表行尾
^$意思就是行首之后就是行尾,中间什么也没有
/^[ \t]*$/
注释行
/^#/
/^[ \t]*#/
:1,$ s/\([Oo]ccur\)ence/\1rence/
:1,$ s/\(square\) and \(fair\)/\2 and \1/
========================================================
s/^[ \t]* 是将这一行起始的空白字符删掉
s/[ \t].*// 是将空白及以后的内容删掉s/[ \t].*//
表示如果匹配到以制表符开头的字符串那就把开头的制表符去掉,s/[ \t].*//表示如果在字符串中有制表符那么把制表符去掉。就是去掉匹配字符串中的制表符
猜你喜欢
- 2025-08-21 JAVA历史版本_java版本更新历史
- 2025-08-21 MFC转QT:Qt基础知识_qt入门教程
- 2025-08-21 APIJSON快速入门-零后端代码,接口所见即所得
- 2025-08-21 我的java问题排查工具单_jvm问题排查案例
- 2025-08-21 超级详细的zabbix环境搭建和测试(看我的教程,大神你也可以)
- 2025-08-21 全程软件测试(九十四):Jmeter之接口&压力测试—读书笔记
- 2025-08-21 一份超详细的Java问题排查工具单_java 问题排查
- 2025-08-21 JMeter基础_jmeter基础用法
- 2025-08-21 微服务平台建设方案_微服务平台构建方案
- 2025-08-21 JVM调优,快速定位服务CPU过高,有理论配合实战,还不快收藏?
你 发表评论:
欢迎- 最近发表
- 标签列表
-
- 前端设计模式 (75)
- 前端性能优化 (51)
- 前端模板 (66)
- 前端跨域 (52)
- 前端缓存 (63)
- 前端aes加密 (58)
- 前端脚手架 (56)
- 前端md5加密 (54)
- 前端路由 (61)
- 前端数组 (73)
- 前端js面试题 (50)
- 前端定时器 (59)
- Oracle RAC (76)
- oracle恢复 (77)
- oracle 删除表 (52)
- oracle 用户名 (80)
- oracle 工具 (55)
- oracle 内存 (55)
- oracle 导出表 (62)
- oracle约束 (54)
- oracle 中文 (51)
- oracle链接 (54)
- oracle的函数 (58)
- oracle面试 (55)
- 前端调试 (52)
本文暂时没有评论,来添加一个吧(●'◡'●)