正则表达式

^ 表示一行的开头。如:/^#/ 以#开头的匹配。
$ 表示一行的结尾。如:/}$/ 以}结尾的匹配。
\< 表示词首。 如:\<abc 表示以 abc 为首的詞。
\> 表示词尾。 如:abc\> 表示以 abc 結尾的詞。
. 表示任何单个字符。
* 表示某个字符出现了0次或多次。
[ ] 字符集合。 如:[abc] 表示匹配a或b或c,还有 [a-zA-Z] 表示匹配所有的26个字符。如果其中有^表示反,如 [^a] 表示非a的字符

实例:去掉html的tags

sed 's/<[^>]*>//g' html.txt

[^>]*代表零个或多个非>,所以此正则表达式匹配到的字符串形式为:<>中间夹着一些字符,这些字符是非>或是空。

posted @ 2024-06-24 22:54  好人~  阅读(7)  评论(0编辑  收藏  举报