正则表达式通常用来表达一组具有共通特性(pattern)的字符串集合。
regexp(regular expression)
的精髓,就是用最少的字符,表达最大的字符集。
regexp
emacs的专利,而是UNIX下的产物。

regexp
下的特殊字符:

***
第一类字符:代表选择所有
.          
代表除了newline以外的所有单个字符。甚至是一些特殊字符。
           
若想表达任意多的任意字符,用".*"表示,.不包含换行符的

***
第二类字符:postfix character,用来表示重复出现的单字符.
*          
表示重复符号前的字符从0到无限多次
           
例如:ab*->a,ab,abb,abbb,abbb...
+          
表示重复符号前字符从1到无限多次
           
例如:ab+->ab,ab,abb,abbb,abbbb...
          表示重复符号前的字符0次或1
           
例如:ab?->a,ab

***
第三类:character set 用来表示某个特定的字集中的元素
[]         
表示某个特定的字集
           
例如:[a@!dl3]->a,@,!,d,l,3任选其一
                 [a-g]->a,b,c,d,e,f,g
任选其一
[]*        
例如:c[ab]d->cad,cbd
            c[ab]*d->cd,cad,cbd,caad,caabd,caabbd.....
[]+        
例如:c[ab]+d->cad,cbd,caabd,cabbd.....
[]?        
例如:c[ab]?d->cd,cad,cbd

       
任何特殊字符,出现在[]内,都会被视为一般字符,除了两个,^,-

^          
若出现在集合的第一个位置,表示""
           
例如:[a-zA-z]表示英文字母集合 [^a-zA-z]表示所有非英文字母集合
-          
表示有序集合的范围
           
例如:[a-g]表示[abcdefg],[0-9]表示[0123456789]

***
第四类:指定字符出现在行首或者行尾
^          
若出现在字符前,表示这个字符在行首出现。
           
例如:^the 表示以The为行首的字符串
$          
若出现在字符后,表示这个字符在行尾出现
           
例如:out$ 表示以out为行尾的字符串
\<         
单词开头
\>         
单词结尾

***
第五类:\ 的用法
\          
有两种含义:
           
使特殊关键字变成普通字符,例如\\代表"\"
           
或使普通字符变成特殊字符,例如:
                 |,(,),d,',`,b,B,<,>,w,W,sc,Sc
之前加上了\,变为特殊字符

           
下面仅讨论几个常用的
\|         
表示"" 例如:is\|it-> ISIs,iS,is,It,it,iT,IT
\( \)           
用来表达正则表达式的范围(就是左右括号,用来规范表达式范围)
           
例如:

\(read\|get\)file->readfile,getfile
                 ba\(na\)*->ba,bana,banana,bananana.....

***
正则表达式的替换文本用法

\&         
表示搜索文本的整个字符串。
           
例如:replace .d \%d 代表在所有满足"?d"格式的文本后面再附加一个d 例如ad替换为add
\num.      
表示搜索文本的地num.个字符串组
           
例如:replace \(a[ad]\)-safe \1 将替换aa-safead,ad-safeaa
\#         
表示替换次数,第一次替换为0,逐次增加
           
例如:replace a[ad] \&\# 将替换aaaa0adad1
\?         
手动输入替换结果 ??????????