c 正則表達式教程(c正則表達式語法大全)
Regex(正則表達式)是描述字符序列的強大工具。正則表達式存在于許多語言中,C++11也將正則表達式作為新標準的一部分。
C++regex正則表達式的規(guī)則與其他編程語言類似,如下:
1.校驗字符的表示
1個漢字:^[\u4e00-\u9fa5]{0,}$
2英文和數(shù)字:^[A-Za-z0-9]+$或^[A-Za-z0-9]{4,40}$
3長度為3-20的所有字符:^.{3,20}$
4由26個英文字母組成的字符串:^[A-Za-z]+$
5由26個大寫英文字母組成的字符串:^[A-Z]+$
626個小寫英文字母組成的字符串:^[a-z]+$
7由數(shù)字和26個英文字母組成的字符串:^[A-Za-z0-9]+$
8由數(shù)字、26個英文字母或下劃線組成的字符串:^\w+$或^\w{3,20}$
9中文、英文、數(shù)字包括下劃線:^[\u4E00-\u9FA5A-Za-z0-9_]+$
11可以輸入包含^%,=?$\'的字符及其他字符:[^%,=?$\x22]+
12禁止輸入含有~的字符:[^~\x22]+
2.校驗位的表示
1.n位數(shù)字:^\d{n}$
2.數(shù)字:^[0-9]*$
3.m-n位數(shù)字:^\d{m,n}$
4.至少n位數(shù)字:^\d{n,}$
5.以零和非零開頭的數(shù)字:^(0|[1-9][0-9]*)$
6.以非零開頭且最多保留兩位小數(shù)的數(shù)字:^([1-9][0-9]*)+(.[0-9]{1,2})?$
7.保留1-2位小數(shù)的正數(shù)或負數(shù):^(\-)?\d+(\.\d{1,2})?$
8.正數(shù)、負數(shù)和小數(shù):^(\-|\+)?\d+(\.\d+)?$
9.保留兩位小數(shù)的正實數(shù):^[0-9]+(.[0-9]{2})?$
10.1~3位小數(shù)的正實數(shù):^[0-9]+(.[0-9]{1,3})?$
11.非零正整數(shù):^[1-9]\d*$或^([1-9][0-9]*){1,3}$或^\+?[1-9][0-9]*$
12.非零負整數(shù):^\-[1-9][]0-9'*$或^-[1-9]\d*$
13.非負整數(shù):^\d+$或^[1-9]\d*|0$
14.非正整數(shù):^-[1-9]\d*|0$或^((-\d+)|(0+))$
15.非負浮點數(shù):^\d+(\.\d+)?$或^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$
16.非正浮點數(shù):^((-\d+(\.\d+)?)|(0+(\.0+)?))$或^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$
17.正浮點數(shù):^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$或^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$
18.負浮點數(shù):^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$或^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$
19.浮點數(shù):^(-?\d+)(\.\d+)?$或^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$
3.特殊需求的表達
1、域名:[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.
2.電子郵件地址:^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$
3、手機號碼:^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$
4.InternetURL:[a-zA-z]+://[^\s]*或([\w-]+\.)+[\w-]+(/[\w-./?%=]*)?$
5、國內(nèi)電話(0511-、021-):\d{3}-\d{8}|\d{4}-\d{7}
6.電話號碼('XXX-XXXXXXX'、'XXXX-XXXXXXX'、'XXX-XXXXXXX'、'XXX-XXXXXXX'、'XXXXXXX'和'XXXXXXXXX):^(\(\d{3,4}-)|\d{3.4}-)?\d{7,8}$
7.短身份證號碼(數(shù)字、x結(jié)尾的字母):^([0-9]){7,18}(x|X)?$或^\d{8,18}|[0-9x]{8,18}|[0-9X]{8,18}?$
8、身份證號碼(15位、18位):^\d{15}|\d{18}$
9.賬號是否合法(字母開頭,允許5-16字節(jié),允許字母數(shù)字下劃線):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
10.密碼(以字母開頭,長度在6到18之間,只能包含字母、數(shù)字和下劃線):^[a-zA-Z]\w{5,17}$
11、強密碼(必須包含大小寫字母和數(shù)字的組合,不能使用特殊字符,長度在8-10之間):^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$
12.日期格式:^\d{4}-\d{1,2}-\d{1,2}
13.一年中的12個月(01~09和1~12):^(0?[1-9]|1[0-2])$
14.一個月的31天(01~09和1~31):^((0?[1-9])|((1|2)[0-9])|30|31)$
C++正則表達式函數(shù)共有三個:regex_match、regex_search、regex_replace
regex_match
regex_match是一個正則表達式匹配函數(shù),如下示例所示。
輸出如下:
regex_search
regex_match是另一個正則表達式匹配函數(shù)。以下是regex_search的示例。regex_search和regex_match之間的主要區(qū)別是:regex_match是全字匹配,而regex_search是搜索匹配字符串。
輸出如下:
regex_replace
regex_replace是一個替換正則表達式匹配的內(nèi)容的函數(shù)。以下是regex_replace的示例。
輸出如下:
請注意,在C++中,反斜杠字符(\)將被轉(zhuǎn)義
正則表達式和異常處理
如果我們的正則表達式中有錯誤,標準庫將在運行時拋出regex_error異常。它有一個名為code的成員,用于標記錯誤的類型。具體錯誤值及語義如下表所示:
結(jié)論
每天進步一點,每天消化一點。如果您有更好的想法,歡迎分享。如果您覺得文章寫得不錯,請點個贊吧。