[JS] 正則表達式(Regular Expression, regex) - PJCHENder
文章推薦指數: 80 %
[JS] 正則表達式(Regular Expression, regex). 'str'.match(/[0-9]+ ...
Skiptomaincontent這個網站放置的是未發佈或未完整整理的筆記內容,若想檢視正式的筆記內容請到PJCHENder那些沒告訴你的小細節。 /g,'
PJCHENderOfficialDocsBlogGitHubFacebookLinkedinSearchJavaScript[JS]regexOnthispage'str'.match(/[0-9]+/);//1次以上的數字,等同於"\d"'str'.match(/[A-Za-z]+/);//1次以上的英文字'str'.match(/[A-Za-z0-9_]+/);//1次以上的英數字含底線,等同於"\w"'str'.match(/.+/);//1次以上的任意字元*表示前一個字元可以是0個或多個,例如/ab*c/,因此ac,abc,abbbbc都符合規則。
+表示前一個字元可以是1個或多個,例如/a+b/,ab,aaaaab都符合規則。
?表示前一個字元可以是0個或1個^匹配輸入的開頭,例如/^a/,adog會符合,但cats中的a不會。
$匹配輸入的結尾,例如/t$/,eat會符合,但eaten中的t不會。
.用來表示任意字元[email protected]@MDN-JavaScriptGuidesRegularExpression@MDN-ReferenceIhateregex:可以找到許多常用的regex範例常用正規表達式建立正規式正則表達式的規則稱作pattern。
在JavaScript中可以透過Regularexpressionliterals的方式或建構式的方式來建立regularexpressionspattern:Regularexpressionliterals/***Regularexpressionliterals:script載入時即編譯*當pattern不會改變時,使用此方式定義pattern效能較好。
**/varre=/ab+c/;FunctionConstructor/***FunctionconstructorforRegExpobject:程式執行過程才會被編譯*效能較差,適合用在regularexpressionpattern可能會改變時使用**/varre=newRegExp('ab+c');varmyRe=newRegExp('d(b+)d','g');Regularexpressionliterals效能較好,適合pattern不會改變的情況;FunctionConstructor效能較差,適合用在pattern可能動態改變的情況。
使用正規式在JavaScript中可以使用正規式的函式包含RegExp.prototype.test():搜尋字串中是否有符合的部分,回傳true/false。
RegExp.prototype.exec():以陣列回傳字串中匹配到的部分,否則回傳null。
String.prototype.match():以陣列回傳字串中匹配到的部分,否則回傳null。
String.prototype.replace():尋找字串中匹配的部分,並取代之。
String.prototype.search():尋找字串中是否有符合的部分,有的話回傳index,否則回傳-1。
String.prototype.split():在字串根據匹配到的項目拆成陣列。
簡單來說,當你想要看字串是否包含某pattern時,使用test或search;想要更多的資訊(花較多耗效能),則使用exec或match。
String.prototype.replace():取代內容使用String.prototype.replace(regex|substr,newSubstr)來置換內容,這個方法會回傳置換後的新字串,不會改變原本的字串://只接把regex寫在裡面newString=
如果這個regexp的pattern不包含g標籤,那麼str.match()回傳的結果和RegExp.exec()是一樣的,在回傳的陣列中會包含:input屬性:原本被解析的字串index屬性:第一個被找的字串的index值所有配對的結果/*不包含g的話,結果和RegExp.exec()一樣*/letmatchedResult='Anappleaday,keepsappleaway.'.match(/(a.)(p.)e/);//['apple','ap','pl',index:3,input:'Anappleaday,keepsappleaway.']如果pattern中包含g的話,那麼回傳的陣列中會直接是整個被matched到的字:/*包含g的話,會直接回傳配對到的結果*/letmatchedResult='Anappleaday,keepsappleaway.'.match(/(a.)(p.)e/g);//['apple','apple']若給入一個非regexp的物件,則會自動透過newRegExp(obj)轉換;若沒有代入任何參數的話,則會得到帶有空字串的陣列([""])。
使用範例每個()會變成一個$letmatchedResult='Anappleaday'.match(/(a.)(p.)e/);RegExp.$1;//apRegExp.$2;//pl'banana'.match(/(.)(a)/g);//['ba','na','na']//$1=['b','n','n']//$2=['a','a','a']//"/"是特殊字元要用反斜線'2017/05/16'.match(/(.*)\/(.*)\/(.*)/);//['2017/05/16','2017','05','16']'2017/05/16'.match(/.*\/.*\/.*/);//['2017/05/16']/***擷取網址中的內容**/leturl='https://www.ptt.cc/bbs/CodeJob/M.1513840968.A.F93.html'lettimestamp=url.match(/\/M\.(.+)\.A/)console.log(timestamp[1])//1513840968//resultoftimestamp['/M.1513840968.A',//該正規式會匹配到的內容'1513840968',//透過match()選取到的內容index:30,//從哪個index開始批配到input:'https://www.ptt.cc/bbs/CodeJob/M.1513840968.A.F93.html'//輸入的內容]搭配filter篩選結果搭配Array.prototype.filter我們就可以根據使用者輸入的內容(wordToMatch)來從cities中篩選資料:functionfindMatch(wordToMatch,cities){returncities.filter((place)=>{/***g:globalsearch*i:caseinsensitivesearch**/letregex=newRegExp(wordToMatch,'gi');returnplace.city.match(regex)||place.state.match(regex);});}[JS30]Day06:AJAXTypeAheadString.prototype.search():檢驗字串是否包含varstr='heyJudE';varre=/[A-Z]/g;varre2=/[.]/g;console.log(str.search(re));//returns4,whichistheindexofthefirstcapitalletter"J"console.log(str.search(re2));//returns-1cannotfind'.'dotpunctuationRegExp.prototype.test():檢驗字串是否包含//判斷是不是數值/^[0-9]+$/.test(
在ES2018中則可以使用(?
使用?:這可以把group起來,但不需要用到的內容隱藏起來(shygroup)。
搭配replace使用在replace後面可以接function,在這個function則可以直接取得配對到的內容和分組的結果:conststr='War&Peace';constresult=str.replace(/(?
varregex=/.a/;//任何一個字元後加上a多個字元[]//小寫a或大寫Avarregex=/[aA]/;//匹配所有不是a或A的字varregex=/[^aA]/;//a,e,i,o,u都會matchvarregex=/[aeiou]/;//英文字母varregex=/[a-z]/;//所有小寫的字母,從小寫a到小寫zvarregex=/[A-Z]/;//所有大寫的字母,從大寫A到大寫Zvarregex=/[a-zA-Z]/;//所有英文字母//數字5~8varregex=/[5-8]/;括號():套用到所有varregex=/^a|^the|^an/;//套用到裡面所有的varregex=/^(a|the|an)/;//等同於不是(除了)^/*不是a都會match*/varregex=/[^a]/;/*不是數字都會match*/varregex=/[^0-9]/;多個字元縮寫keywords:\d,\w,\s,\b,\D,\W,\S\d:digit,[0-9]\w:word,包含英文大小寫、數字、底線,[A-Za-z0-9_]\s:space,包含space,tab,formfeed,linefeed,[\f\n\r\t\v\u00a0\u1680\u2000-\u200a\u2028\u2029\u202f\u205f\u3000\ufeff]\D:不是digit,等同於[^\d]\W:不是word[^\w]\S:不是space[^\s]/*所有word+e*/varregex=/\we/;/*連續兩個任意的數值*/varregex=/\d\d/;/*句子中結尾為s的單字*/varregex=/s\b/;varregex=/\b[a-z]/g;//句子中各個單字的第一個字母其他特殊字元\t:tab\b:wordboundary,用來比對單字和單字間的空白,/s\b/則會比對句子中最一個字母是s的單字Wordboundary\b,\B透過\b可以配對wordboundary,wordboundary指的是一個字元的前後沒有其他任何字元。
要注意\b和[\b]是不一樣的,[\b]是用來配對backspace。
//is這個單字才會被選到,Th`is`的is不會letmatchedResult='Thisisanapple.'.match(/\bis\b/);//['is',index:5,input:'Thisisanapple.']相反地,\B則是non-wordboundary,包含:Beforethefirstcharacterofthestring,ifthefirstcharacterisnotawordcharacter.Afterthelastcharacterofthestring,ifthelastcharacterisnotawordcharacter.BetweentwowordcharactersBetweentwonon-wordcharactersTheemptystring//使用\B會配對到This中的isletmatchedResult='Thisisanapple.'.match(/\Bis/);//['is',index:2,input:'Thisisanapple.']出現次數*+?{}{,}keywords:*,+,?,{次數},{最少次數,最多次數}*:任意次數,等同於{0,}+:至少一次(後面要跟著),等同於{1,}?:零或一次(有或沒有),等同於{0,1}{次數}*{最少次數,最多次數}**varregex=/abc/;//找到符合"abc"varregex=/ab*c/;//*表示前一個單字可以是0個或多個,因此ac,abc,abbbbc都符合規則varregex=/n?a/;//n可有可無varregex=/a{2}/;//a要2次,所以會是avarregex=/a{2,4}/;//a介於2次到4次之間varregex=/a{2,}/;//2次以上的a都可以,大括號後面不要有空格varregex=/(hello){4}/;//4次的hello,hellohellohellohellovarregex=/\d{3}/;//3次的數字開頭與結尾keywords:^^開頭$結尾/*以A開頭的字才會匹配到*//^A/gm.test('Abc');//true/^A/gm.test('bac');//false/*開頭有He*/varregex=/^He/;/*結尾有llo*/varregex=/llo$/;/*開頭He結尾llo中間任意字元可以有任意次數*/varregex=/^He.*llo$/;或|//and或android,match到`and`roid就不match`android`varregex=/and|android/;//match到android還是會matchandvarregex=/android|and/;LookAroundAssertionskeywords:x(?=y),x(?!y)Lookaheadassertions:x(?=y),x(?!y)Lookbehindassertions:(?<=y)x,(?]*,匹配除了>以外的其他內容varregex=/]*>(.*?)/g;筆記來源5/1719:30承億主講regularexpression@線上讀書會RegularExpressReference@MDN-GlobalObjectReferenceRegularExpressionGuide@MDN-JavaScriptGuidesregexCheatSheet@GistNewJavaScriptFeaturesThatWillChangeHowYouWriteRegex@SmashingMagazinePrevious[JS]proxyNext[JS]set建立正規式使用正規式String.prototype.replace():取代內容String.prototype.match:尋找並取出內容String.prototype.search():檢驗字串是否包含RegExp.prototype.test():檢驗字串是否包含RegExp.prototype.exec:尋找並取出內容使用RegExp.$1來取得配對到的值群組與命名群組(GroupandNamedCaptureGroup)命名群組(namedgroup)搭配replace使用SampleCode特殊字元(character)標籤(flag)普通字元//反斜線任意一個字元.多個字元[]括號():套用到所有不是(除了)^多個字元縮寫出現次數*+?{}{,}開頭與結尾或|LookAroundAssertionsBackreferences貪婪模式(GreedyMode)常用例子西元生日身份證字號GMAIL網址(URL)HTML標籤筆記來源
延伸文章資訊
- 1[Javascript]常用正則表達式及驗證| Ting I 的程式碼集中營- 點部落
正規表示式(英語:Regular Expression,在代碼中常簡寫為regex、regexp或RE)是使用單個字串來描述、符合一系列符合某個句法規則的字串。
- 2[JS] 正則表達式(Regular Expression, regex) - PJCHENder
[JS] 正則表達式(Regular Expression, regex). 'str'.match(/[0-9]+ ...
- 33-15:正規表示法:表單資料驗證
「正規表示法」或「正規式」(Regular expressions)是在UNIX 世界中發展出來的字 ... Netscape 及IE 在第四版後都支援JavaScript 的正規表示法,特別適...
- 4學JS的心路歷程Day12-正規表達式Regular Expression
今天我們來看正規表達式,在談到為什麼需要多學這個之前,先來看個範例。 假設需要判斷輸入字串是否含有 "apple" : var text="A apple a day keeps the doc...
- 5十五分鐘認識正規表達式,解決所有文字難題
正規表達式(Regular Expression),是一種用來描述字串 符合某個語法規則 的 ... 的程式語言中都支援正規表達式的使用,以下範例將以Javascript 為例。