정규표현식 예

(2019-05-11)
1. 정규 표현식 활용 例)

  ㅇ 숫자
     - 0부터 9까지 숫자 하나 :  0|1|2|3|4|5|6|7|8|9 또는 [0123456789] 또는 [0-9] 또는 \d
     - 10에서 19 사이의 숫자 :  \b[1][0-9]\b 또는 \b[1]\d\b
     - 세 자리 숫자          :  [0-9]{3}  ( [0-9]의 숫자 3회 반복 )`
     - 임의 길이의 숫자      :  \d*
     - 5개 숫자 만으로 됨    :  ^\d\d\d\d\d$

  ㅇ 영문 알파벳
     - 임의 길이(0 이상)의 영문 알파벳   :  [A-Za-z]*
     - 값 전체가 영문 알파벳     :  ^[A-Za-z]+$

  ㅇ 모든 문자열 : `.+` 또는 `.*`
     - `.+` : 만일, 빈 문자열이면, 빈 문자열 포함 안하므로, null 형식 반환
     - `.*` : 만일, 빈 문자열이면, 빈 문자열도 포함하므로, 빈 문자열 "" 반환
     - 한편, 문장 중간에, 임의 문자(.)에 해당 안되는 문자(줄바꿈 문자)가 나타나면 매치 중단
     - 例) 문자 A로 끝나는 모든 문자열 : `.+A`,`.*A`

  ㅇ 식별자 (변수명,상수명,함수명 등)
     - [A-Za-z_][A-Za-z0-9_]*
        . 알파벳 문자 또는 `_`로 시작하며, ([A-Za-z_])
        . 알파벳 문자,숫자(디지트),_(언더바)를 조합시킨 문자열로써, ([A-Za-z0-9_])
        . 임의 길이(가변 길이)의 토큰 임 (*)

  ㅇ 단어 여부
     - 특정 완전한 단어 만 :  \b단어\b
        . 여기서, \b는 단어 경계(word boundary)를 의미

  ㅇ html 문서 내 태그 확인
     - 例) <script[^>]*> : <script 문자열에 매치, > 외의 문자가 0회 이상 매치, > 에 매치

  ㅇ /img 
     - 영문 대소문자 구분 없이(/i), 모든 줄에 걸쳐서(/m), 전역 검사(/g)를 함

  ㅇ 한글 여부 
     - 2개 문자가 연속으로 `가-힣`이면 => 한글로 판정 
        . [\xA1-\xFE][\xA1-\xFE] 또는 [가-힣][가-힣]
     - 자음,모음까지 포함하려면, [ㄱ-ㅣ가-힣][ㄱ-ㅣ가-힣]


[정규표현식] 1. 정규 표현식 2. 정규표현 메타 문자 3. 정규표현식 활용 기초 4. 정규표현식 예

 
        최근수정     요약목록     참고문헌