정규표현식 활용 기초

(2021-04-21)

전방 일치, 전방 매치, 후방 일치, 후방 매치


1. 정규표현식 활용 

  ㅇ 주로, 문자열 조작
     - 문자열정규표현식과의 일치 형태(접두사/접미사,전방/후방/완전/부분)에 따라,
       문자열을 조작하는 방법

  ㅇ 정규표현식 사용 목적
     - 프로그래머들에게 정규표현식을 통해 문자열 조작을 좀더 편리하게 사용케하기 위함


2. 문자열 부위의 위치 구분접두사(Prefix) : 선두 문자열
  ㅇ 접미사(Suffix) : 말미 문자열
  ㅇ 부분 문자열(Substring) : 포함된 문자열

  ※ 만일, 문자열 길이가 n 이면,
     - 접두사,접미사 갯수 : (n+1)
     - 부분 문자열 갯수   : n(n+1)/2 + 1 (여기서, 끝에 +1은 공백 문자열 포함)


3. 문자열 일치의 종류

  ㅇ 전방 일치 : 정규표현식이 주어진 문자열접두사(prefix)에 일치

  ㅇ 후방 일치 : 정규표현식이 주어진 문자열의 접미사(suffix)에 일치

  ㅇ 완전 일치 : 정규표현식이 주어진 문자열 전체에 일치 
     - (이 경우는, 문자열 검증에 주로 이용)
     - 완전 일치가 기본일지라도, 앵커 .* 를 이용하면,
       부분일치/전방일치/후방일치 구현 가능
        . 例) regex.* (전방일치), .*regex (후방일치), .*regex.* (부분일치)

  ㅇ 부분 일치 : 정규표현식이 주어진 문자열의 부분 문자열(substring)에 일치
     - (이 경우는 검색,치환에 주로 이용)
     - 부분 일치가 기본일지라도, 앵커 ^,$ 를 이용하면, 
       완전일치/전방일치/후방일치 구현 가능
        . 例) ^regex (전방일치), regex$ (후방일치), ^regex$ (완전일치)


4. 캡처와 치환

  ㅇ 캡처 : 정규표현식을 사용하여 문자열로부터 서브매치를 빼내는 것(추출,저장하는 것)
     - 순서 지정 캡처
        . 처음 서브매치 부터 $1,$2,...,$n번째 형태로, 각각의 서브매치를 추출해서,
        . 후에, 이를 변수로 삼아서 사용할 수 있음
     - 이름 지정 캡처 (named capturing)

  ㅇ 치환 : 정규표현식을 사용하여 서브매치된 부분 문자열을 특정 문자열로 치환하는 것


5. 프로그래밍에서, 정규표현식 활용 기초정규표현식 활용 例  ☞ 정규표현식 예 참조

  ※ 주요 프로그래밍 언어에서 정규표현식 例  ☞ 자바스크립트 정규표현식, PHP 정규표현식 참조
     - 활용 대상 : 문자열 또는 문장
     - 조건 지정 : 정규 표현식(문자열 패턴)
        . 통상, 2개의 슬래시(/) 사이에 `문자열 패턴 식(정규표현식)`을 줌
     - 실행 종류 : 검색, 추출, 치환, 검사 등

[정규표현식]1. 정규 표현식   2. 메타 문자   3. 메타문자 수량자   4. 메타문자 그룹화   5. 메타문자 앵커   6. 정규표현식 활용 기초   7. 정규표현식 예  

  1. Top (분류 펼침)      :     1,594개 분류    6,533건 해설

"본 웹사이트 내 모든 저작물은 원출처를 밝히는 한 자유롭게 사용(상업화포함) 가능합니다"
     [정보통신기술용어해설]       편집·운영 (차재복)