1. 정규표현식 활용
ㅇ 주로, 문자열 조작
- 문자열이 정규표현식과의 일치 형태(접두사/접미사,전방/후방/완전/부분)에 따라,
문자열을 조작하는 방법
ㅇ 정규표현식 사용 목적
- 프로그래머들에게 정규표현식을 통해 문자열 조작을 좀더 편리하게 사용케하기 위함
2. 문자열 부위의 위치 구분
ㅇ 접두사(Prefix) : 선두 문자열
ㅇ 접미사(Suffix) : 말미 문자열
ㅇ 부분 문자열(Substring) : 포함된 문자열
※ 만일, 문자열 길이가 n 이면,
- 접두사,접미사 갯수 : (n+1)
- 부분 문자열 갯수 : n(n+1)/2 + 1 (여기서, 끝에 +1은 공백 문자열 포함)
3. 문자열 일치의 종류
ㅇ 전방 일치 : 정규표현식이 주어진 문자열의 접두사(prefix)에 일치
ㅇ 후방 일치 : 정규표현식이 주어진 문자열의 접미사(suffix)에 일치
ㅇ 완전 일치 : 정규표현식이 주어진 문자열 전체에 일치
- (이 경우는, 문자열 검증에 주로 이용)
- 완전 일치가 기본일지라도, 앵커 .* 를 이용하면,
부분일치/전방일치/후방일치 구현 가능
. 例) regex.* (전방일치), .*regex (후방일치), .*regex.* (부분일치)
ㅇ 부분 일치 : 정규표현식이 주어진 문자열의 부분 문자열(substring)에 일치
- (이 경우는 검색,치환에 주로 이용)
- 부분 일치가 기본일지라도, 앵커 ^,$ 를 이용하면,
완전일치/전방일치/후방일치 구현 가능
. 例) ^regex (전방일치), regex$ (후방일치), ^regex$ (완전일치)
4. 캡처와 치환
ㅇ 캡처 : 정규표현식을 사용하여 문자열로부터 서브매치를 빼내는 것(추출,저장하는 것)
- 순서 지정 캡처
. 처음 서브매치 부터 $1,$2,...,$n번째 형태로, 각각의 서브매치를 추출해서,
. 후에, 이를 변수로 삼아서 사용할 수 있음
- 이름 지정 캡처 (named capturing)
ㅇ 치환 : 정규표현식을 사용하여 서브매치된 부분 문자열을 특정 문자열로 치환하는 것
5. 프로그래밍에서, 정규표현식 활용 기초
※ 정규표현식 활용 例 ☞ 정규표현식 예 참조
※ 주요 프로그래밍 언어에서 정규표현식 例 ☞ 자바스크립트 정규표현식, PHP 정규표현식 참조
- 활용 대상 : 문자열 또는 문장
- 조건 지정 : 정규 표현식(문자열 패턴)
. 통상, 2개의 슬래시(/) 사이에 `문자열 패턴 식(정규표현식)`을 줌
- 실행 종류 : 검색, 추출, 치환, 검사 등