Character Set, Collation   문자 셋, 문자 세트, 콜레이션

(2017-06-10)

문자 인코딩

1. 문자 셋 (Character Set)

  ㅇ 문자를 인코딩하는 규칙 모음
     - 문자 데이터의 저장,전달,서버/클라이언트 상호작용,인쇄 등에 관련되며,
     - 각 단계 마다 상대방과 동일 문자셋이 규정되어야 올바른 해석이 가능함

     - 例) ASCII, 유니코드(UTF-8,UTF-16), euc-kr 등

  ※ ☞ 지역 매개변수(Locale) 참조


2. [데이터베이스]  콜레이션 (Collation)

  ㅇ 특정 문자셋으로 저장된 값들을 데이터베이스에서 `검색,정렬 등의 작업`을 위해
     문자들간에 서로 `비교`할때 사용하는 지정된 문자셋 내의 규칙들의 집합 
     - 주로, CHAR, VARCHAR, TEXT와 같은 문자 데이터 타입을 갖는 칼럼에 대해서 만 필요함

     - MySQL 例) 대소문자가 구분되는 문자셋 등에서 대소문자를 구별할 것인지 여부 등
        . euc-kr(한글)에서는 대소문자 자체를 구별하지 않음
           .. euckr_korean_ci (Case Insentive, ci)

  ※ [참고_웹] ☞ MySQL에서 문자셋(Character Set)과 Collation의 차이


[자료표현(알파벳/코드)] 1. 알파뉴메릭 코드 2. ASCII 코드 3. KSC5601 한글완성형코드표준 4. 유니코드 5. 확장 유닉스 코드(EUC) 6. 문자 셋 7. MSB,LSB 8. Big-endian,Little-endian
[제어 문자]

 
        최근수정     모바일웹     참고문헌