Character Set, Collation   문자 셋, 문자 세트, 콜레이션

(2018-11-19)

문자 집합, Character Encoding, 문자 인코딩

1. 문자 셋 (Character Set) 또는 문자 인코딩 방식 (Character Encoding)

  ㅇ 문자 셋 (Character Set)
     - 지역별/나라별 등으로 달라지는 문자 집합 및 그에 관련된 문자 인코딩 방식을 총칭

  ㅇ 문자 인코딩 방식 (Character Encoding)
     - 특정 문자 집합인코딩하는 규칙 모음
     - 例) ASCII, 유니코드(UTF-8,UTF-16), EUC-KR 등

  ※ 문자 데이터의 저장,전달,서버/클라이언트 상호작용,인쇄 등에 관련되며,
     - 각 단계 마다, 상대방과 동일 문자셋(문자 인코딩) 방식이 규정되어야 올바른 해석이 가능

  ※ ☞ 지역 매개변수(Locale) 참조


3. [데이터베이스]  콜레이션 (Collation)

  ㅇ 특정 문자셋으로 저장된 값들을 데이터베이스에서,
     - `검색,정렬 등의 작업`을 위해
     - 문자들간에 서로 `비교`할 때 등에 사용하는
     - 지정된 문자셋 내의 규칙들의 집합 

  ㅇ 주로, CHAR, VARCHAR, TEXT와 같은 문자 데이터 타입을 갖는 칼럼에 대해서 만 필요함

  ㅇ MySQL 例) 대소문자가 구분되는 문자셋 등에서 대소문자를 구별할 것인지 여부 등
     -  euc-kr(한글)에서는 대소문자 자체를 구별하지 않음
        . euckr_korean_ci (Case Insentive, ci)

  ※ [참고_웹] ☞ MySQL에서 문자셋(Character Set)과 Collation의 차이


[자료표현(알파벳/코드)] 1. 알파뉴메릭 코드 2. ASCII 코드 3. KSC5601 한글완성형코드표준 4. 유니코드 5. 확장 유닉스 코드(EUC) 6. 문자 셋 7. MSB,LSB 8. Big-endian,Little-endian
[제어 문자]

 
        최근수정     요약목록(시험중)     참고문헌