Character Set, Collation   문자 셋, 문자 세트, 콜레이션

(2018-12-15)

문자 집합, Character Encoding, 문자 인코딩

1. 문자 셋 (Character Set) 또는 문자 인코딩 방식 (Character Encoding)

  ㅇ 문자 셋 (Character Set)
     - 지역별/나라별 등으로 달라지는 `문자 집합` 및 그에 관련된 `문자 인코딩 방식`을 총칭

  ㅇ 문자 인코딩 방식 (Character Encoding)
     - 특정 문자 집합인코딩하는 규칙 모음
     - 例) ASCII, ISO 8859, 유니코드(UTF-8,UTF-16), EUC-KR 등

  ※ 문자 데이터의 저장,전달,서버/클라이언트 상호작용,인쇄 등에 관련되며,
     - 각 단계 마다, 상대방과 동일 문자셋(문자 인코딩) 방식이 규정되어야 올바른 해석이 가능

  ※ ☞ 지역 매개변수(Locale) 참조


3. [데이터베이스]  콜레이션 (Collation)

  ㅇ 특정 문자셋으로 저장된 값들을 데이터베이스에서,
     - `검색,정렬 등의 작업`을 위해
     - 문자들간에 서로 `비교`할 때 등에 사용하는
     - 지정된 문자셋 내의 규칙들의 집합 

  ㅇ 주로, CHAR, VARCHAR, TEXT와 같은 문자 데이터 타입을 갖는 칼럼에 대해서 만 필요함

  ㅇ MySQL 例) 대소문자가 구분되는 문자셋 등에서 대소문자를 구별할 것인지 여부 등
     -  euc-kr(한글)에서는 대소문자 자체를 구별하지 않음
        . euckr_korean_ci (Case Insentive, ci)

  ※ [참고_웹] ☞ MySQL에서 문자셋(Character Set)과 Collation의 차이


[자료표현코드] 1. 알파뉴메릭 코드 2. ASCII 코드 3. KSC5601 한글완성형코드표준 4. 유니코드 5. 확장 유닉스 코드(EUC) 6. 문자 셋 7. MSB,LSB 8. Big-endian,Little-endian 9. ISO 8859 문자집합
[제어 문자]
  1.   기술공통
  2.   기초과학
  3.   진동/파동
  4.   방송/멀티미디어/정보이론
  5.   전기전자공학
  6.   통신/네트워킹
  7.   정보기술(IT)
        1. 정보기술
    1.   전산기초
    2.   컴퓨터구조
    3.   프로그래밍
          1. 프로그램,프로그래밍
      1.   프로그래밍 언어론
      2.   구조적 프로그래밍
      3.   객체지향 프로그래밍
      4.   자료표현코드
            1. 알파뉴메릭 코드
            2. ASCII 코드
            3. KSC5601 한글완성형코드표준
            4. 유니코드
            5. 확장 유닉스 코드(EUC)
            6. 문자 셋
            7. MSB,LSB
            8. Big-endian,Little-endian
            9. ISO 8859 문자집합
        1.   제어 문자
      5.   자료구조
      6.   알고리즘
      7.   시스템 소프트웨어
      8.   프로그래밍언어 종류
      9.   프로그래밍 기타일반
    4.   데이터베이스
    5.   소프트웨어 공학
    6.   운영체제
    7.   정보보호/보안
    8.   IT 기타기술
  8.   공업일반(기계,재료등)
  9.   표준/계측/품질
  10.   기술경영

 
        최근수정     요약목록     참고문헌