Character Set, Collation   문자 셋, 문자 세트, 콜레이션

(2018-06-29)

문자 집합, 문자 인코딩

1. 문자 셋 (Character Set)

  ㅇ 문자를 인코딩하는 규칙 모음
     - 문자 데이터의 저장,전달,서버/클라이언트 상호작용,인쇄 등에 관련되며,
     - 각 단계 마다, 상대방과 동일 문자셋이 규정되어야 올바른 해석이 가능함

     - 例) ASCII, 유니코드(UTF-8,UTF-16), EUC-KR 등

  ※ ☞ 지역 매개변수(Locale) 참조


2. [데이터베이스]  콜레이션 (Collation)

  ㅇ 특정 문자셋으로 저장된 값들을 데이터베이스에서,
     - `검색,정렬 등의 작업`을 위해
     - 문자들간에 서로 `비교`할 때 등에 사용하는
     - 지정된 문자셋 내의 규칙들의 집합 

  ㅇ 주로, CHAR, VARCHAR, TEXT와 같은 문자 데이터 타입을 갖는 칼럼에 대해서 만 필요함

  ㅇ MySQL 例) 대소문자가 구분되는 문자셋 등에서 대소문자를 구별할 것인지 여부 등
     -  euc-kr(한글)에서는 대소문자 자체를 구별하지 않음
        . euckr_korean_ci (Case Insentive, ci)

  ※ [참고_웹] ☞ MySQL에서 문자셋(Character Set)과 Collation의 차이


[자료표현(알파벳/코드)] 1. 알파뉴메릭 코드 2. ASCII 코드 3. KSC5601 한글완성형코드표준 4. 유니코드 5. 확장 유닉스 코드(EUC) 6. 문자 셋 7. MSB,LSB 8. Big-endian,Little-endian
[제어 문자]
  1.   기술공통
  2.   기초과학
  3.   진동/파동
  4.   방송/멀티미디어/정보이론
  5.   전기전자공학
  6.   통신/네트워킹
  7.   정보기술(IT)
        1. 정보기술
    1.   전산기초
    2.   컴퓨터구조
    3.   프로그래밍
          1. 프로그램,프로그래밍
      1.   프로그래밍 언어론
      2.   객체지향
      3.   자료구조
      4.   알고리즘
      5.   자료표현(알파벳/코드)
            1. 알파뉴메릭 코드
            2. ASCII 코드
            3. KSC5601 한글완성형코드표준
            4. 유니코드
            5. 확장 유닉스 코드(EUC)
            6. 문자 셋
            7. MSB,LSB
            8. Big-endian,Little-endian
        1.   제어 문자
      6.   시스템 소프트웨어
      7.   프로그래밍언어 종류
      8.   프로그래밍 기타일반
    4.   데이터베이스
    5.   소프트웨어 공학
    6.   운영체제
    7.   정보보호/보안
    8.   IT 기타기술
  8.   공업일반(기계,재료등)
  9.   표준/계측/품질
  10.   기술경영

 
        최근수정     요약목록(시험중)     참고문헌