Voice Coding, Speech Coding   음성 부호화, 음성 코딩, 음성 압축, 음성 코덱

(2021-03-09)
1. 음성 부호화 (Speech Coding,Voice Coding)

  ㅇ 주로, 전화 음성 통신을 위해, 음성 정보를 가능한 낮은 속도전송할 수 있게 함


2. 음성 부호화의 구분/특징협대역 음성부호화 (Narrowband/Telephone Speech Coding)
     - 전통적인 PSTN 에서는, G.711(PCM)
        . 300~3,400 Hz음성주파수에 대해 전통적으로 단일의 코덱 표준 G.711(PCM) 을 사용
     - 장거리 국제전화는,  G.726(ADPCM)
     - VoIP패킷망은,  G.711, G.723.1, G.729a 등
     - 이동통신은,  G.728 등

  ㅇ 광대역 음성부호화 (Widband Speech Coding)
     - 협대역 보다 넓은 50~7,000 Hz 대역음성주파수를 대상
        . 현재의 전화망(PSTN) 대역폭협대역인 300~3400 Hz에 비해,
        . 50~7000 Hz광대역 신호를 대상으로 압축/복원하는 음성부호화 기술을 말함
     - 협대역 신호에 비해,
        . 자연성 높아짐 : 50~300 Hz (저주파영역)
        . 명료성 증가   : 3400~7000 Hz (고주파영역)

  ※ 한편, 광대역 오디오 코딩에 대해서는 ☞ 오디오 부호화 참조


3. 음성오디오 부호화시 주요 파라미터의 개략적인 값 例

  ※ [범례 : ① 대역폭(Hz) ② 샘플링주파수(kHz) ③ 양자화비트비트율(kbps)]
                                              
  ㅇ 전화 음성 통신  :  ① 300~3400   ② 8 kHz    ③ 12, 13     ④ 64, 96, 104 kbps
  ㅇ FM 라디오방송   :  ① 50~7000    ② 16 kHz   ③ 12, 13     ④ 224, 240 kbps
  ㅇ TV 스테레오     :  ① 30~15000   ② 32 kHz   ③ 16         ④ 512 kbps
  ㅇ audio CD Player :  ① 20~20000   ② 44.1 kHz ③ 16         ④ 706 kbps
  ㅇ 전문가 오디오   :  ① 10~22000   ② 48 kHz   ③ 20,24 이상 ④ 1152 kbps


4. 음성 부호화의 방식 구분파형 부호화 (Waveform Coding, 파형코덱) 
     - 음성신호의 모양 즉, 파형을 기반으로 하는 압축방식 (16 kbps 이상)
        . 무 압축 : PCM (G.711)
        . 신호 상관성을 이용한 일부 압축 : DPCM, DM, ADPCM (G.726) 등

  ㅇ 파원 부호화 (보코딩, Vocoding, 소스코덱)
     - 음성신호 발성모델을 이용 
        . 송신부 : 특정 파라미터 만을 전송하고,
        . 수신부 : 이들 파리미터에 의해 얼마나 비슷한 소리로 복원시키는 것에 초점을 둔 코딩방식
     - 종별 : LPC, MP-MLQ, AMR 등

  ㅇ 혼합 부호화
     - 위 두 방식의 장점을 결합 (4.8~16 kbps)
        . 종별 : CELP, SBC(Sub-band Coding,대역분할부호화), APC, ATC, RELP, MPLPC


5. 음성 부호화의 표준ITU-T 관련 표준  (ITU-T에서 음성부호화 표준을 주도하고 있는 편임)
 
  ※ [범례 :      ① 음성코딩   ② 비트율   ③ MOS(Mean Opinion Score)  ④ 사용예

  ㅇ G.711PCM64 kbps           ③ 4.1            ④ PSTNG.721/G.726ADPCM        ② 32 kbps           ③ 3.85           ④ PSTNG.723/723.1  ① MP-MLQ/ACELP ② 6.3 또는 5.3 kbps ③ 3.9 또는 3.65  ④ VoIPG.728LD-CELP      ② 16 kbps           ③ 3.61           ④ 이동전화G.729/729a   ① CS-ACELP     ②  8 kbps           ③ 3.92           ④ VoIP

  ※ 한편, 방송,음향기기 등에서는 Dolby AC-3, MPEG-2 AAC 등이 주로 사용됨


[(협대역) 음성 부호화] 1. 음성 부호화 2. 파원 부호화(보코딩) 3. LPC 4. CELP 5. AMR 6. EVRC 7. 분해-합성 기법
[ITU 음성부호화 표준]
  1.   기술공통
  2.   기초과학
  3.   진동/파동
  4.   전기전자공학
  5.   방송/멀티미디어/정보이론
    1.   비디오
    2.   오디오
    3.   멀티미디어
    4.   방송
    5.   디스플레이
    6.   조명
    7.   정보이론/코딩
      1.   정보이론
      2.   코드이론
      3.   부호화
      4.   소스부호화
        1.   소스부호화 (기초)
        2.   영상 부호화
        3.   오디오 부호화
              1. 오디오 부호화
              2. 부대역 부호화(SBC)
          1.   파형 부호화
          2.   (광대역) 오디오 부호화
          3.   (협대역) 음성 부호화
                1. 음성 부호화
                2. 파원 부호화(보코딩)
                3. LPC
                4. CELP
                5. AMR
                6. EVRC
                7. 분해-합성 기법
            1.   ITU 음성부호화 표준
      5.   채널부호화
  6.   통신/네트워킹
  7.   정보기술(IT)
  8.   공학(역학,기계,재료등)
  9.   설계/표준/계측/품질
  10.   기술경영

 
        최근수정     요약목록     참고문헌