Voice Coding, Speech Coding   음성 부호화, 음성 코딩, 음성 압축, 음성 코덱

(2017-07-13)
1. 음성 부호화 (Speech Coding,Voice Coding)

  ㅇ 주로, 전화 음성통신을 위해 음성정보를 가능한 낮은 속도전송할 수 있게 함
     - 크게, 다음 2가지로 구분 가능
        . 광대역 음성 코딩 (Widband Speech Coding)
        . 협대역/전화통화용 코딩 (Narrowband/Telephone Speech Coding)

  ※ 한편, 광대역 오디오 코딩에 대해서는 ☞ 오디오 부호화 참조


2. 음성 부호화 주요 방식 분류파형 부호화 (Waveform Coding, 파형코덱) 
     - 음성신호의 모양 즉, 파형을 기반으로 하는 압축방식 (16 kbps 이상)
        . 종별 : PCM (G.711), DPCM, DM, ADPCM 등

  ㅇ 파원 부호화 (보코딩, Vocoding, 소스코덱)
     - 음성신호 발성모델을 이용하여 특정 파라미터 만을 전송함으로써,
       수신부에서 얼마나 비슷한 소리가 복원되는가에 관심을 갖고 개발된 코딩방식
        . 종별 : LPC, MP-MLQ, AMR 등

  ㅇ 혼합 부호화
     - 위 두 방식의 장점을 결합 (4.8~16 kbps)
        . 종별 : CELP, SBC(Sub-band Coding,대역분할부호화), APC, ATC, RELP, MPLPC


3. 음성 부호화 표준ITU-T 관련 표준  (ITU-T에서 음성부호화 표준을 주도하고 있는 편임)
 
  ※ [범례 :      ① 압축방식   ② 비트율   ③ MOS(Mean Opinion Score)  ④ 사용예

  ㅇ G.711PCM          ② 64 kbps           ③ 4.1            ④ PSTNG.721/G.726ADPCM        ② 32 kbps           ③ 3.85           ④ PSTNG.723/723.1  ① MP-MLQ/ACELP ② 6.3 또는 5.3 kbps ③ 3.9 또는 3.65  ④ VoIPG.728LD-CELP      ② 16 kbps           ③ 3.61           ④ 이동전화G.729/729a   ① CS-ACELP     ②  8 kbps           ③ 3.92           ④ VoIP

  ※ 한편, 방송,음향기기 등에서는 Dolby AC-3, MPEG-2 AAC 등이 주로 사용됨 


4. 음성부호화 구분협대역 음성부호화 
     - PSTN 에서는 300~3,400 Hz의 음성주파수에 대해 전통적으로 단일의 코덱 표준으로써
       G.711(PCM) 을 사용
     - 장거리 국제전화에는 G.726(ADPCM) 이 사용.
     - VoIP패킷망에서의 음성코덱은 G.711, G.723.1, G.729a 등이 사용됨
     - 이동통신에는 G.728 등이 사용됨

  ㅇ 광대역 음성부호화
     - 협대역 보다 넓은 50~7,000 Hz 대역의 음성주파수를 대상
        . 현재의 전화망(PSTN) 대역폭협대역인 300~3400 Hz에 비해,
        . 50~7000 Hz광대역 신호를 대상으로 압축/복원하는 음성부호화 기술을 말함
     - 협대역 신호에 비해,
        . 자연성 높아짐 : 50~300 Hz (저주파영역)
        . 명료성 증가   : 3400~7000 Hz (고주파영역)


[(협대역) 음성 부호화]1. 음성 부호화  2. 파원 부호화(보코딩)  3. LPC  4. CELP  5. AMR  6. EVRC  7. 분해-합성 기법  

 
        최근수정     모바일웹     참고문헌