1. 오디오 코딩 (Audio Coding), 오디오 압축 (Audio Compression) 이란?
ㅇ 오디오 신호의 디지털 변환(표본화,양자화,부호화),압축,표현,복원 기술을 말함
※ (의미)
- 낮은 비트율 코딩을 통해, 디지털 오디오를 위한 수많은 응용 프로그램이 가능해짐
- 무한한 저장 용량과 무제한 대역폭의 세계는 비 현실적임. 저장,대역폭은 비용을 수반함.
- 오디오 품질을 유지하면서, 낮은 비트율을 가능케 하는 것이, 사실상 코딩의 영역임
2. 오디오 부호화의 구분
ㅇ 오디오 신호의 분해-합성 모델에 따른 부호화 구분
- Linear Prediction (선형 예측 부호화)
. 例) CELP(QCELP, LD-CELP) 등
- Transform (변환 부호화)
- Subband (서브밴드 부호화)
- Sinusoidal (파형 부호화)
. 例) PCM, DPCM, ADPCM, DM 등
ㅇ 손실/무손실 여부에 따른 부호화 구분
- 무손실 부호화 (Lossless)
. 압축율 2:1 ~ 4:1
. 例) DVD 오디오 등에 사용되는 MLP,DSD 등
- 손실 부호화 (Lossy)
. 압축율 10:1 ~ 25:1
. 例) MPEG 오디오 부호화(MPEG-1 오디오 : MP3,MPEG-2 오디오 : AAC), Dolby AC-3, DTS CA 등
ㅇ 대역별에 따른 오디오 부호화 구분 (☞ 아래 3.항 참조)
- (협대역) 음성 코딩
- (광대역) 음성 코딩
3. 오디오 부호화의 대역별 형태
ㅇ (협대역) 음성 코딩 (Narrowband/Telephone Speech Coding)
- 300~3400 Hz 대역을 대상으로 하는 전통적인 전화 음성 통신용 코딩 기술
. 주로, 전화 음성 통신을 위해 음성 정보를 가능한 낮은 속도로도 전송할 수 있게 함
ㅇ (광대역) 음성 코딩 (Widband Speech Coding)
- 협대역 보다 넓은 50~7,000 Hz 대역의 음성주파수를 대상
. 현재의 전화망(PSTN) 대역폭이 협대역인 300~3400 Hz에 비해,
. 50~7000 Hz의 광대역 신호를 대상으로 압축/복원하는 음성부호화 기술을 말함
- 협대역 음성 신호에 비해,
. 자연성 높아짐 : 50~300 Hz (저주파영역)
. 명료성 증가 : 3400~7000 Hz (고주파영역)
ㅇ 광대역 오디오 코딩 (Wideband Audio Coding)
- 20 kHz 정도 또는 그 이상의 대역폭 및 다 채널 오디오를 지원하는 오디오 코딩 방식
. 일명, Hi-Fi(충실도 높은 고급의 오디오 장치를 일컬음) 표현을 위함
4. 오디오 (압축) 부호화의 여러 이론/모델들
ㅇ 음성 부호화 (Speech Coding)
- 例) 파원 부호화, 파라미터 부호화 등
- 음성 전화통신 등에 많이 쓰이는 방식
. 음성 발생 과정을 모델링하여 그 특징을 파라미터화하는 방식으로 부호화
ㅇ 지각 부호화 (Perceptual Coding)
- 例) 심리음향적 코딩, 서브밴드 코딩(부대역 부호화) 등
- MPEG-1 오디오,MPEG-2 오디오 등 Hi-Fi 음향기기에 많이 쓰이는 방식
. 청각에 감지되지 않는 신호 정보를 제거하거나 적게 양자화 비트 할당을 하는 등
. 즉, 가청문턱치 이하 레벨은 양자화 해도 들리지 않으므로 아예 부호화하지 않는 등으로
데이터 량을 줄임
5. 오디오 부호화시 주요 파라미터 및 개략적인 값 例
※ [범례 : ① 대역폭(Hz) ② 샘플링주파수(kHz) ③ 양자화비트 ④ 비트율(kbps)]
ㅇ 전화 음성 통신 : ① 300~3400 ② 8 kHz ③ 12, 13 ④ 64, 96, 104 kbps
ㅇ FM 라디오방송 : ① 50~7000 ② 16 kHz ③ 12, 13 ④ 224, 240 kbps
ㅇ TV 스테레오 : ① 30~15000 ② 32 kHz ③ 16 ④ 512 kbps
ㅇ audio CD Player : ① 20~20000 ② 44.1 kHz ③ 16 ④ 706 kbps
ㅇ 전문가 오디오 : ① 10~22000 ② 48 kHz ③ 20,24 이상 ④ 1152 kbps