Delayless MDCT for Scalable Speech Codec

계층구조 음성 부호화기를 위한 지연 없는 MDCT 구조

  • 성호상 (삼성종합기술원 Computing Lab.) ;
  • 박호종 (광운대학교 전자공학과)
  • Published : 2007.04.30

Abstract

A high-Performance scalable speech codec generally requires a very low-rate first layer and a fine granule second layer, and this codec can be implemented with the harmonic codec and the MDCT-based transform codec for each layer. In this structure, however. each codec requires independent frequency transform and the time delay of each codec is accumulated. resulting in long time delay for the overall codec. In this paper, new MDCT structure in the second layer is Proposed. where MDCT is forced to share the look-ahead region of the first layer in order to prevent the time delay accumulation and the resulting functional error of MDCT is analyzed and removed after IMDCT The Proposed delayless MDCT requires no additional bits and Provides the equivalent coding performance with the reduced time delay, yielding a meaningful enhancement of the overall codec.

고성능 계층구조 음성 부호화기는 매우 낮은 전송율의 1차 계층과 미세 계층구조를 가지는 2차 계층을 요구하고, 이는 각 계층에서 하모닉 부호화기와 MDCT 기반 변환 부호화기를 사용하여 구현할 수 있다. 그러나 이 구조는 하모닉 부호화기와 변환부호화기에서 각각 독립적인 주파수 변환이 필요하고 각 변환에서 발생하는 시간지연이 누적되어 전체 부호화기의 시간지연이 증가하는 문제를 가진다. 본 논문에서는 시간지연이 누적되는 문제를 해결하기 위하여 2차 계층의 MDCT가 1차 계층의 Look-Ahead 영역을 공유하도록 하고 이 때 발생하는 MDCT 동작의 오류를 분석하고 이 성분을 IMDCT출력에서 제거하는 새로운 MDCT동작 구조를 제안한다 제안한 지연 없는 MDCT구조를 위하여 추가로 전송할 정보는 없으며 동등한 부호화 성능을 유지하면서 시간지연을 감소시켜 부호화기 성능을 크게 향상시킨다.

Keywords

References

  1. A. McCree, 'A 14kbps wideband speech coder with a parametric highband model: Proc. IEEE ICASSP, 1153-1156, 2000
  2. K. Koishida, V Cuperrnan and A. Gersho, 'A 16-kbit/s bandwidth scalable audio coder band on the G.729 standard: Proc. IEEE ICASSP, 1149-1152,2002
  3. Kyung Tae Kim, Sung Kyo June, Young Cheal Park, and Dae Hee Youn, 'A new bandwidth scalable wideband speech/audio coder', Proc. IEEE ICASSP, 657-660, 2002
  4. 이우석, 박호종, 손창용, 이영범, '대역폭 계층 구조의 광대역 음성 부호화기 개발,' 한국음향학회지, 23 (6) 400-406, 2004.8
  5. ITU G. 729.1, G.729 based embedded variable bit-rate coder : An 8-32kbit/s scalable wideband coder bitstream interoperable vvith G. 729, 2006
  6. D. W. Griffin and J. S. Lim, 'Multi-band excitation vocoder,' IEEE Trans. on Acoustics, Speech and Signal Processing, 36 (8) Aug., 1988
  7. ISO/IEC 14496-3 Subpart 2, Speech Coding - HVXC (Harmonic Vector eXcitation Coding), 1999
  8. ISO/IEC 13818-7, Advanced Speech Coding (AAC), 1997