New Codebook Structure For A High-Quality CELP Speech Coder

고성능 CELP 음성 압축기를 위한 새로운 코드북 구조

  • Published : 1998.02.01

Abstract

본 논문에서는 고성능 CELP 음성 압축기를 위한 "Boaseline 코드벡터"와 "Implied 코드벡터"로 구성되는 새로운 구조의 코드북을 제안한다. Implied 코드벡터는 피치 주기 이 전의 합성음으로부터 구하여지며 여기(勵起)신호의 피치 구조를 강화하여 합성음의 음질을 향상시킨다. Implied 코드벡터는 전달되지 않고 인코더 및 디코더에서 각각 합성음을 이용 하여 독립적으로 구하여진다. 또한 펄스와 랜덤 성분을 모두 가지는 복합 여기방식을 이용 하여 음질을 더욱 향상시킨다. 제안된 코드북 구조를 이용하여 10msec프레임을 가지는 8kbps CELP 음성 압축기를 설계하여 하나의 DSP칩에 실시간 구현 하였고, 이것의 성능을 SNRseg와 MOS로 측정하였다. 평균 SNRseg는 12.14dB로 CS-ACELP의 SNRseg보다 6dB 높고, 조용한 환경에서의 MOS는 3.80으로 G.729 CS-ACELP의 MOS보다 0.02 높다.

Keywords

References

  1. J. Acoustic Society of America v.50 Speech analysis and synthesis by linear prediction of the speech waver B. S. Atal;S. L. Hanauer
  2. Speech Technology The government standard linear predictive coding algorithm:LPC-10 T. E. Tremain
  3. Proc. IEEE IC ASSP-85 Code-excited linear prediction:High quality speech at very low rates M. R. Schroeder;B. S. Atal
  4. ITU Recommendation G.728:Coding of speech at 16kbit/s using Low-Delay Code Excited Linear Prediction
  5. ITU Recommendation G.729: Coding of speech at 8kbit/s using Conjugate-Structure Algebratic-Code-Excited Linear Predictive(CS-ACELP)
  6. Proc. IEEE IC ASSP-90 Vector sum excited linear prediction(VSELP) speech coding at 8kb/s I. Gerson;M. Jansiuk
  7. TIA/EIA/IS-96A Speech Service Option Standard for Wideband Spectrum Digital Cellular System
  8. TIA/EIA/IS-127 Enhanced Variable Rate Codec, Speech Service Option 3 for Wideband Spread Specturm Digital System
  9. IEEE Journal on Selected Areas in Communications v.13 Design of a pitch synchronous innovation CELP coder for mobile communications K. Mano (et al.)
  10. J. Acoust. Soc. Amer. v.64 A mixed-source model for speech compression and synthesis J. Makhoul;R. Viswanathan;R. Schwartz;A. W. F. Huggins
  11. IEEE Trans. Acoustics, Speech and Signal Processing v.32 An enhanced LPC vocoder with no voiced/unvoiced switch S. Y. Kwon;A. J. Goldberg
  12. GSM 06.60 Enhanced Full Rate(EFR) speech transcoding