A Study on Trend Sharing in Segmental-feature HMM

분절 특징 은닉 마코프 모델에서의 경향 공유에 관한 연구

  • 윤영선 (한남대학교 정보통신.멀티미디어공학부)
  • Published : 2002.10.01

Abstract

In this paper, we propose the reduction method of the number of parameters in the segmental-feature HMM using trend quantization method. The proposed method shares the trend information of the polynomial trajectories by quantization. The trajectory is obtained by the sequence of feature vectors of speech signals and can be divided by trend and location information. The trend indicates the variation of consequent frame features, while the location points to the positional difference of the trajectories. Since the trend occupies the large portion of SFHMM, if the trend is shared, the number of parameters maybe decreases. To exploit the proposed system the experiments are performed on TIMIT corpus. The experimental results show that the performance of the proposed system is roughly similar to that of previous system. Therefore, the proposed system can be considered one of parameter reduction method.

본 논문에서는 경향 양자화 기법을 적용하여 분절 특징 은닉 마코프 모델 (HMM: hidden Markov model)의 매개 변수 수를 줄이는 방법을 제안한다. 제안된 방법은 분절 특징 HMM에서 사용하는 분절 특징, 즉 모수적 궤적을 위치 정보와 경향 정보로 분리한 후, 분리된 경향 정보를 경향 코드북을 이용하여 공유한다. 분절 특징에서 위치 정보는 특징의 기준 점을 나타내고, 경향 정보는 분절 특징의 변이를 의미하며 특징의 많은 부분을 차지하고 있다. 따라서 경향 정보가 공유될 수 있다면 분절 특징 HMM의 매개 변수 수를 줄일 수 있을 것이다. 실험 결과 제안된 방식이 기존의 시스템과 비슷한 성능을 보였으며 매개 변수 수를 줄이는 방안으로 고려될 수 있음을 보였다.

Keywords

References

  1. Proceedings of European Conference on Speech Communication and Technology Segmental hidden markov models M.J.F.Gales;S.J.Young
  2. IEEE Tr. on Speech and Audio Processing v.4 no.5 From HMMs to segment models: A unified view of stochastic modeling for speech recognition M.Ostendorf;V.Digalakis;O.A.Kimball https://doi.org/10.1109/89.536930
  3. Proceedings of International Conference on Spoken Language Processing v.1 Parametric trajectory models for speech recognition H.Gish;K.Ng
  4. Computer Speech and Language v.13 Probabilistic trajectory segmental HMMs W.J.Holmes;M.J.Russell https://doi.org/10.1006/csla.1998.0048
  5. IEEE Trans. on Acoustics, Speech and Signal Processing v.34 no.1 Speaker-independent isolated word recognition using dynamic features of speech spectrum S.Furui https://doi.org/10.1109/TASSP.1986.1164788
  6. 한국음향학회지 v.19 no.3 모수적 궤적 기반의 분절 HMM을 이용한 연속음성 인식 윤영선;오영환
  7. 한국음향학회지 v.19 no.7 분절 특징 HMM의 매개변수 수의 감소에 관한 연구 윤영선;오영환
  8. 한국정보과학회지 v.29 no.3 분절 특징 HMM을 이용한 영어 음소 인식 윤영선
  9. Signal Processing v.27 A generalized hidden markov model with state conditioned trend functions of time for the speech signal L.Deng https://doi.org/10.1016/0165-1684(92)90112-A
  10. IEEE Trans. on Speech and Audio Processing v.2 no.4 Speech recognition using hidden markov models with polynomial regression functions as non-stationary states L.Deng;M.Aksmanovic;D.Sun;J.Wu https://doi.org/10.1109/89.326610
  11. Proc. of Int. Conf. on Acoustics, Speech and Signal Proc. A segmental speech model with application word spotting H.Gish;K.Ng