Modelling Grammatical Pattern Acquisition using Video Scripts

비디오 스크립트를 이용한 문법적 패턴 습득 모델링

  • Seok, Ho-Sik (Biointelligence Laboratory, School of Computer Science and Engineering, Seoul National University) ;
  • Zhang, Byoung-Tak (Biointelligence Laboratory, School of Computer Science and Engineering, Seoul National University)
  • 석호식 (서울대학교 컴퓨터공학부 바이오지능연구실) ;
  • 장병탁 (서울대학교 컴퓨터공학부 바이오지능연구실)
  • Published : 2010.10.08

Abstract

본 논문에서는 다양한 코퍼스를 통해 언어를 학습하는 과정을 모델링하여 무감독학습(Unsupervised learning)으로 문법적 패턴을 습득하는 방법론을 소개한다. 제안 방법에서는 적은 수의 특성 조합으로 잠재적 패턴의 부분만을 표현한 후 표현된 규칙을 조합하여 유의미한 문법적 패턴을 탐색한다. 본 논문에서 제안한 방법은 베이지만 추론(Bayesian Inference)과 MCMC (Markov Chain Mote Carlo) 샘플링에 기반하여 특성 조합을 유의미한 문법적 패턴으로 정제하는 방법으로, 랜덤하이퍼그래프(Random Hypergraph) 모델을 이용하여 많은 수의 하이퍼에지를 생성한 후 생성된 하이퍼에지의 가중치를 조정하여 유의미한 문법적 패턴을 탈색하는 방법론이다. 우리는 본 논문에서 유아용 비디오의 스크립트를 이용하여 다양한 유아용 비디오 스크립트에서 문법적 패턴을 습득하는 방법론을 소개한다.

Keywords