Maximal Length Noun Phrase Identification Based on Punctuations and Expanded Chunk

문장부호 정보와 확장된 청크에 기반한 중국어 최장명사구 식별

  • Bai, Xue-Mei (Dept. of Graduate School for Information Technology) ;
  • Jin, Mei-Xun (Dept. of Computer Science and Engineering, Pohang University of Science and Technology) ;
  • Li, Jin-Ji (Dept. of Computer Science and Engineering, Pohang University of Science and Technology) ;
  • Chung, You-Jin (Dept. of Computer Science and Engineering, Pohang University of Science and Technology) ;
  • Lee, Jong-Hyeok (Dept. of Computer Science and Engineering, Pohang University of Science and Technology)
  • 백설매 (포항공과대학교 정보통신대학원 정보처리학과) ;
  • 김미훈 (포항공과대학교 컴퓨터공학과) ;
  • 이금희 (포항공과대학교 컴퓨터공학과) ;
  • 정유진 (포항공과대학교 컴퓨터공학과) ;
  • 이종혁 (포항공과대학교 컴퓨터공학과)
  • Published : 2005.10.21

Abstract

명사구는 기본명사구와 최장명사구로 분류된다. 최장명사구에 대한 정확한 식별은 문장의 전체적인 구문구조를 파악하고 문장의 정확한 지배용언을 찾아내는데 중요한 역할을 수행한다. 본 논문에서는 확장된 청크(chunk) 개념과 다섯 개의 클래스로 세분화된 문장부호 정보를 사용한 최장명사구 식별 기법을 제안한다. 제안된 기법은 기본모델(baseline)보다 4.05% 향상된 평균 88.63%의 우수한 F-measure 성능을 보인다.

Keywords