용어 클러스터링의 성능 평가

Performance Evaluation for Word Clustering

  • 박은진 (한국해양대학교 컴퓨터공학과 자연언어처리연구실) ;
  • 김재훈 (한국해양대학교 컴퓨터공학과 자연언어처리연구실) ;
  • 옥철영 (울산대학교 컴퓨터정보통신공학부 언어처리연구실)
  • Park, Eun-Jin (Department of Computer Engineering, Korea Maritime University) ;
  • Kim, Jae-Hoon (Department of Computer Engineering, Korea Maritime University) ;
  • Ock, Cheol-Young (School of Computer Engineering & Information Technology, Ulsan University)
  • 발행 : 2005.10.21

초록

이 논문에서는 전자 사전의 뜻 풀이말을 이용하여 용어를 자동 분류하는 용어 클러스터링 시스템을 설계하였다. 클러스터링 성능에 영향을 미치는 요소로 자질 선택 자질 표현 그리고 유사도 측정 등이 있다. 이 논문에서는 이러한 요소들이 용어 클러스터링에 미치는 영향을 평가해보았다. 클러스터링 결과를 객관적으로 비교하기 위해서 용어 클러스터링 결과와 한국어 의미 계층망에서 추출한 정답 클러스터를 비교하였다 실험 결과, 용어의 뜻 풀이말만 자질로 사용한 방법보다는 뜻 풀이말 자질을 확장하는 방법이 훨씬 더 좋은 결과를 보였다.

키워드