Morphological Analyzer and Tagger Evaluation Contest(MATEC 99) Overview

형태소분석기 및 품사 태거 평가대회(MATEC99) 개요

  • Lee, Jae-Sung (Knowledge Information Department, Computer and Software Technology Laboratories, ETRI) ;
  • Park, Jay-Duke (Knowledge Information Department, Computer and Software Technology Laboratories, ETRI) ;
  • Cha, Keon-Hoe (Knowledge Information Department, Computer and Software Technology Laboratories, ETRI) ;
  • Park, Se-Young (Knowledge Information Department, Computer and Software Technology Laboratories, ETRI)
  • 이재성 (ETRI 컴퓨터소프트웨어연구소 지식정보연구부) ;
  • 박재득 (ETRI 컴퓨터소프트웨어연구소 지식정보연구부) ;
  • 차건회 (ETRI 컴퓨터소프트웨어연구소 지식정보연구부) ;
  • 박세영 (ETRI 컴퓨터소프트웨어연구소 지식정보연구부)
  • Published : 1999.10.08

Abstract

한국어 정보처리에서 기본 모듈로 많이 사용되는 형태소분석기, 태거 및 명사추출기에 대한 객관적인 평가를 위해서는 실제 사용되는 언어에 대한 평가기준과 방대한 양의 평가자료 구축이 필수적이다. 전자통신연구원(ETRI)에서는 표준적인 평가기준과 평가자료(말뭉치)를 구축하여 "제 1회 형태소분석기 및 품사 태거 평가대회" 을 개최하였으며, 이 대회는 학습기간을 포함하여 1999년 6월 7일부터 10월 1일까지 진행되었다. 평가에는 총 15개팀이 참가하였고, 명사추출, 태거, 형태소분석기의 각 분야에 대해 약 25만 4천어절의 학습 말뭉치를 제공한 후, 시험말뭉치 약3만 3천어절에 대해 평가가 이루어졌다. 이 글에서는 이 대회의 취지, 진행과정, 평가 방식, 평가결과 등에 대해 소개한다.

Keywords