Korean Named Entity Recognition using ManiFL

ManiFL을 이용한 한국어 개체명 인식

  • Kim, Wansu (Korean Language Processing Lab. University of Ulsan) ;
  • Shin, Joon-choul (Korean Language Processing Lab. University of Ulsan) ;
  • Park, Seoyeon (Korean Language Processing Lab. University of Ulsan) ;
  • Ock, CheolYoung (Korean Language Processing Lab. University of Ulsan)
  • 김완수 (울산대학교 한국어처리연구실) ;
  • 신준철 (울산대학교 한국어처리연구실) ;
  • 박서연 (울산대학교 한국어처리연구실) ;
  • 옥철영 (울산대학교 한국어처리연구실)
  • Published : 2021.10.14

Abstract

개체명 인식은 주어진 문장 안의 고유한 의미가 있는 단어들을 인명, 지명, 단체명 등의 미리 정의된 개체의 범주로 분류하는 문제이다. 최근 연구에서는 딥 러닝, 대용량 언어 모델을 사용한 연구들이 활발하게 연구되어 높은 성능을 보이고 있다. 하지만 이러한 방법은 대용량 학습 말뭉치와 이를 처리할 수 있는 높은 연산 능력을 필요로 하며 모델의 실행 속도가 느려서 실용적으로 사용하기 어려운 문제가 있다. 본 논문에서는 얕은 기계 학습 기법을 적용한 ManiFL을 사용한 개체명 인식 시스템을 제안한다. 형태소의 음절, 품사 정보, 직전 형태소의 라벨만을 자질로 사용하여 실험하였다. 실험 결과 F1 score 기준 90.6%의 성능과 초당 974 문장을 처리하는 속도를 보였다.

Keywords

Acknowledgement

이 논문은 2021년도 정부(과학기술정보통신부)의 재원으로 정보통신기획평가원의 지원(No.2013-2-00131, (엑소브레인-총괄/1세부) 휴먼 지식증강 서비스를 위한 지능진화형 WiseQA 플랫폼 기술개발)과 2021년도 정부(교육부)의 재원으로 한국연구재단의 지원을 받아 수행된 기초연구사업(NRF-2020R1I1A1A01073665)의 연구 결과임.