Conditional Random Fields based Named Entity Recognition Using Korean Lexical Semantic Network

한국어 어휘의미망을 활용한 Conditional Random Fields 기반 한국어 개체명 인식

  • 박서연 (울산대학교 한국어처리연구실) ;
  • 옥철영 (울산대학교 한국어처리연구실) ;
  • 신준철 (울산대학교 한국어처리연구실)
  • Published : 2020.10.14

Abstract

개체명 인식은 주어진 문장 내에서 OOV(Out of Vocaburary)로 자주 등장하는 고유한 의미가 있는 단어들을 미리 정의된 개체의 범주로 분류하는 작업이다. 최근 개체명이 문장 내에서 OOV로 등장하는 문제를 해결하기 위해 외부 리소스를 활용하는 연구들이 많이 진행되었다. 본 논문은 의미역, 의존관계 분석에 한국어 어휘지도를 이용한 자질을 추가하여 성능 향상을 보인 연구들을 바탕으로 이를 한국어 개체명 인식에 적용하고 평가하였다. 실험 결과, 한국어 어휘지도를 활용한 자질을 추가로 학습한 모델이 기존 모델에 비해 평균 1.83% 포인트 향상하였다. 또한, CRF 단일 모델만을 사용했음에도 87.25% 포인트라는 높은 성능을 보였다.

Keywords

Acknowledgement

이 논문은 한국연구재단의 지역대학우수과학자지원사업(NRF-2020R1I1A3070938)과 학제간융합연구지원사업(NRF-2019SA5B6102698)의 지원을 받아 수행된 연구임