스팬 기반 개체 추출을 위한 자질, 모델, 학습 방법 비교

Comparing Features, Models and Training for Span-based Entity Extraction

  • 이승우 (한국과학기술정보연구원 인공지능데이터연구단)
  • Seungwoo Lee (Al Data Research Center, Korea Institute of Science and Technology Information)
  • 발행 : 2023.10.12

초록

개체 추출은 정보추출의 기초를 구성하는 태스크로, 관계 추출, 이벤트 추출 등 다양한 정보추출 태스크의 기반으로 중요하다. 최근에는 다중 레이블 개체와 중첩 개체를 다루기 위해 스팬기반의 개체추출이 주류로 연구되고 있다. 본 논문에서는 스팬을 표현하는 다양한 매핑과 자질들을 살펴보고 개체추출의 성능에 어떤 영향을 주는지를 분석하여 최적의 매핑 및 자질 조합을 제시하였다. 또한, 모델 구조에 있어서, 사전 학습 언어모델(PLM) 위에 BiLSTM 블록의 추가 여부에 따른 성능 변화를 분석하고, 모델의 학습에 있어서, 미세조정(finetuing) 이전에 예열학습(warmup training)을 사용하는 것이 효과적인지를 실험을 통해 비교 분석하여 제시하였다.

키워드

과제정보

본 연구는 한국과학기술정보연구원의 'Data/AI 기반 문제해결 체계 구축(K-23-L04-C05)' 사업으로부터 지원받아 수행된 연구임.