순차적 구문 분석 방법을 반영한 포인터 네트워크 기반의 한국어 의존 구문 분석기

Korean Dependency Parsing Using Sequential Parsing Method Based on Pointer Network

  • 한장훈 (서강대학교, 자연어 처리 연구실) ;
  • 박영준 (서강대학교, 자연어 처리 연구실) ;
  • 정영훈 (서강대학교, 자연어 처리 연구실) ;
  • 이인권 (서강대학교, 자연어 처리 연구실) ;
  • 한정욱 (서강대학교, 자연어 처리 연구실) ;
  • 박서준 (서강대학교, 자연어 처리 연구실) ;
  • 김주애 (서강대학교, 자연어 처리 연구실) ;
  • 서정연 (서강대학교, 자연어 처리 연구실)
  • Han, Janghoon (Sogang University, Natural Language Processing Lab) ;
  • Park, Yeongjoon (Sogang University, Natural Language Processing Lab) ;
  • Jeong, Younghoon (Sogang University, Natural Language Processing Lab) ;
  • Lee, Inkwon (Sogang University, Natural Language Processing Lab) ;
  • Han, Jungwook (Sogang University, Natural Language Processing Lab) ;
  • Park, Seojun (Sogang University, Natural Language Processing Lab) ;
  • Kim, Juae (Sogang University, Natural Language Processing Lab) ;
  • Seo, Jeongyeon (Sogang University, Natural Language Processing Lab)
  • 발행 : 2019.10.10

초록

의존 구문 분석은 문장 구성 성분 간의 의존 관계를 분석하는 태스크로, 자연어 이해의 대표적인 과제 중 하나이다. 본 논문에서는 한국어 의존 구문 분석의 성능 향상을 위해 Deep Bi-Affine Network와 Left to Right Dependency Parser를 적용하고, 새롭게 한국어의 언어적 특징을 반영한 Right to Left Dependency Parser 모델을 제안한다. 3개의 의존 구문 분석 모델에 단어 표현을 생성하는 방법으로 ELMo, BERT 임베딩 방법을 적용하고 여러 종류의 모델을 앙상블하여 세종 의존 구문 분석 데이터에 대해 UAS 94.50, LAS 92.46 성능을 얻을 수 있었다.

키워드

과제정보

본 연구는 과학기술정보통신부 및 정보통신기획평가원의 SW중심대학지원사업의 연구결과로 수행되었음(2015-0-00910) 이 논문은 한국전자통신연구원에서 공개한 한국어 언어 모델(korBERT)를 사용함(No.2013-2-00131, 휴먼 지식증강 서비스를 위한 지능진화형 WiseQA 플랫폼 기술 개발)