Korean Question Generation Using Co-Attention Layer of Answer and Passage

정답과 구절의 공동 주의 집중 계층을 이용한 한국어 질문 생성

  • 김진태 (NLP Center Language AI Lab, 엔씨소프트) ;
  • 노형종 (NLP Center Language AI Lab, 엔씨소프트) ;
  • 이연수 (NLP Center Language AI Lab, 엔씨소프트) ;
  • 김학수 (강원대학교 IT대학 컴퓨터정보통신공학전공)
  • Published : 2019.10.10

Abstract

질문 생성이란 구절이 입력되면 구절에서 답을 찾을 수 있는 질문을 자동으로 생성하는 작업으로 교육용 시스템, 대화 시스템, QA 시스템 등 다양한 분야에서 중요한 역할을 한다. 질문 생성에서 정답의 단어가 질문에 포함되는 문제점을 해결하기 위해 구절과 정답을 분리한다. 하지만 구절과 정답을 분리하게 되면 구절에서 정답의 정보가 손실되고, 정답에서는 구절의 문맥 정보가 손실되어 정답 유형에 맞는 질문을 생성할 수 없는 문제가 발생된다. 본 논문은 이러한 문제를 해결하기 위해 분리된 정답과 구절의 정보를 연결시켜주는 정답과 구절의 공동 주의 집중 계층을 제안한다. 23,658개의 질문-응답 쌍의 말뭉치를 이용한 실험에서 정답과 구절의 공동 주의 집중 계층이 성능 향상에 기여해 우수한 성능(BLEU-26.7, ROUGE-57.5)을 보였다.

Keywords