Word2Vec의 IN-OUT Vector를 이용한 기계독해용 단락 검색 모델

Paragraph Retrieval Model for Machine Reading Comprehension using IN-OUT Vector of Word2Vec

  • 김시형 (강원대학교, 컴퓨터정보통신공학과) ;
  • 박성식 (강원대학교, 컴퓨터정보통신공학과) ;
  • 김학수 (강원대학교, 컴퓨터정보통신공학과)
  • Kim, Sihyung (Kangwon National University Department of Computer and Communications Engineering) ;
  • Park, Seongsik (Kangwon National University Department of Computer and Communications Engineering) ;
  • Kim, Harksoo (Kangwon National University Department of Computer and Communications Engineering)
  • 발행 : 2019.10.10

초록

기계독해를 실용화하기 위해 단락을 검색하는 검색 모델은 최근 기계독해 모델이 우수한 성능을 보임에 따라 그 필요성이 더 부각되고 있다. 그러나 기존 검색 모델은 질의와 단락의 어휘 일치도나 유사도만을 계산하므로, 기계독해에 필요한 질의 어휘의 문맥에 해당하는 단락 검색을 하지 못하는 문제가 있다. 본 논문에서는 이러한 문제를 해결하기 위해 Word2vec의 입력 단어열의 벡터에 해당하는 IN Weight Matrix와 출력 단어열의 벡터에 해당하는 OUT Weight Matrix를 사용한 단락 검색 모델을 제안한다. 제안 방법은 기존 검색 모델에 비해 정확도를 측정하는 Precision@k에서 좋은 성능을 보였다.

키워드

과제정보

본 연구는 엔씨소프트 산학연구용역 과제의 지원을 받아 수행되었음.