Comparison of KoBART and KoBERT models for Korean paper summarization

한국어 논문 요약을 위한 KoBART와 KoBERT 모델 비교*

  • Jaesung Jun (Semyung University, School of Computer Science) ;
  • Suan Lee (Semyung University, School of Computer Science)
  • 전제성 (세명대학교 컴퓨터학부) ;
  • 이수안 (세명대학교 컴퓨터학부)
  • Published : 2022.10.18

Abstract

통신 기술의 발전으로 일반인들도 다양한 자료들을 인터넷에서 손쉽게 찾아볼 수 있는 시대가 도래하였다. 개인이 접근할 수 있는 정보량이 기하급수적으로 많아 짐에 따라, 이를 효율적으로 요약, 정리하여 보여주는 서비스들의 필요성이 높아지기 시작했다. 본 논문에서는, 자연어 처리 모델인 BART를 40GB 이상의 한국어 텍스트로 미리 학습된 한국어 언어 모델 KoBART를 사용한 한국어 논문 요약 모델을 제안하고, KoBART와 KoBERT 모델의 한국어 논문 요약 성능을 비교한다.

Keywords

Acknowledgement

본 과제(결과물)는 2022년도 교육부의 재원으로 한국연구재단의 지원을 받아 수행된 지자체-대학 협력기반 지역혁신 사업의 결과입니다.(2021RIS-001)