Iterative learning system design for relation extraction and knowledge base population

관계 추출 및 지식베이스 확장을 위한 반복 학습 시스템 설계

  • 정용빈 (한국과학기술원, 시멘틱웹첨단연구센터) ;
  • 남상하 (한국과학기술원, 시멘틱웹첨단연구센터) ;
  • 김지성 (한국과학기술원, 시멘틱웹첨단연구센터) ;
  • 이민호 (한국과학기술원, 시멘틱웹첨단연구센터) ;
  • 최기선 (한국과학기술원, 시멘틱웹첨단연구센터)
  • Published : 2019.10.10

Abstract

관계추출기의 학습을 위해서는 많은 학습 데이터가 필요한데, 사람이 모으게 되면 많은 비용이 필요하여 원격 지도 학습을 이용한 데이터 수집이 많은 연구에서 사용되고 있다. 원격 지도 학습은 지식베이스를 기반으로 학습 데이터를 자동으로 만들어 내는 방식이기에 비용이 거의 들지 않지만, 지식베이스의 질과 양에 영향을 받는다. 본 연구는 원격 지도 학습을 기본으로 관계추출기의 성능을 향상 시키고, 지식베이스를 확장하는 방안으로 반복학습을 제안한다. 실험을 적은 비용으로 빠르게 진행하기 위해 반복학습을 자동화 하는 시스템을 설계하여 실험을 하였고, 이 시스템으로 관계추출기의 성능이 향상 될 수 있는 가능성을 보였으며, 반복학습을 통한 지식베이스의 확장 방안을 제시한다.

Keywords

Acknowledgement

이 논문은 2019년도 정부(과학기술정보통신부)의 재원으로 정보통신기획평가원의 지원을 받아 수행된 연구임(2013-0-00109, WiseKB: 빅데이터 이해 기반 자가학습형 지식베이스 및 추론 기술 개발)