Data Augmentation using Large Language Model for English Education

영어 교육을 위한 거대 언어 모델 활용 말뭉치 확장 프레임워크

  • Jinwoo Jung (Department of Computer Science and Engineering, Chungnam National University) ;
  • Sangkeun Jung (Department of Computer Science and Engineering, Chungnam National University)
  • 정진우 (충남대학교 컴퓨터융합학부) ;
  • 정상근 (충남대학교 컴퓨터융합학부)
  • Published : 2023.10.12

Abstract

최근 ChatGPT와 같은 사전학습 생성모델은 자연어 이해 (natural language understanding)에서 좋은 성능을 보이고 있다. 또한 코드 작업을 도와주고 대학수학능력시험, 중고등학교 수준의 문제를 풀거나 도와주는 다양한 분야에서 활용되고 있다. 본 논문은 사전학습 생성모델을 이용하여 영어 교육을 위해 말뭉치를 확장하는 프레임 워크를 제시한다. 이를 위해 ChatGPT를 사용해 말뭉치를 확장 한 후 의미 유사도, 상황 유사도, 문장 교육 난이도를 사용해 생성된 문장의 교육적 효과를 검증한다.

Keywords

Acknowledgement

이 논문은 2022년도 정부(교육부)의 재원으로 한국연구재단의 지원을 받아 수행된 기초연구사업임(2022R1F1A1071047)