Semantic and Syntax Paraphrase Text Generation

Seo, Hyein;Jung, Sangkeun;Jung, Jeesu;

Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))

2020.10a
/
Pages.162-166
/
2020
/
2005-3053(pISSN)

Human and Language Technology (한국정보과학회 언어공학연구회)

Semantic and Syntax Paraphrase Text Generation

유사구조 및 유사의미 문장 생성 방법

Seo, Hyein (Department of Computer Science and Engineering, Chungnam National University) ;
Jung, Sangkeun (Department of Computer Science and Engineering, Chungnam National University) ;
Jung, Jeesu (Department of Computer Science and Engineering, Chungnam National University)

서혜인 (충남대학교 컴퓨터융합학부) ;
정상근 (충남대학교 컴퓨터융합학부) ;
정지수 (충남대학교 컴퓨터융합학부)

Published : 2020.10.14

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

자연어 이해는 대화 인터페이스나 정보 추출 등에 활용되는 핵심 기술 중 하나이다. 최근 딥러닝을 활용한 데이터 기반 자연어 이해 연구가 많이 이루어지고 있으며, 이러한 연구에 있어서 데이터 확장은 매우 중요한 역할을 하게 된다. 본 연구는 자연어 이해영역에서의 말뭉치 혹은 데이터 확장에 있어서, 입력으로 주어진 문장과 문법구조 및 의미가 유사한 문장을 생성하는 새로운 방법을 제시한다. 이를 위해, 우리는 GPT를 이용하여 대량의 문장을 생성하고, 문장과 문장 사이의 문법구조 및 의미 거리 계산법을 제시하여, 이를 이용해 가장 유사하지만 새로운 문장을 생성하는 방법을 취한다. 한국어 말뭉치 Weather와 영어 말뭉치 Atis, Snips, M2M-Movie M2M-Reservation을 이용하여 제안방법이 효과적임을 확인하였다.

Keywords

Acknowledgement

이 논문은 2020년도 정부(과학기술정보통신부)의 재원으로 정보통신기획평가원의 지원을 받아 수행된 연구임(No.2020-0-01441) 이 논문은 2019년도 정부(과학기술정보통신부)의 재원으로 정보통신기획평가원의 지원을 받아 수행된 연구임(2019-0-00004, 준지도학습형 언어지능 원천기술 및 이에 기반한 외국인 지원용 한국어 튜터링 서비스 개발) 이 논문은 2019년도 정부(교육부)의 재원으로 한국연구재단의 지원을 받아 수행된 기초연구사업임(2019R1F1A1060601)

Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))

Semantic and Syntax Paraphrase Text Generation

유사구조 및 유사의미 문장 생성 방법

Abstract

Keywords

Acknowledgement

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)