Optimizing ELECTRA-based model for Zero Anaphora Resolution

Park, Jinsol;Choi, Maengsik;Matteson, Andrew;Lee, Chunghee;

Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))

2021.10a
/
Pages.329-334
/
2021
/
2005-3053(pISSN)

Human and Language Technology (한국정보과학회 언어공학연구회)

Optimizing ELECTRA-based model for Zero Anaphora Resolution

생략복원을 위한 ELECTRA 기반 모델 최적화 연구

Park, Jinsol (Seoul National University) ;
Choi, Maengsik (NCSOFT Corp.) ;
Matteson, Andrew (NCSOFT Corp.) ;
Lee, Chunghee (NCSOFT Corp.)

박진솔 (서울대학교) ;
최맹식 ((주)엔씨소프트) ;
;
이충희 ((주)엔씨소프트)

Published : 2021.10.14

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

한국어에서는 문장 내의 주어나 목적어가 자주 생략된다. 자연어 처리에서 이러한 문장을 그대로 사용하는 것은 정보 부족으로 인한 문제 난이도 상승으로 귀결된다. 생략복원은 텍스트에서 생략된 부분을 이전 문구에서 찾아서 복원해 주는 기술이며, 본 논문은 생략된 주어를 복원하는 방법에 대한 연구이다. 본 논문에서는 기존에 생략복원에 사용되지 않았던 다양한 입력 형태를 시도한다. 또한, 출력 레이어로는 finetuning layer(Linear, Bi-LSTM, MultiHeadAttention)와 생략복원 태스크 형태(BIO tagging, span prediction)의 다양한 조합을 실험한다. 국립국어원 무형 대용어 복원 말뭉치를 기반으로 생략복원이 불필요한 네거티브 샘플을 추가하여 ELECTRA 기반의 딥러닝 생략복원 모델을 학습시키고, 생략복원에 최적화된 조합을 검토한다.

Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))

Optimizing ELECTRA-based model for Zero Anaphora Resolution

생략복원을 위한 ELECTRA 기반 모델 최적화 연구

Abstract

Keywords

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)