A study on semantic ambiguity in the Korean Named Entity Recognition

Kim, Seonghyun;Song, Youngsook;Song, Chisung;Han, Jiyoon;

Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))

2021.10a
/
Pages.203-208
/
2021
/
2005-3053(pISSN)

Human and Language Technology (한국정보과학회 언어공학연구회)

A study on semantic ambiguity in the Korean Named Entity Recognition

한국어 개체명 인식 과제에서의 의미 모호성 연구

Kim, Seonghyun (Smilegate.AI) ;
Song, Youngsook (KyungHee University) ;
Song, Chisung ;
Han, Jiyoon (Yonsei University)

김성현 (스마일게이트 AI) ;
송영숙 (경희대학교) ;
송치성 ;
한지윤 (연세대학교)

Published : 2021.10.14

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

본 논문에서는 맥락에 따라 개체명의 범주가 달라지는 어휘를 중심으로 교차 태깅된 개체명의 성능을 레이블과 스팬 정답률, 문장 성분과 문장 위치에 따른 정답률로 나누어 살펴 보았다. 레이블의 정확도는 KoGPT2, mBERT, KLUE-RoBERTa 순으로 정답률이 높아지는 양상을 보였다. 스팬 정답률에서는 mBERT가 KLUE-RoBERTa보다 근소하게 성능이 높았고 KoGPT2는 매우 낮은 정확도를 보였다. 다만, KoGPT2는 개체명이 문장의 끝에 위치할 때는 다른 모델과 비슷한 정도로 성능이 개선되는 결과를 보였다. 문장 종결 위치에서 인식기의 성능이 좋은 것은 실험에 사용된 말뭉치의 문장 성분이 서술어일 때 명사의 중첩이 적고 구문이 패턴화되어 있다는 특징과 KoGPT2가 decoder기반의 모델이기 때문으로 여겨지나 이에 대해서는 후속 연구가 필요하다.

Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))

A study on semantic ambiguity in the Korean Named Entity Recognition

한국어 개체명 인식 과제에서의 의미 모호성 연구

Abstract

Keywords

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)