퓨샷 개체명 인식을 위한 Maximal Marginal Relevance 기반의 라벨 단어 집합 생성

Generating Label Word Set based on Maximal Marginal Relevance for Few-shot Name Entity Recognition

  • 최효림 (강원대학교빅데이터메디컬융합학과 강원대학교컴퓨터공학과) ;
  • 황현선 (강원대학교빅데이터메디컬융합학과 강원대학교컴퓨터공학과) ;
  • 이창기 (강원대학교빅데이터메디컬융합학과 강원대학교컴퓨터공학과)
  • HyoRim Choi (Department of Big Data Medical Convergence, Kangwon National University) ;
  • Hyunsun Hwang (Department of Big Data Medical Convergence, Kangwon National University) ;
  • Changki Lee (Department of Big Data Medical Convergence, Kangwon National University)
  • 발행 : 2023.10.12

초록

최근 다양한 거대 언어모델(Large Language Model)들이 개발되면서 프롬프트 엔지니어링의 대한 다양한 연구가 진행되고 있다. 본 논문에서는 퓨삿 학습 환경에서 개체명 인식의 성능을 높이기 위해서 제안된 템플릿이 필요 없는 프롬프트 튜닝(Template-free Prompt Tuning) 방법을 이용하고, 이 방법에서 사용된 라벨 단어 집합 생성 방법에 Maximal Marginal Relevance 알고리즘을 적용하여 해당 개체명에 대해 보다 다양하고 구체적인 라벨 단어 집합을 생성하도록 개선하였다. 실험 결과, 'LOC' 타입을 제외한 나머지 개체명 타입에서 'PER' 타입은 0.60%p, 'ORG' 타입은 4.98%p, 'MISC' 타입은 1.38%p 성능이 향상되었고, 전체 개체명 인식 성능은 1.26%p 향상되었다. 이를 통해 본 논문에서 제안한 라벨 단어 집합 생성 기법이 개체명 인식 성능 향상에 도움이 됨을 보였다.

키워드

과제정보

본 논문은 연구제단 과제(NRF2021R1F1A106440311, 딥러닝 기반의 한국어 텍스트 스타일 변환 기술 연구)의 지원을 받아 수행된 연구임