DOI QR코드

DOI QR Code

Morpheme-Based Few-Shot Learning with Large Language Models for Korean Healthcare Named Entity Recognition

한국어 헬스케어 개체명 인식을 위한 거대 언어 모델에서의 형태소 기반 Few-Shot 학습 기법

  • Su-Yeon Kang (School of Computer Science, Gyeongsang National University) ;
  • Gun-Woo Kim (School of Computer Science, Gyeongsang National University)
  • 강수연 (경상국립대학교 컴퓨터과학부) ;
  • 김건우 (경상국립대학교 컴퓨터과학부)
  • Published : 2023.11.02

Abstract

개체명 인식은 자연어 처리의 핵심적인 작업으로, 특정 범주의 명칭을 문장에서 식별하고 분류한다. 이러한 기술은 헬스케어 분야에서 진단 지원 및 데이터 관리에 필수적이다. 그러나 기존의 사전 학습된 모델을 특정 도메인에 대해 전이학습하는 방법은 대량의 데이터에 크게 의존하는 한계를 가지고 있다. 본 연구는 방대한 데이터로 학습된 거대 언어 모델(LLM) 활용을 중심으로, 한국어의 교착어 특성을 반영하여 형태소 정보를 활용한 Few-Shot 프롬프트를 통해 한국어 헬스케어 도메인에서의 개체명 인식 방법을 제안한다.

Keywords

Acknowledgement

본 논문은 2023 년도 정부(교육부)의 제원으로 한국연구재단의 지원을 받아 수행된 기초연구사업임(NRF-2021R1G1A1006381)