유머 자동 처리를 위한 유머 데이터 평가 및 활용

Evaluate and Use of humor data for humor processed automating

  • 강조은 (연세대학교 언어정보 학협동과정) ;
  • 이재원 (연세대학교 언어정보 학협동과정) ;
  • 오채은 (연세대학교 법학과) ;
  • 김한샘 (연세대학교 언어정보 학협동과정)
  • Kang Joeun (Yonsei University, Interdisciplinary Graduate Program of Linguistics and Informatics) ;
  • Lee Jaewon (Yonsei University, Interdisciplinary Graduate Program of Linguistics and Informatics) ;
  • Oh Chaeeun (Yonsei University, Graduate School Department of Law) ;
  • Kim Hansaem (Yonsei University, Interdisciplinary Graduate Program of Linguistics and Informatics)
  • 발행 : 2023.10.12

초록

의사소통 기술에서 유머는 사람을 웃게 만들며 분위기를 환기시키고, 관계를 돈독하게 만드는 효과를 지닌다. 이를 자연어처리에서 유머 분류, 인식, 탐지로 적용하여 유머를 기계에 학습시키려 하는 다양한 시도가 진행되고 있지만 유머의 주관성과 윤리적 문제로 탁월한 성능을 기록하기 어렵고, 특히 한국어 유머에 대한 자연어처리 분야의 논의는 미비한 상태이다. 이에 본 연구는 유머 평가 체계를 만들어 ChatGPT에 적용하여 유머 인식의 주관성을 극복할 수 있는 자동화 실험을 진행한다. 이때, 유머의 윤리적 문제를 보완하기 위해 한국 법률을 적용한 윤리 기준을 도입하여 유머 데이터셋을 마련하였으며, 데이터셋을 ChatGPT에 fine-tuning 하여 재미있는 생성 모델의 개발 가능성을 실험하였다.

키워드