Examining the Feasibility of Utilizing a Large Language Model for Korean Grammatical Error Correction

Seonmin Koo;Chanjun Park;JeongBae Park;Heuiseok Lim;

한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리) (Annual Conference on Human and Language Technology)

한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
/
Pages.61-65
/
2023
/
2005-3053(pISSN)

한국정보과학회 언어공학연구회 (Human and Language Technology)

한국어 맞춤법 교정을 위한 초거대 언어 모델의 잠재적 능력 탐색

Examining the Feasibility of Utilizing a Large Language Model for Korean Grammatical Error Correction

구선민 (고려대학교 컴퓨터학과) ;
박찬준 ;
박정배 (Human-inspired AI 연구소) ;
임희석 (고려대학교 컴퓨터학과)

Seonmin Koo (Department of Computer Science and Engineering, Korea University) ;
Chanjun Park (Upstage) ;
JeongBae Park (Human-inspired AI Research) ;
Heuiseok Lim (Department of Computer Science and Engineering, Korea University)

발행 : 2023.10.12

PDF

PDF 다운로드

⟨ 이전 논문 다음 논문 ⟩

초록

최근, 대부분의 태스크가 초거대 언어 모델로 통합되고 있을 정도로 많은 관심 및 연구되고 있다. 초거대 언어 모델을 효과적으로 활용하기 위해서는 모델의 능력에 대한 분석이 선행되어야 하나, 한국어에 대한 분석 및 탐색은 상대적으로 부족하다. 본 논문에서는 한국어 맞춤법 교정 태스크를 통해 초거대 언어 모델의 능력을 탐색한다. 맞춤법 교정 태스크는 문장의 구조 및 문법을 이해하는 능력이 필요하며, 사용자의 만족도에 영향을 미칠 수 있는 중요한 태스크이다. 우리는 맞춤법 세부 유형에 따른 ChatGPT의 제로샷 및 퓨샷성능을 평가하여 초거대 언어 모델의 성능 분석을 수행한다. 실험 결과 제로샷의 경우 문장부호 오류의 성능이 가장 우수했으며, 수사 오류의 성능이 가장 낮았다. 또한, 예제를 더 많이 제공할수록 전체적인 모델의 성능이 향상되었으나, 제로샷의 경우보다 오류 유형 간의 성능 차이가 커지는 것을 관찰할 수 있었다.

키워드

과제정보

본 연구는 과학기술정보통신부 및 정보통신기술기획평가원의 대학ICT연구센터지원사업의 연구결과로 수행되었음(IITP-2022-2018-0-01405). 이 논문은 2021년도 정부(교육부)의 재원으로 한국연구재단의 지원을 받아 수행된 기초연구사업임(NRF-2021R1A6A1A03045425). 본 연구는 2022년도 중소벤처기업부의 기술개발사업 지원에 의한 연구임 [S3310507].

한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리) (Annual Conference on Human and Language Technology)

한국어 맞춤법 교정을 위한 초거대 언어 모델의 잠재적 능력 탐색

Examining the Feasibility of Utilizing a Large Language Model for Korean Grammatical Error Correction

초록

키워드

과제정보

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)