Interactions of Retriever and LLM on Chain-of-Thought Reasoning for Korean Question Answering

Minjun Park;Myoseop Sim;Kyungkoo Min;Jooyoung Choi;Haemin Jung;Stanley Jungkyu Choi;

한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리) (Annual Conference on Human and Language Technology)

한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
/
Pages.618-621
/
2023
/
2005-3053(pISSN)

한국정보과학회 언어공학연구회 (Human and Language Technology)

검색모델과 LLM의 상호작용을 활용한 사고사슬 기반의 한국어 질의응답

Interactions of Retriever and LLM on Chain-of-Thought Reasoning for Korean Question Answering

박민준 (LG AI 연구원) ;
심묘섭 (LG AI 연구원) ;
민경구 (LG AI 연구원) ;
최주영 (LG AI 연구원) ;
정해민 (LG AI 연구원) ;
최정규 (LG AI 연구원)

Minjun Park (LG AI Research) ;
Myoseop Sim (LG AI Research) ;
Kyungkoo Min (LG AI Research) ;
Jooyoung Choi (LG AI Research) ;
Haemin Jung (LG AI Research) ;
Stanley Jungkyu Choi (LG AI Research)

발행 : 2023.10.12

PDF

PDF 다운로드

⟨ 이전 논문 다음 논문 ⟩

초록

최근 거대언어모델(LLM)이 기계 번역 및 기계 독해를 포함한 다양한 문제들에서 높은 성능을 보이고 있다. 특히 프롬프트 기반의 대규모 언어 모델은 사고사슬 방식으로 적절한 프롬프팅을 통해 원하는 형식의 답변을 생성할 수 있으며 자연어 추론 단계에서도 높은 정확도를 보여주고 있다. 그러나 근본적으로 LLM의 매개변수에 질문에 관련된 지식이 없거나 최신 정보로 업데이트 되지 않은 경우 추론이 어렵다. 이를 해결하기 위해, 본 연구는 검색문서와 생성모델의 상호작용을 통해 답변하는 한국어 질의응답 모델을 제안한다. 검색이 어려운 경우 생성형 모델을 통해 질문과 관련된 문장을 생성하며, 이는 다시 검색모델과 추론 과정에서 활용된다. 추가로 "판단불가"라는 프롬프팅을 통해 모델이 답변할 수 없는 경우를 스스로 판단하게 한다. 본 연구결과에서 GPT3를 활용한 사고사슬 모델이 63.4의 F1 점수를 보여주며 생성형 모델과 검색모델의 융합이 적절한 프롬프팅을 통해 오픈-도메인 질의응답에서 성능의 향상을 보여준다.

키워드

LLM;

한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리) (Annual Conference on Human and Language Technology)

검색모델과 LLM의 상호작용을 활용한 사고사슬 기반의 한국어 질의응답

Interactions of Retriever and LLM on Chain-of-Thought Reasoning for Korean Question Answering

초록

키워드

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)