A Method of Classification of Overseas Direct Purchase Product Groups Based on Transfer Learning

언어모델 전이학습 기반 해외 직접 구매 상품군 분류

  • Kyo-Joong Oh (KAIST, Ailys Frontier, Statistics Korea) ;
  • Ho-Jin Choi (KAIST, Ailys Frontier, Statistics Korea) ;
  • Wonseok Cha (KAIST, Ailys Frontier, Statistics Korea) ;
  • Ilgu Kim (KAIST, Ailys Frontier, Statistics Korea) ;
  • Chankyun Woo (KAIST, Ailys Frontier, Statistics Korea)
  • 오교중 (한국과학기술원(KAIST), 아일리스프런티어, 통계청 조사시스템과) ;
  • 최호진 (한국과학기술원(KAIST), 아일리스프런티어, 통계청 조사시스템과) ;
  • 차원석 (한국과학기술원(KAIST), 아일리스프런티어, 통계청 조사시스템과) ;
  • 김일구 (한국과학기술원(KAIST), 아일리스프런티어, 통계청 조사시스템과) ;
  • 우찬균 (한국과학기술원(KAIST), 아일리스프런티어, 통계청 조사시스템과)
  • Published : 2022.10.18

Abstract

본 논문에서는 통계청에서 매월 작성되는 온라인쇼핑동향조사를 위해, 언어모델 전이학습 기반 분류모델 학습 방법론을 이용하여, 관세청 제공 전자상거래 수입 목록통관 자료를 처리하기 위해서 해외 직접 구매 상품군 분류 모델을 구축한다. 최근에 텍스트 분류 태스크에서 많이 이용되는 BERT 기반의 언어모델을 이용하며 기존의 색인어 정보 분석 과정이나 사례사전 구축 등의 중간 단계 없이 해외 직접 판매 및 구매 상품군을 94%라는 높은 예측 정확도로 분류가 가능해짐을 알 수 있다.

Keywords

Acknowledgement

이 논문은 2022년도 정부(과학기술정보통신부)의 재원으로 정보통신기획평가원의 지원을 받아 수행된 연구임(No. 1711159666, (엑소브레인-총괄/1세부) 휴먼 지식증강 서비스를 위한 지능진화형 WiseQA 플랫폼 기술 개발)