Robust Korean Dependency Analysis Based on CRFs

Oh, Jin-Young;Cha, Jeong-Won;

Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))

2008.10a
/
Pages.23-28
/
2008
/
2005-3053(pISSN)

Human and Language Technology (한국정보과학회 언어공학연구회)

Robust Korean Dependency Analysis Based on CRFs

CRFs를 이용한 강건한 한국어 의존구조 분석

Oh, Jin-Young (Dept. of Computer Engineering, Changwon National University) ;
Cha, Jeong-Won (Dept. of Computer Engineering, Changwon National University)

오진영 (창원대학교 컴퓨터공학과) ;
차정원 (창원대학교 컴퓨터공학과)

Published : 2008.10.10

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

한국어 처리에서 구문분석기에 대한 요구는 많은 반면 성능의 한계와 강건함의 부족으로 인해 채택되지 못하는 것이 현실이다. 본 연구는 구문분석을 레이블링 문제로 전환하여 성능, 속도, 강건함을 모두 실현한 시스템에 대해서 설명한다. 우리는 다단계 구 단위화(Cascaded Chunking)를 통해 한국어 구문분석을 시도한다. 각 단계에서는 어절별 품사 태그와 어절 구문표지를 자질로 사용하고 Conditional Random Fields(CRFs)를 이용하여 최적의 결과를 얻는다. 98,412문장 세종 구문 코퍼스로 학습하고 1,430문장(평균 14.59어절)으로 실험한 결과 87.30%의 구문 정확도를 보였다. 이 결과는 기존에 제안되었던 구문분석기와 대등하거나 우수한 성능이며 기존 구문분석기가 처리하지 못하는 장문도 처리 가능하다.

Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))

Robust Korean Dependency Analysis Based on CRFs

CRFs를 이용한 강건한 한국어 의존구조 분석

Abstract

Keywords

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)