Desambiguation Method based on a Lexicon of Typographical Units

Nam, Jee-Sun;Choi, Key-Sun;

한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리) (Annual Conference on Human and Language Technology)

한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
/
Pages.75-82
/
1997
/
2005-3053(pISSN)

한국정보과학회 언어공학연구회 (Human and Language Technology)

`어절 정보 사전`을 이용한 형태소 분석의 중의성 (Ambiguity) 해결

Desambiguation Method based on a Lexicon of Typographical Units

남지순 (한국 과학 기술원 인공 지능 연구 센터 한글 공학 연구실) ;
최기선 (한국 과학 기술원 인공 지능 연구 센터 한글 공학 연구실)

Nam, Jee-Sun (KAIST CAIR Language Engineering Laboratory) ;
Choi, Key-Sun (KAIST CAIR Language Engineering Laboratory)

발행 : 1997.10.10

PDF

PDF 다운로드

⟨ 이전 논문 다음 논문 ⟩

초록

이글은 한국어 형태소 분석시 발생하는 중의성의 유형에 대해서 논의하고, 그와 같은 여러 유형의 중의성의 발생율을 감소시키기 위한 방법으로써 '어절 정보 사전 시스템'의 구축을 강조하였다. 한국어 문서에 대한 형태소 분석시 발생하는 중의성은, 영어나 유럽어와는 달리, 어휘 형성 정보 뿐아니라 어절 형성 정보, 구문 구조에 관한 부분적인 정보까지도 제공되어야 비로소 해소될 수 있는 경우가 많아 이와 같은 정보를 얻어내기 위해서는 체계적으로 고안된 범용의 사전 (Lexicon)이 필요하다. 여기에서는 접사가 동반되어 구성될 수 있는 '파생 명사(Affixed Noun)'들의 경우에 논의의 범위를 제한하였다. 실제로, 체계적으로 구성된 하나의 파생어 사전은. 주어진 어절에 대한 형태소 분절시 발생할 수 있는 엄청난 수의 중의적 가능성을 해소해 줄 수 있는데. 이와 같은 사전을 구축하기 위해서는 단순어와 접사 사전이 모듈화되어 완성되어야 한다. 같은 방법으로 모든 합성어 유형에 대한 사전이 구축되고, 그러한 기본 형태들에 대한 '변화형' 사전이 결합되면 어절 정보를 갖춘 대용량의 한국어 MRD의 구현이 가능해질 것이다.

한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리) (Annual Conference on Human and Language Technology)

`어절 정보 사전`을 이용한 형태소 분석의 중의성 (Ambiguity) 해결

Desambiguation Method based on a Lexicon of Typographical Units

초록

키워드

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)