Clustering Method Using the Union Information of Term Frequency and Link in Hypertext

Lee, Won-Hee;Lee, Kyo-Woon;Park, Heum;Kim, Young-Ki;Kwon, Hyuck-Chul;

한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리) (Annual Conference on Human and Language Technology)

한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
/
Pages.101-107
/
2003
/
2005-3053(pISSN)

한국정보과학회 언어공학연구회 (Human and Language Technology)

웹 문서의 단어정보와 링크정보 결합을 이용한 클러스터링 기법

Clustering Method Using the Union Information of Term Frequency and Link in Hypertext

이원희 (부산대학교 전자계산학과) ;
이교운 (울산과학대학 컴퓨터정보학부) ;
박흠 (부산대학교 전자계산학과) ;
김영기 (부산대학교 전자계산학과) ;
권혁철 (부산대학교 전자계산학과)

Lee, Won-Hee (Department of Computer Science Busan National University) ;
Lee, Kyo-Woon (Department of Computer Information Ulsan College,) ;
Park, Heum (Department of Computer Science Busan National University) ;
Kim, Young-Ki (Department of Computer Science Busan National University) ;
Kwon, Hyuck-Chul (Department of Computer Science Busan National University)

발행 : 2003.10.10

PDF

PDF 다운로드

⟨ 이전 논문 다음 논문 ⟩

초록

최근의 웹 문서는 텍스트 위주의 구성이 아닌 이미지, 사운드, 동영상 등의 다양한 타입으로 구성되는 추세이다. 이에 따라 단순히 웹 문서 내의 단어 정보추출 만으로는 좋은 성능의 클러스터링을 기대하기 어렵다. 본 논문은 전통적인 문서 클러스터링 기법인 단어기반 클러스터링 기법의 취약점을 제시하고, 웹 문서간의 링크구조정보 중 동시인용 정보를 이용하여 웹 문서 클러스터링 성능향상의 가능성을 보이고자 한다. 실험에서는 네이버디렉토리 중 '자연과학' 범주에 포함된 문서를 대상으로 위의 두 가지 방식과 이 두 가지를 혼합한 단어-링크 혼합 클러스터링을 통해 기존의 방식보다 더 낳은 성능을 얻을 수 있었다.

한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리) (Annual Conference on Human and Language Technology)

웹 문서의 단어정보와 링크정보 결합을 이용한 클러스터링 기법

Clustering Method Using the Union Information of Term Frequency and Link in Hypertext

초록

키워드

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)