PageRanking of Newly Crawled Web Documents

추가 수집 웹 문서를 위한 페이지랭크 할당 모델

  • Oh, Eun-Jung (Division of Computer Science, Dept. of EECS, KAIST) ;
  • Kang, In-Ho (Division of Computer Science, Dept. of EECS, KAIST) ;
  • Kim, Gil-Chang (Division of Computer Science, Dept. of EECS, KAIST)
  • 오은정 (한국과학기술원 전자전산학과 전산학) ;
  • 강인호 (한국과학기술원 전자전산학과 전산학) ;
  • 김길창 (한국과학기술원 전자전산학과 전산학)
  • Published : 2002.10.11

Abstract

사용자가 얻고자 하는 정보를 인터넷에서 빠르고 정확하게 검색하는 것은 중요하다. 웹 문서들 간의 상대적인 중요성을 나타내는 페이지랭크는 검객의 질을 높일 수 있어, 정보 검색에 많이 이용된다. 인터넷상의 웹 문서는 짧은 시간에 빠르게 증가하므로 새로운 문서들이 생성될 때마다 전체 문서의 페이지랭크를 계산하는 것은 많은 시간과 비용이 소모된다. 기존 웹 문서의 페이지랭크는 변경하지 않고 추가된 웹 문서들만으로 페이지랭크를 계산할 수 있다면 시간과 비용면에서 효율을 높일 수 있다. 본 논문에서는 추가되는 문서는 이전 문서의 페이지랭크에 많은 영향을 미치지 않는다는 점을 이용하여 추가되는 문서를 위한 페이지랭크를 할당 모델을 제시하고 평가한다.

Keywords