Twitter Corpus Collection and Analysis

트위터 말뭉치 수집과 분석

  • Yoo, Daehoon (Department of Computer Science and Engineering, POSTECH) ;
  • Lee, Cheongjae (Department of Computer Science and Engineering, POSTECH) ;
  • Kim, Seokhwan (Department of Computer Science and Engineering, POSTECH) ;
  • Lee, Gary Geunbae (Department of Computer Science and Engineering, POSTECH)
  • 유대훈 (포항공과대학교 컴퓨터 공학과) ;
  • 이청재 (포항공과대학교 컴퓨터 공학과) ;
  • 김석환 (포항공과대학교 컴퓨터 공학과) ;
  • 이근배 (포항공과대학교 컴퓨터 공학과)
  • Published : 2009.10.09

Abstract

최근 기존 블로그와 다른 마이크로 블로그의 한 종류로 트위터가 인터넷 상에서 화두로 대두되고 있다. 트위터는 기존 블로그나 미니홈피의 여러 가지 기능을 간소화하고 짧은 내용의 텍스트만을 올릴 수 있는 마이크로 블로그이다. 그런 이유로 트위터는 단순함과 즉시성이라는 고유의 특성을 가지고 일반적인 인터넷 이용자들에게 급속하게 알려지고 있다. 이러한 트위터를 분석하면 다양한 주제에 대해서 인터넷상의 대중들의 생각과 의견들을 알 수 있는 창구가 될 수 있다. 또한 다른 언어권 국가들의 트위터와 비교하면 양 국가간의 문화적 차이를 알 수 있다. 본 논문에서는 한국어 및 영어권 이용자들의 트위터 상의 메시지를 주제별, 목적별 등으로 분석하였다. 그 결과, 한국에서는 트위터 이용을 개인적인 생각을 적는 일기장으로 많이 사용되지만, 영어권 에서는 그 외에도 보도 자료나 광고등 여러 가지 목적으로 사용되고 있다는 것을 알 수 있다.

Keywords