1. 서론
최근 5G 및 모바일 사업 중심의 네트워크 기술 혁신에 따른 다양한 OTT(Over-The-Top) 서비스의 등장으로 미디어 콘텐츠 접근성이 크게 향상되었다. 비디오 스트리밍 서비스의 이용이 확대됨에 따라 다양한 OTT 서비스들이 시장에 등장하였으며, 각 서비스 공급자들은 차별화를 위해 자체 콘텐츠를 제작 및 유통하는 등 서비스 콘텐츠를 분산화하는 움직임을 보이고 있다. 하지만 이러한 콘텐츠 분산화와 더불어 요금 인상과 계정 공유 제한이 더해지면서 불법 스트리밍 사이트가 급증하고 있다. 대표적으로, 한때 월 1,000만 명의 이용자를 보유했던 ‘누누티비’가 있으며, 누누티비가 폐쇄된 이후에도 유사한 사이트들이 지속해서 생겨나고 있다[1][2].
동일한 운영자가 여러 개의 불법 사이트를 동시에 운영하는 경우가 늘면서 정부와 관련 업계의 노력에도 불법 사이트를 신속하게 차단하는 것이 어려워지고 있다[3]. 따라서, 효과적인 불법 사이트 차단을 위해 동일한 운영자를 식별하는 것이 더욱 중요하다. Chan-hee Kim 외 3인[3]에 따르면 58곳의 불법 스트리밍 사이트를 분석한 결과 93%가 중복된 영상 서버 URL을 사용했으며, 이는 여러 사이트가 동일 운영자에 의해 관리되고 있을 가능성을 보여준다. 즉, 불법 스트리밍 사이트를 효과적으로 차단하기 위해서는 동일 운영자가 관리하는 사이트 간 공통점을 분석하는 것이 필요하다.
또한, 수사점 관점에서 동일 운영자를 밝혀냈을 때 불법행위의 상습성과 반복성을 입증할 수 있으며, 이는 수사과정에서 재범 가능성을 강조하는 중요한 근거가 된다. 형사소송법 제70조에 따라 법원은 구속사유를 심사함에 있어서 재범의 위험성 등에 대한 위험성 우려 등을 고려하여야 하므로[4], 이러한 근거는 구속 사유로 작용할 가능성을 높이고, 구속은 범죄자의 재범을 억제하는 특별범죄예방 효과를 발휘하여 불법 스트리밍 사이트의 확산을 방지할 수 있다.
본 연구는 이러한 배경을 바탕으로 인터폴 수사관이 동일 운영자에 의해 관리된 것으로 판단한 세 개의 불법 스트리밍 사이트를 비교하고, 사이트 간 연관성을 분석하여 운영자의 동일성을 식별하는 방안을 제안한다. 구체적으로, 이미지 및 영상 서버 URL을 자동으로 수집하는 크롤링 기법과 최장 공통 부분 수열(LCS) 알고리즘을 활용하여 각 사이트에서 제공하는 이미지와 영상의 동일성 및 HTML 태그의 유사도를 비교·분석하였다. 또한, 카피캣 사이트를 함께 분석하여 작품 업로드 일시 등 콘텐츠 게시 패턴의 차이를 평가함으로써 운영자 간의 연관성을 정밀하게 파악하고자 하였다.
본 논문의 구성은 다음과 같다. 2장에서는 불법 스트리밍 사이트 간의 연관성에 관한 선행연구를 분석한다. 3장에서는 불법 스트리밍 사이트 연관 분석을 위한 프레임워크를 제시한다. 4장에서는 사례 연구를 통해 불법 스트리밍 사이트 간의 유사성을 분석하고, 카피캣 사이트와 비교하여 운영자의 동일성을 식별하는 근거를 제시하며, 운영자가 다른 사이트와의 차이를 보다 명확하게 규명한다. 마지막으로, 5장에서는 결론과 함께 논문을 마무리한다.
2. 배경 지식 및 선행 연구
불법 스트리밍 사이트란 영상, 음악, 스포츠 중계 등 다양한 콘텐츠를 저작권자의 허가 없이 실시간 스트리밍 서비스 형식으로 불법 제공하는 웹 사이트를 말한다. 국내 단속을 피하기 위해 주로 해외에 서버를 두고 운영되며, 현재로서는 방송통신심의위원회의 심의를 통해 사이트를 차단하는 것이 유일한 대응 방안이다[5]. 한국저작권보호원의 ‘2024 저작권보호 연차보고서’에 의하면 누누티비의 국내 월간 활성 사용자 수(MAU)는 1,000만명 이상으로 추정되며 이는 넷플릭스를 위협할 정도로 높은 수치였다. 누누티비 서비스의 종료 이후 약 2개월 만에 티빙, 쿠팡플레이, 왓챠 등 주요 국내 OTT 서비스들의 MAU가 100만 명 이상 증가하는 추세를 보이며, 불법 스트리밍 서비스의 폐쇄가 합법적 플랫폼 이용률 증가에 긍정적인 영향을 미친 사례로 분석된다[6].
In-Jae Yoo 외 4인[7]은 스트리밍 동영상의 시그니처 정보를 생성하는 방법을 제안하여 불법 사이트 차단 방안을 모색하였다. 본 연구에서는 이를 참고하여 영상 파일의 해시값을 추출하였다. Seungyong Choo 외 2인[8]은 유해 사이트의 다양한 정보를 수집하는 웹 크롤러를 제안하며, 이를 활용한 유해 사이트 차단 방안을 제시하였다. 해당 연구를 참고하여 웹 크롤러를 이용해 유해 사이트 정보를 수집하였다.
Chan-hee Kim 외 3인[3]은 불법 스트리밍 사이트의 경유지와 영상 URL을 자동으로 수집하여 추적하는 기법을 크롤링 방식으로 구현하고, 수집된 데이터를 분석하여 영상 URL 차단 방안을 제시하였다. KyungDai Lim 외 1인[9]은 불법 저작물을 스트리밍하는 사이트와 실제 영상을 제공하는 사이트를 분석하여 Google Analytics ID(GA-ID), 영상 스트리밍 링크가 저장된 디렉토리, 게시물 ID를 비교함으로써 사이트 간 연관성을 분석하는 방법을 제안하였다. Kiryong Lee 외 1인[10]은 최장공통부분수열(Longest Common Subsequence, LCS) 알고리즘을 활용하여 불법 사이트의 차단 및 재개설 여부를 탐지하는 방법을 제안하였다.
전술한 선행연구들은 불법 스트리밍 사이트 간의 연관성을 분석하는 다양한 방법을 제시하였으나 주로 사이트 탐지 및 차단에 초점을 맞추었으며, 사이트 간 유사도를 활용하여 운영자를 특정하거나 운영자 간의 직접적인 연관성을 분석하는 방법은 다루지 않았다. 또한, 실제 동일 운영자가 운영하는 불법 스트리밍 사이트에 대한 실증 연구를 수행하지 않았다는 측면에서 한계점을 갖는다.
본 논문은 기존 연구들이 불법 사이트 자체의 탐지와 차단에 집중했던 것과 달리, 사이트 간 구조적 유사성과 콘텐츠 배포 패턴을 종합적으로 분석하여 운영자 간의 연관성을 식별하는 방법론을 제시한다. 이미지 URL 및 영상 서버 URL을 자동으로 수집하는 크롤링 기법을 구현하여 사이트에서 제공하는 콘텐츠의 동일성을 비교하고, LCS 알고리즘을 활용하여 사이트 간 HTML 태그 구조의 유사도를 평가하며, 작품 업로드 일시를 비교하여 콘텐츠 게시 패턴의 유사성을 분석함으로써 동일 운영자를 식별하는 방법을 제안하고자 한다.
3. 불법 스트리밍 사이트 연관 분석 프레임워크
제안한 불법 스트리밍 사이트 연관 분석의 동작 흐름도는 (그림 1)과 같다. 먼저 불법 스트리밍 사이트에 접속을 시도하여 접속 가능 여부를 확인한다. 접속이 불가능한 경우 다음 사이트로 넘어가고, 접속이 가능한 경우에는 사이트의 HTML을 이용해 이미지 URL과 영상 서버 URL, HTML 태그를 수집한 뒤 수집한 내용을 분석하여 사이트 간 연관성을 파악한다. 각각의 데이터를 수집하는 방식은 다음과 같다.
(그림 1) 스트리밍 사이트 연관 분석 동작 흐름도
3.1 이미지 URL 및 영상 서버 URL 수집 알고리즘
우선, 각 사이트의 검색창 태그를 사용하여 비교할 콘텐츠를 검색한 후, 원하는 콘텐츠가 없으면 해당 사이트에 콘텐츠가 존재하지 않는 것으로 판단한다. 콘텐츠가 존재할 경우, CSS 선택자를 통해 이미지 URL과 영상 서버 URL을 추출한다. 이 과정을 모든 콘텐츠의 URL을 수집할 때까지 반복하며, 한 사이트의 URL 수집이 완료되면 다음 사이트로 넘어가 동일한 절차를 진행한다. 구현을 위해 Python의 Selenium[11]을 활용하여 여러 스트리밍 사이트에서 이미지 URL과 영상 서버 URL을 자동으로 수집하고 비교하였다. 각 사이트에서 제공하는 콘텐츠의 이미지 URL과 영상 URL을 수동으로 확인하는 것은 많은 시간이 소요되는 비효율적인 방법이기에 크롤링을 사용하여 대량의 데이터를 빠르게 수집한다.
이후 수집한 모든 사이트의 URL을 다음과 같은 방식으로 비교한다. 각 URL을 ‘/’ 기준으로 분할하여 도메인, 콘텐츠명, 콘텐츠 ID, 그 외 경로 등의 세그먼트를 추출한 후, 이를 바탕으로 사이트 간 동일 콘텐츠의 세그먼트를 비교한다. 영상 서버 URL이 다른 사이트와 다르거나 수집이 불가능한 경우, 네트워크 패킷 분석을 통해 m3u8 또는 mpd 파일의 URL을 확보한 후 ffmpeg 프로그램을 이용해 영상을 추출하고 이를 기반으로 해시값을 비교하여 일치 여부를 검증한다[12].
3.1.1 LCS를 기반으로 유사도를 측정하는 메커니즘
최장공통부분수열(LCS) 알고리즘을 기반으로 사이트 간의 HTML 태그 유사도를 측정하였다. HTML 문서는 계층적인 DOM 구조를 가지지만 일반적인 문자열로 변환하면 태그의 순서가 유지되는 경우가 많아 LCS를 활용하면 문서 내 태그의 배치를 파악할 수 있으며, 이를 활용해 웹사이트의 레이아웃과 구조적 유사성을 효과적으로 비교할 수 있다. 특히, LCS는 HTML 태그의 순서를 고려하며 가장 긴 공통 부분을 찾기 때문에 사이트 간의 핵심적인 구조적 유사성을 유지한 채 비교할 수 있다는 장점이 있다. 이러한 특성 덕분에, LCS는 일부 태그가 추가되거나 삭제되더라도 전체적인 유사성을 비교할 수 있어, 동일한 운영자가 유지하는 레이아웃 패턴을 효과적으로 식별할 수 있다.
분석을 위해 Python과 HTML 구조 파싱을 위한 BeautifulSoup 라이브러리를 활용하여 비교 대상 사이트의 HTML 코드를 수집하였다[13]. 각 도메인의 HTML 코드를 수집한 후, <script>, <style>, <meta> 등의 불필요한 태그를 제외하고, 주요 태그만을 추출하여 순서대로 나열하였다. 이를 비교 문자열로 변환한 후, (그림 2)와 같이 LCS 알고리즘을 적용하여 각 도메인 간 유사도를 측정하였다.
(그림 2) LCS 정의
주어진 두 문자열 X=X1, X2, ..., Xm과 Y1, Y2, ..., Yn에 대해 LCS를 계산하는 알고리즘은 다음과 같다. 크기가 (m+1) × (n+1)인 2D 배열 L을 정의하여, 각 원소 L[i][j]가 문자열 X의 첫 i문자와 문자열 Y의 첫 j문자 간의 LCS 길이를 저장하도록 한다. 두 문자열의 각 문자를 비교하며, 만약 X[i-1] = Y(j-1]이면, 해당 문자가 LCS에 포함될 수 있으므로 L[i][j] = L[i-1][j-1] + 1로 갱신된다. 반면, X[i-1] ≠ Y[j-1]일 경우, L[i][j]는 L[i-1][j]와 L[i][j-1] 중 더 큰 값을 선택하여 저장한다. 이 과정은 배열의 모든 원소를 채울 때까지 반복되며, 최종적으로 L[m][n]은 주어진 두 문자열의 LCS의 길이를 반환한다.
(그림 3)에서 보여지는 바와 같이, 여러 도메인 간의 메타 태그 유사도를 계산하는 알고리즘을 활용하여 입력된 각 도메인의 메타 태그 집합을 리스트 형태로 변환한다. 이후 모든 도메인 쌍에 대해 최장 공통 부분 문자열(LCS)의 길이를 산출한다. LCS 길이를 두 리스트의 길이를 반영한 정규화된 값으로 변환하여 유사도 백분율을 도출한 값이 특정 임계값 이상일 경우, 해당 도메인은 동일한 운영자로 간주된다. 본 연구에서는 이 임계값을 실증 데이터를 기반으로 80%로 설정하였다.
(그림 3) 도메인 간의 유사도 계산
4. 사례 연구
본 연구는 동일한 운영자가 관리하는 불법 스트리밍 사이트들 간의 유사성을 분석하고, 운영자의 동일성을 식별할 수 있는 근거를 제시하는 것을 목표로 한다. 이를 위하여 다음과 같은 가설을 설정하였다.
첫째, 동일한 운영자가 관리하는 불법 스트리밍 사이트들은 동일한 이미지 및 영상 서버 URL을 공유할 것이다. 둘째, 서로 다른 운영자가 관리하는 불법 스트리밍 사이트들은 각기 다른 이미지 및 영상 서버 URL을 가질 것이다. 셋째, 합법적인 OTT 서비스는 불법 스트리밍 사이트들 과는 다른 방식으로 콘텐츠를 제공할 것이다.
가설을 검증하기 위해 2021년부터 2024년까지 방영된 한국 드라마 50편과 2022년부터 2024년까지 개봉된 영화 50편을 선정하여 분석을 진행하였다. 인터폴 수사관이 동일 운영자에 의해 관리된 것으로 판단한 불법 스트리밍 사이트 A, B, C와 운영자가 다른 불법 스트리밍 사이트 D, 그리고 합법적인 OTT 서비스 E에서 제공하는 이미지 URL과 영상 서버 URL을 비교·분석하였다.
4.1 이미지 URL과 영상 서버 URL
분석 결과, <표 1>과 같이 동일한 운영자가 관리하는 사이트 A, B, C는 선정된 100개의 작품을 모두 스트리밍하고 있었던 반면, 운영자가 다른 사이트 D는 82개, OTT 서비스 E는 47개의 작품만을 보유하고 있었다. 이를 통해 운영자가 다를 경우 관리하는 콘텐츠 라이브러리가 상이함을 확인할 수 있었다.
<표 1> 보유 중인 스트리밍 콘텐츠의 개수
이미지 URL을 비교한 결과, 사이트 A, B, C는 동일한 작품에 대해 동일한 이미지 URL을 사용하고 있었다. 즉, 세 사이트는 같은 도메인에서 호스팅된 이미지 파일을 사용하였으며, URL 내 포함된 경로 구조와 파일명 규칙이 일치하였다. 반면, 운영자가 다른 사이트 D와 서비스 E는 스트리밍 중인 모든 작품에 대해 사이트 A, B, C와 다른 이미지 URL을 사용하고 있었다. <표 2>는 5개 사이트의 이미지 URL을 정리한 것이다.
<표 2> 스트리밍 사이트별 이미지 URL
영상 서버 URL을 비교한 결과, 사이트 A, B, C는 동일한 작품에 대해 동일한 영상 서버 URL을 사용하고 있었으며, 각 작품마다 2개 이상의 영상 서버가 제공되었다. 제공된 영상 서버의 유형은 <표 3>과 같다. 사용된 서버의 도메인은 두 가지 유형으로 나뉘었다. 첫째, 서버 1인 ***bxkiun.pro 도메인은 사이트 A, B, C와는 별개의 불법 스트리밍 사이트였다. 사이트 C는 이 도메인의 디렉토리가 사이트 A, B와 달랐으나, 콘텐츠 ID와 영상 재생 시 표시되는 Client ID, Player ID 등의 영상 세부 정보가 일치하여 동일한 영상 서버로 판단하였다. 둘째, 나머지 도메인들은 모두 동영상 업로드 및 호스팅을 목적으로 운영되는 사이트로, 이는 불법 저작물을 제공하는 사이트들이 특정 호스팅 플랫폼을 통해 불법 저작물을 공유하고 있음을 나타낸다.
<표 3> 사이트 A, B, C 간 영상 서버 비교
사이트 D의 영상 서버 URL과 해시값을 비교한 결과, 사이트 A, B, C와 동일한 영상 서버 URL을 제공한 콘텐츠는 드라마 3편이었으며, 해당 작품들은 ***bxkiun.pro 도메인의 URL이 사이트 D와 일치하였다. 두 번째로 사이트 A, B, C와 다른 영상 서버 URL을 사용하였으나 해시값이 동일한 콘텐츠는 드라마 33편과 영화 34편이었다. 마지막으로, 영상 서버 URL이 다르고 사이트 오류로 인해 해시값을 알 수 없는 콘텐츠는 영화 7편이었다. <표 4>는 사이트 A, B, C와 사이트 D의 영상 서버 URL을 비교한 결과를, <표 5>는 사이트 A, B, C의 해시 값이 사이트 D와 일치하는 경우를 보여준다.
<표 4> 사이트 A, B, C, D 간 영상 서버 URL 비교
<표 5> 사이트 A, B, C의 해시 값이 사이트 D와 일치하는 경우
사이트 A, B, C와 해시값이 동일한 작품들이 다수 존재하는 점을 고려할 때, 사이트 D는 사이트 A, B, C와 동일한 원본 파일을 공유하고 있을 가능성이 높다. 즉, 최초로 불법 저작물을 동영상 호스팅 사이트에 업로드한 주체가 아니더라도 동일한 저작물을 사용하여 불법 스트리밍 사이트를 운영할 수 있다는 사실을 보여준다.
한편, 합법적인 OTT 서비스인 E에서는 영상 서버 URL이 표시되지 않았으며, 모든 작품에 대해 m3u8 파일 또는 mpd 파일의 URL을 수집하였다. 이 중 mpd 파일의 URL이 수집된 작품은 영상 추출이 불가능하여, m3u8 파일의 URL이 수집된 23개 작품에 대해서만 영상을 추출하고 사이트 A, B, C의 영상과 해시값을 비교하였다. 그 결과, 23개 영상의 해시값이 사이트 A, B, C의 영상과 일치하지 않았다. 이는 불법 스트리밍 사이트들이 합법적으로 제공되는 OTT 콘텐츠를 단순히 복제하거나 재사용하는 것이 아니라, 다른 소스를 사용하거나 별도의 방식으로 콘텐츠를 불법적으로 확보하고 있음을 시사한다.
4.2 HTML 태그 유사도
LCS 알고리즘을 통해 사이트 간 HTML 태그 유사도 측정 결과, (그림 4)와 같이 도메인쌍 (A, B), (A, C), (B, C)는 모두 80% 이상의 유사도를 보였다. 특히, 사이트 A, B, C의 HTML 코드에서 <head>, <link>, <body> 등의 주요 태그 배치나 구조가 유사하였으며, 전체 HTML 태그 순서에서도 큰 차이가 없었다.
(그림 4) 사이트 간 HTML 유사도
반면, 사이트 D와 서비스 E는 각각 A, B, C와 비교했을 때 80% 이하의 낮은 유사도를 보였다. HTML 태그 구조에서 A, B, C와 명확한 차이를 보였으며, 개별 사이트의 기능적 목적과 콘텐츠 구조도 달랐다. 이러한 결과는 HTML 태그 유사도 분석을 통해 불법 스트리밍 사이트들이 운영자에 따라 서로 다른 수준의 유사도를 보이는 패턴을 가질 수 있음을 보여준다. 유사도가 높은 사이트들은 동일한 운영자가 관리할 가능성이 높으며, 반대로 유사도가 낮은 경우에는 서로 다른 운영자가 운영할 가능성이 있다고 해석할 수 있다.
따라서 LCS 기반 HTML 태그 유사도 분석은 단순히 사이트 간의 외형적 유사성을 평가하는 것을 넘어, 운영자 간의 관계를 추론하는 중요한 기준으로 활용될 수 있다.
4.3 카피캣 사이트와의 비교
본 연구에서는 동일한 운영자가 관리하는 원본 사이트 A, B, C와 이를 모방한 카피캣 사이트 A', B', C'를 비교하였다. CSS와 HTML 태그 유사도가 높은 원본 사이트와 카피캣 사이트를 활용하여 운영자가 동일한 사이트와 운영자가 다른 사이트 간의 차이를 보다 명확하게 구분하기 위한 기준을 마련하고자 했다. 앞서 선정한 100개의 콘텐츠를 대상으로 분석한 결과, 운영자가 동일한 사이트 A, B, C는 100개의 콘텐츠를 모두 제공하고 있었던 반면, 카피캣 사이트 A', B', C' 중 100개를 모두 제공한 사이트는 없었으며, 각 사이트별로 제공하는 콘텐츠의 수도 달랐다.
이미지 URL을 비교한 결과, 사이트 A, B, C는 동일한 이미지 URL을 사용한 반면, <표 6>과 같이 카피캣 사이트 A', B', C'는 각 사이트의 도메인에 기반한 개별 이미지 URL을 사용하고 있었다. 영상 서버 URL 분석에서는 사이트 A, B, C의 모든 영상의 서버 URL이 일치했으며, 카피캣 사이트 A', B', C'는 원본 사이트와 일부 영상 서버 URL이 동일한 경우가 있었으나 대부분 다른 URL을 사용하고 있었다. 그러나 카피캣 사이트에서도 원본 사이트와 해시값이 동일한 영상 파일이 다수 존재하였다. (그림 5)는 6개 사이트의 스트리밍 콘텐츠의 개수와 영상 파일을 분석한 결과를 종합적으로 나타낸 것이다.
<표 6> 원본 사이트 A, B, C와 카피캣 사이트 A’, B’, C’의 이미지 URL 비교
(그림 5) 원본 사이트 A, B, C와 카피캣 사이트 A’, B’, C’의 비교
추가로, 운영자가 동일한 A, B, C 사이트와 카피캣 사이트 A', B', C' 간의 차이를 보다 명확히 파악하기 위해, 6개 사이트에서 선정한 100개 콘텐츠의 업로드 시점을 분석하였다. 그 결과, 사이트 A, B, C는 모두 동일한 시점에 콘텐츠를 업로드한 반면, 카피캣 사이트 A', B', C'는 각기 다른 시점에 콘텐츠를 업로드하였다. 특히 사이트 A, B, C는 (그림 6)과 같이 작품의 방영 직후 신속하게 업로드되는 경향을 보인 반면, 카피캣 사이트 A', B', C'는 (그림 7)과 같이 한 번에 모든 화수가 일괄적으로 업로드되거나, 방영 시기와 무관하게 콘텐츠가 묶음 형태로 업로드되는 특징을 확인하였다.
(그림 6) 사이트 A의 작품 업로드 일시
(그림 7) 사이트 A’의 작품 업로드 일시
따라서 운영자가 동일한 사이트 A, B, C와 이를 모방한 카피캣 사이트 A', B', C'는 겉으로 보기에 디자인이 비슷하나 세부적인 콘텐츠 업로드 패턴에는 차이가 있음을 알 수 있었다.
5. 결론
본 연구에서는 동일한 운영자가 관리하는 세 개의 불법 스트리밍 사이트를 종합적으로 비교·분석하여 운영자의 동일성을 식별할 수 있는 방안을 제시하였다. 제시된 방안을 활용하면 특정 운영자가 관리하는 여러 사이트를 동시에 식별하고 차단할 수 있을 뿐만 아니라, 동일 운영자에게 여러 사이트에 대한 법적 책임을 묻고 가중 처벌을 부과하는 것이 가능할 것으로 보인다. 또한, 재범을 억제함으로써 불법 스트리밍 확산을 근본적으로 방지할 수 있을 것으로 기대된다.
연구 결과, 운영자가 동일한 사이트는 보유한 스트리밍 콘텐츠, 이미지 및 영상 서버의 URL이 동일하고 HTML 태그 구조도 매우 유사하였다. 특히 카피캣 사이트와 달리 동일 운영자의 모든 사이트에서 같은 시점에 콘텐츠를 업로드하였다. 이는 운영자의 동일성을 뒷받침하는 근거로 볼 수 있다. 이러한 연관성을 기반으로 불법 스트리밍 사이트 차단 작업을 보다 효율적으로 수행할 가능성을 제시하였다.
더 나아가 본 연구에서는 운영자가 달라도 동일한 저작물을 사용하여 불법 스트리밍 사이트를 운영할 수 있다는 점을 확인하였다. 이는 불법 스트리밍 사이트끼리 동일한 원본 콘텐츠를 공유하거나 같은 경로를 통해 불법적으로 콘텐츠를 확보하고 있음을 보여준다. 따라서 저작물의 유통 경로를 차단하는 방안이 운영자가 다른 사이트에서도 동일한 파일을 사용한 불법 스트리밍을 제한해 불법 콘텐츠의 확산을 차단할 수 있을 것이다.
향후 연구에서는 다양한 유형의 불법 스트리밍 사이트를 대상으로 확대 적용해 볼 필요가 있으며, 이를 통해 불법 콘텐츠 유통 방지와 저작권 보호를 위한 효과적인 콘텐츠 보호 대응 방안을 마련할 수 있을 것이다.
References
- Eun-ji Kim, "'10 million monthly users' of Nunu TV: Will it be blocked? The crackdown on illegal streaming," The Korea Economic Daily, Mar. 8, 2023. Available: https://www.hankyung.com/article202303085057g, 2024.11.18. confirmed.
- Jeong-seon Park, "Can't catch the content thieves... The second and third Nunu TV are running rampant," Dailyan, Feb. 7, 2024. Available: https://news.nate.com/view/20240207n25272, 2024.11.18. confirmed.
- Chan-hee Kim, Ho-jei Yu, Seo-yeon Kim and Soo-hyun Oh, Effecient Techniques to Block Copyright Infringement Illegal Streaming Sites. Journal of the Korea Institute of Information Security & Cryptology, 32(5), 837-844. 2022.
- Korean Criminal Procedure Act, Article 70(2).
- Hyo-bin Choi, Copyright Infringement Issue Report, Korea Copyright Protection Agency, 2-3, 2023.
- Jung-ryeol Park, 2024 Copyright Protection Annual Report (Comprehensive Edition), Korea Copright Protection Agency, 17, 2024.
- In-Jae Yoo, Jae-Chung Lee, Byeong-chan Park, Seok-Yoon Kim and Young-Mo Kim A, Method for Generating Signature Information to Determine Illegal Distribution of Cloud-based Streaming Video. Journal of Software Assessment and Valuation, 18(2), 239-246. 2022. https://doi.org/10.29056/jsav.2022.12.24
- Seungyong Choo, Yeseong Hwang and Sangjin Lee, Methods for Collecting Harmful Websites Using Web Crawling. Journal of Digital Forensics, 15(3), 127-138. 2021. https://doi.org/10.22798/KDFS.2021.15.3.127
- KyungDai Lim and Sangjin Lee, Presentation of Discrimination techniques through Association analysis between Harmful streaming sites. Journal of Digital Forensics, 17(3), 37-51. 2023.
- Kiryong Lee and Heejo Lee, An Automated Tech ique for Illegal Site Detection using the Sequence of HTML Tags. Journal of KIISE, 43(10), 1173-178. 2016. https://doi.org/10.5626/JOK.2016.43.10.1173
- Selenium Documentation, https://www.seleniumhq.org/. 2024.11.18. confirmed.
- FFmpeg. Available: https://www.ffmpeg.org/, 2024. 11.18. confirmed.
- Read the Docs, Beautiful Soup Documentation. Available: https://beautiful-soup-4.readthedocs.io/en/latest/, 2015 confirmed.