DOI QR코드

DOI QR Code

Comparison of online video(OTT) content production technology based on artificial intelligence customized recommendation service

인공지능 맞춤 추천서비스 기반 온라인 동영상(OTT) 콘텐츠 제작 기술 비교

  • 전상훈 (한세대학교 대학원 IT 융합학과) ;
  • 신승중 (한세대학교 대학원 ICT융합학과)
  • Received : 2021.03.12
  • Accepted : 2021.06.04
  • Published : 2021.06.30

Abstract

In addition to the OTT video production service represented by Nexflix and YouTube, a personalized recommendation system for content with artificial intelligence has become common. YouTube's personalized recommendation service system consists of two neural networks, one neural network consisting of a recommendation candidate generation model and the other consisting of a ranking network. Netflix's video recommendation system consists of two data classification systems, divided into content-based filtering and collaborative filtering. As the online platform-led content production is activated by the Corona Pandemic, the field of virtual influencers using artificial intelligence is emerging. Virtual influencers are produced with GAN (Generative Adversarial Networks) artificial intelligence, and are unsupervised learning algorithms in which two opposing systems compete with each other. This study also researched the possibility of developing AI platform based on individual recommendation and virtual influencer (metabus) as a core content of OTT in the future.

넥플릭스,유튜브로 대표되는 OTT 동영상 제작 서비스에 인공지능으로 콘텐츠를 개인별 맞춤식 추천 시스템은 보편화 되었다. 유튜브의 개인별 맞춤 추천서비스 시스템은 두 개의 신경망으로 구성되는데 신경망 하나는 추천 후보생성 모델이고 다른 하나는 순위평가 네트워크로 구성된다. Netflix의 동영상 추천 시스템은 두 개 데이터 분류 시스템으로 구성되어 있으며 콘텐츠 기반 필터링과 협업 필터링으로 나누어진다. 코로나 펜데믹으로 온라인 플랫폼 주도의 콘텐츠 제작이 활성화 되면서 인공지능을 활용한 가상 인플루언서 분야가 부각되고 있다. 가상인플루언서는 GAN(Generative Adversarial Networks) 인공지능으로 제작되는데 성격이 다른 두 시스템이 서로 경쟁하는 방식으로 학습이 반복되는 비교사(Unsupervised) 학습 알고리즘이다. 이 연구는 AI 개인별 추천 기반 플랫폼과 가상인플루언서(메타버스)가 향후 OTT의 핵심콘텐츠로의 발전 가능성도 연구해 보았다.

Keywords

Ⅰ. 서론[1][2][3][4][5]

본 연구는 코로나 펜데믹으로 홈이코노믹을 선도하는 OTT 서비스가 인공지능 맞춤 추천서비스 기반으로 콘텐츠 제작 기술 비교에 관한 연구이다.

배병환(2013)은 OTT (Over The Top)는 단순히 TV 셋톱박스에 연결하여 드라마, 영화 등 다양한 멀티미디어 콘텐츠를 인터넷을 통해 제공하는 서비스 뿐만 아니라 셋톱박스 이외에 추가로 제공되는 인터넷 기반 TV 쇼, 광고, 영화, UCG (사용자 제작 콘텐츠)와 같은 콘텐츠가 스마트폰과 태블릿 PC로도 제공되는 플랫폼이라고 정의한다.

OTNBBE_2021_v21n3_99_f0001.png 이미지

그림 1. OTT 시스템 구조

Fig. 1. OTT system structure 

*출처 : 배병환(2013) 

보스턴컨설팅그룹은 코로나 펜데믹의 영향으로 2020 년 세계 OTT 시장 규모가 1100억 달러 규모로 성장했으며, 전이슬(2020)은 국내 OTT시장규모는 2014년 1926억원 규모에서 연평균 26% 성장률을 기록하여 2020년에는 7801억원에 달하는 규모에 달한다고 발표했다. 이러한 시장 규모 확대 주요한 요인으로 넥플릭스, 유튜브, WAVVE로 대표되는 OTT 제공업체들이 제작콘텐츠를 시청자들에게 인공지능 기반 개별 맞춤식 추천 서비스를 보편적으로 제공하는데 있다. 신승중(2012)은소셜 네트워크와 빅 데이터를 활용하여 문서 분류 및 카테고리화, 정보 추출, 문서 요약, 시장 규모 예측, 소비자 반응, 추천(referral) 허브 역할을 담당하는 핵심 사용자를 파악하는 중요한 수단으로 적용되고 있다고 밝혔다. 권기철(2020)은 개방형 SNS의 기업들은 SNS 사용자들이 충분히 소통을 잘하고 있다는 지속적 메시지를 기술적로 제공해야 한다고 주장한다. 이러한 소셜 네트워크에서 데이터 기반 핵심 사용자 파악 알고리즘 적용은 국내외 온라인 기반 동영상 서비스(OTT)에서 개인별 맞춤식 콘텐츠 추천 시스템을 적용하기 위해서 AI 시스템을 도입하고 있다. 표1은 국내외 OTT 기업 현황이며, 본 논문에서는 OTT 기업 중에서 전범수(2018) 유료서비스 혹은 광고수익을 제공하는 대표적인 OTT(Over The Top) 서비스라고 정의한 유튜브와 NETFLIX의 개인별 맞춤식 콘텐츠 추천 시스템에 대해 연구하였다.

표 1. 국내외 주요 OTT 서비스 현황

Table 1. Adoption status of artificial intelligence by media companies

OTNBBE_2021_v21n3_99_t0001.png 이미지

Ⅱ. 연구기술 활용[6][7][8]

1956년 미국 다트머스 대학에서 인공지능 용어라는 단어가 처음 선보인 이후 AI 추천 알고리즘을 콘텐츠에 적용된 최초의 사례는 1997년 무비 렌즈(Movielens)가 영화에 기초적인 추천 알고리즘을 적용한 것이다. 이후, 2006년 넷플릭스의 추천 알고리즘 경진 대회를 통해서 대중들에게 AI 추천 알고리즘이 본격적으로 등장했으며 2014년 이안 굿펠로우가 새로운 이미지 데이터를 생성할 수 있는 GAN을 발표하면서 AI 알고리즘이 본격적으로 콘텐츠 제작 및 추천 알고리즘에 적용되기 시작 되었다. 이러한 AI 추천기능을 제공하는 OTT 스트리밍 서비스의 대표주자로 알파고로 유명한 구글 유튜브와 100만 달러 추천알고리즘 경진대회를 진행한 넷플릭스가 있다. 표2에 유튜브와 넷플릭스의 AI추천 알고리즘을 비교해놓았으며 시청자 선택비율이 76-90프로 내외로 두 OTT 콘텐츠에서 AI 추천 알고리즘의 시청자 콘텐츠 선택 비율이 매우 높있다.

표 2. 유튜브/넷플릭스 AI 추천 알고리즘 비교

Table 2. The comparison of YouTube/Netflix AI recommendation algorithm

OTNBBE_2021_v21n3_99_t0002.png 이미지

유튜브의 AI 추천 시스템의 전체 구조는 그림 2에 나와 있다. 시스템은 두 개의 신경망으로 구성되는데 신경망 하나는 추천 후보생성 모델이고 다른 하나는 순위평가 네트워크이다. 추천 후보 생성 모델은 사용자 파악 개별 정보인 사용자의 동영상 ID, 검색 키워드, 사용자의 위치, 나이, 성별과 사용자의 YouTube 콘텐츠 시청 이력을 파악하여 사용자가 선호하는 콘텐츠 시청 트렌드를 파악하여 심층 신경망에 입력된다. 추천모델 알고리즘은 시청자가 선호한다고 예측되는 범주 안에 존재하는 수만 개의 비디오에서 시청자가 시청할 가능성이 높을 것으로 파악되는 몇 백 개의 비디오를 선정한 후 시청 확률이 높은 비디오를 순서대로 추천한다.

OTNBBE_2021_v21n3_99_f0002.png 이미지

그림 2. 유튜브 추천 AI 구조

Fig. 2. YouTube recommendation AI structure

*출처 : Paul Covington(2016)

순위평가모델은 쿠팡 온라인 쇼핑몰 , 스트리밍 음악 서비스 스포티파이(Spotify), 온라인 호텔예약 호텔닷컴 (Hotel.com), 딜리버리 우버이츠(Uber eats) 등에서 사용하는 마케팅 도구로 사용하는 추천시스템과 유사하다. 타깃 동영상과 사용자에 대한 추천후보모델에게 적용된 다양한 정보를 기반으로 기존 시청자가 가장 높은 선택율을 보여준 동영상과 사용자가 끝까지 시청할 확률 가능성을 예측 모델링하여 동영상 몇 개를 추천하는 시스템이다. 만약 시청자가 순위 평가모델이 제시한 추천 비디오를 시청하지 않았다면 후속 추천 리스트에서는 그 비디오를 배제하게 되고 그 다음 순위의 비디오를 추천리스트로 표시하는데 이러한 프로세스가 반복되면서 사용자가 선호하는 동영상을 맞춤식으로 제공한다. 여기서 사용자들이 제외하는 비디오를 많이 제작하는 경우, 유튜브 콘텐츠 크리에이터의 계정은 서서히 AI 추천 시스템에서 배제되게 된다. 이 유튜브 추천 시스템은 시청자들의 추천수가 아닌 비디오 표시 당 시청자들의 예상 평균 시청 시간을 기준으로 맞춘다. 최서연(2021)은 유튜브가 클릭 수로 순위 평가를 기준으로 삼지 않는 이유는 광고주들과 시청자들을 보호하기 위해 클릭 기반 무효트래픽을 방지하기 위해서이다.

Netflix의 동영상 추천 시스템은 두 개 데이터 분류시스템으로 구성되어 있으며 내용 기반 필터링과 협업 필터링으로 나누어진다. 내용 기반 필터링은 콘텐츠의 내용 특성을 분석하는 시스템이다. 시청자들이 원하는 콘텐츠 범주와 선호도를 파악한 후에 그에 부합하는 콘텐츠를 추천하는 것이 콘텐츠 기반 필터링이다. Netflix 는 이 콘텐츠 기반 필터링의 대량의 데이터를 반복 학습프로세스를 진행한 후 최소 단위까지 추출하게 된다. 이 최소단위로 추출된 데이터는 시청자들이 선호할 가능성이 높은 비슷한 범주 데이터들을 엮는데, 이러한 데이터들은 분석 대상 콘텐츠들마다 고유의 특성파일을 구성한다.

협업 필터링은 콘텐츠 자체가 아닌 기존 시청자의 콘텐츠 선호 정보를 분석해 타깃 사용자와 유사한 선호도를 보이는 사용자 그룹들에게 기존시청자들이 좋아했던 콘텐츠를 추천하는 방식이다. 즉, 타깃 사용자와 유사한 성향과 선호도를 가진 것으로 추정되는 기존 사용자 그룹을 가정하여 이들의 시청 패턴 결과를 기반으로 콘텐츠 추천 대상으로 분류된 시청자에게 콘텐츠를 추천한다. 협업 필터링의 장점은 콘텐츠 기반 필터링과 달리 콘텐츠의 특정 내용을 분석 할 필요가 없다. 이 두가지 필터링을 결합하기 위해 Netflix는 시청자들의 데이터, 적용할 모델을 결정하기 위한 가설 생성, 마지막으로 사용자에게 가장 적합한 일치를 식별하기 위한 다양한 모델을 제시 후 다음 단계에서 기계 학습 알고리즘을 통해 모델을 훈련하게 된다. Netflix 사용추천 시스템을 위한 감독 및 비 감독 알고리즘을 적용하여 컨텍스트, Hadoop을 통해 대량의 데이터 실행하게 되는데 이 데이터들은 시청자들이 시청하는 라이브 서비스에서 수집된다. 이러한 데이터를 가공처리 후 시청자들의 선호 패턴 데이터를 추후 고객들의 선호도에 맞춘 콘텐츠 추천 항목으로 연결시키는 시스템이다.

OTNBBE_2021_v21n3_99_f0003.png 이미지

그림 3. 머신러닝 활용한 넷플릭스 DT 구조

Fig. 3. Netflix DT structure using ML

*출처:Akter(2018)

협업 필터링의 장점은 각 시청자의 취향과 성향을 면밀히 파악해 시청 영상을 추천할 수 있다는 점이다. 반면, 각 시청자의 정보나 선호 콘텐츠에 대한 데이터가 없다면 추천 자체가 불가능하다. 이용자가 많아질수록 데이터의 크기가 방대해지고, 처리하는 과정이 오래 걸려 효율성이 저하된다. 콘텐츠 기반 필터링의 장점은 적은 시간과 비용을 가지고 빠르게 데이터를 처리하고 추천할 수 있으나 유사한 영상들을 계속 추천하기 때문에 다양성 부족과 시청자 개인의 취향을 파악할 수 없는 단점이 존재한다. 또 다른 단점은 사용자가 자신만의 골짜기에 갇혀버리는 ‘필터 버블’이 일어날수도 있다는 점이다. ‘필터 버블’이란 시청자가 개인 추천 알고리즘에 의해 필터링 된 정보 속에 갇히면서 그 정보를 자신의 기준에서 선택할 수 있는 능력을 상실하는 왜곡현상이다.

OTNBBE_2021_v21n3_99_f0004.png 이미지

그림 4. 협업/ 콘텐츠 기반 필터링 구조

Fig. 4. Collaboration/content-based filtering structure

*출처:비트 나인 블로그

표 3. 협업/콘텐츠 기반 필터링 장단점 비교

Table 3. Comparison of the advantages and disadvantages of collaboration/content-based filtering

OTNBBE_2021_v21n3_99_t0003.png 이미지

III. AI영상 콘텐츠 제작 패러다임 변화

1. 세계 미디어 시장과 가상 인플루언서[9]

2020년 코로나 펜데믹으로 기존 오프라인 제작환경의 핵심이었던 영화나 방송 같은 기존의 플랫폼은 쇠퇴하고 대신 넷플릭스나 유튜브 같은 온라인 플랫폼 주도의 콘텐츠 제작이 활성화되고 있다. 이러한 변화는 이용자 유입을 위한 콘텐츠 확보가 핵심적인 전략으로 자리 잡게 되었고 새롭게 떠오르는 분야가 GAN 인공지능 기술을 활용한 가상 인플루언서 분야다.

표 4에서 나타나듯이 세계 영상 미디어 시장 규모는 2023년에는 1조 8천억 달러 규모로 성장할 것으로 한국콘텐츠 진흥원에서 분석하고 있다. 이 영상 미디어 콘텐츠와 AI가 결합된 콘텐츠가 가상 인플루언서 분야이다. 장혜수(2020)는 인플루언서 분류 기준으로 인스타그램 (Instagram) 팔로워 규모에 따라 팔로워 오백 명 이하일 때 ‘나노(nano) 인플루언서’, 오백 명에서 만 명 정도 팔로워를 지닐 경우 ‘마이크로(micro) 인플루언서’ , 만 명에서 백만 명 정도의 팔로워를 확보한 ‘매크로(macro) 인플루언서’, 백만 명 이상의 팔로워가 존재할 경우 ‘메가(mega) 인플루언서’로 정의했다. 이 기준에 따르면, 300만 팔로워를 가지고 있는 메가 인플루언서인 릴 미켈라(Lil Miquela), 30만 팔로워를 가진 매크로 인플루언서인 일본 이케아 유튜브 모델로 유명한 임마(IMMA), 세계 최초 디지털 패션모델이자 20만 인플루언서를 가진슈두 (Shudu), CES 2021 LG전자 프레스 컨퍼런스에 MC로 등장한 레아(LEAH)등이 있다.

표 4. 세계 영상 미디어 시장 규모 및 전망(2020-23)

Table 4. Global video media market size and forecast (2020-23)

OTNBBE_2021_v21n3_99_t0004.png 이미지

*출처 한국콘텐츠진흥원(2019) 재구성

표 5. 세계 가상인풀루언서 사례와 기술 및 특징(2021)

Table 5. Cases and Features of the Global Virtual Influencer (2021)

OTNBBE_2021_v21n3_99_t0005.png 이미지

2. 가상인플루언서 제작 기술[10]

인플루언서 마케팅의 핵심요소인 가상인플루언서는 GAN(Generative Adversarial Networks)이라는 딥페이크 기술을 주로 이용해서 만들어진다. 이승민(2018)은 GAN(생성적 적대 신경망)은 가상인플루언서는 GAN(Generative Adversarial Networks) 인공지능으로 제작되는데 성격이 다른 두 시스템이 서로 경쟁하는 방식으로 학습이 반복되는 비교사(Unsupervised) 학습알고리즘으로 정의한다. GAN의 설명에서 가장 많이 등장하는 것이 위조지폐와 진폐를 구분하는 것이다. 위조지폐를 생성자(Generator)로 진폐에 해당하는 구분자 (Discriminator)를 구분하여 반복적으로 학습시킨다. 생성자의 목적은 가짜 데이터 반복적으로 학습시켜서 구분자가 구별 못하도록 가짜를 정교하게 만드는 것이고, 구분자의 목적은 생성자가 만든 진짜에 가까운 가짜 데이터와 진짜 데이터를 구분하도록 학습하는 것이다. 이 둘을 함께 학습시키면서 마지막에는 진짜와 구분할 수 없는 실제와 같은 정교한 가짜를 만들어내는 생성자를 얻을 수 있다. 이러한 비교사 학습 알고리즘 진행과정을 적대적 학습(Adversarial Training)이라고 정의하며 이 학습은 GAN 알고리즘의 핵심이다.

OTNBBE_2021_v21n3_99_f0005.png 이미지

그림 5. GAN 구조 및 원리

Fig. 5. GAN structure and principle

*출처:이승민(2018)

이러한 GAN 기술은 더욱 발전되어 200여 가지의 파생 모델이 있음은 물론 OTT를 비롯한 여러 콘텐츠 제작 분야에 적용이 되고 있다. 표 6은 GAN기술을 이용한 콘텐츠 제작 현황을 정리한 것이다.

표 6. GAN 기술 콘텐츠 응용분야

Table 6. GAN technology content application field

OTNBBE_2021_v21n3_99_t0006.png 이미지

Ⅳ. 향후전망 및 평가[11]

이현주(2020)는 콘텐츠분야 뿐만 아니라 예술 분야에서도 ICT 기술을 활용하여 관객과 예술가와 함께 작품에서 적극적으로 참여하고 소통하는 체혐형 인터랙티브아트의 시대가 열리고 있다. 아트 분야뿐만 아니라, OTT 콘텐츠 제작 분야에도 GAN을 비롯한 AI 알고리즘이 필수 기술로 적용되고 있다. 이러한 체험형 콘텐츠 제작은 빠른 속도로 기존의 방송과 영화사라는 일 방향 오프라인 플랫폼을 대체하면서 AI알고리즘을 기반 가상 온라인플랫폼(메타버스)이 트렌드를 주도하고 있다. 이러한 AI 알고리즘 기반 가상 온라인 플랫폼은 스마트폰과 자율주행차(UAM 포함), 스마트폰과 냉장고, AI 스피커와 TV 등 다양한 스마트 기기들을 통해서 콘텐츠 이용자와 데이터 소통을 통해 최적의 콘텐츠를 선별해낸다.

OTNBBE_2021_v21n3_99_f0006.png 이미지

그림 6. NETFLIX 스테이션 N - 넷플릭스 과학 박람회

Fig. 6. NETFLIX Station N-Netflix Science Fair (Virtual Platform)

그러므로 콘텐츠 제작자들은 OTT 서비스 회사가 제공하는 인공지능 기반 콘텐츠 이용자에 대한 이용 데이터 유형분석은 물론 다양한 시각을 통하여 빠르게 변화하는 이용자들의 가상현실 콘텐츠 제작 능력을 확보해야 한다.

IV. 결론

본 연구는 콘텐츠 산업분야에 사용되는 AI 추천알고리즘을 분석하여 OTT 스트리밍 콘텐츠 제작 기술을 분석하였으며 시청자들은 콘텐츠 선택 시 AI추천 알고리즘을 상당히 참고하는 것으로 나타났다. 최근 가상 인플루언서 제작환경에서 GAN이라는 AI알고리즘으로 제작되고 있으며 이 시장은 코로나 펜데믹으로 메타버스 시장으로 더욱 확대되고 있다. 특히 맥킨지는 가상 인플루언서에게 소비할 밀레니얼 세대와 Z세대의 시장규모로 미국에서만 3500억 달러(400조원)에 이를 것으로 예측했다. 끝으로 AI 개인별 추천 기반 플랫폼과 가상세계플래폼(메타버스)의 향후전망이나 변화의 추이 등을 감안하여 볼 때 OTT의 시장규모가 확대되는 환경 하에서 AI 기반 가상인플루언서가 OTT의 핵심콘텐츠로의 발전은 인공지능 맞춤 추천서비스와 가상세계플랫폼의 관계를 더욱더 경제적인 자산과 경쟁력의 강화 기준으로 제시 할 수 있을 것이다.

References

  1. Byung-Hwan Bae, "OTT(Over The Top) service", Korean Internet & Security Agency Internet & Securisty Issue, pp 44-48. 2013. DOI:https://www.kisa.or.kr/uploadfile/201306/201306101739593444.pdf
  2. I-sl Jeon, "Trend - Changes in lifestyle and rapidly changing domestic OTT market status", Monthly SW Centered Society of SPRI, No. 3. 2020. DOI:https://spri.kr/posts/view/22907?code=industry_trend
  3. Seung-Jung Shin, "SNS using Big Data Utilization Research.", The Journal of The Institute of Internet, Broadcasting and Communication(JIBC), Vol. 12. No. 6. pp 267-272. 2012. DOI: http://dx.doi.org/10.7236/JIWIT.2012.12.6.267
  4. Bum Soo Chon, "Standing at the center of global media for OTT service", Broadcasting Trend & Insight. Vol. 14. No.1. 2018. DOI:http://www.kocca.kr/trend/vol14/sub/s42.html
  5. Ki Chol Kwon, "The Effects of Perceived Value and Stress on Continuous Intention in SNS : Focused on the Moderating Effect of SNS Type', Journal of the Korea Academia-Industrial cooperation Society, Vol. 21, No. 12 pp. 120-130, 2020. DOI:https://doi.org/10.5762/KAIS.2020.21.12.120
  6. Paul Covington, Jay Adams, Emre Sargin, " Deep Neural Networks for YouTube Recommendations", The 10th ACM Conference on Recommender Systems, ACM, New York, NY, USA, 2016. DOI:http://dx.doi.org/10.1145/2959100.2959190
  7. Shahriar Akter, "Transforming business using digital innovations: the application of AI, blockchain, cloud and data analytics", . Annals of Operations Research. 2020. DOI:https://link.springer.com/article/10.1007/s10479-020-03620-w
  8. Seoyeon CHOI, "A Study on Veracity of Raw Data based on Value Creation -Focused on YouTube Monetization", The International Journal of Internet, Broadcasting and Communication(IJIBC),vol.13, no.2, pp. 218-223, 2021. DOI:http://dx.doi.org/10.7236/IJIBC.2021.13.2.218
  9. Hea-soo Jang, " Research on Consumer Perceptions of 3D Virtual Influencers", Graduate School of Keimyung University, 2020.
  10. Seung-min Lee, " After deep learning, AI algorithm trend", ETRI Insight Report, Vol. 10. 2018.
  11. Hyeonju Lee, " Production Technique of Realistic Contents based on Interactive Media", Journal of KIIT, Vol. 18, No. 12, pp. 121-129, 2020. DOI:10.14801/jkiit.2020.18.12.121