인공지능 추천 알고리즘, 규제는 어떻게?

Jeremy 2021-07-14 댓글 남기기

스티브 잡스는 생전에 이런 말을 남겼다.
“사람들은 당신이 보여줄 때까지 원하는 것이 무엇인지 모른다"
(“People don’t know what they want until you show it to them.”)

이 말은 모든 인터넷 플랫폼들이 개인화된 고객 경험을 만들어 내는 기술을 은유적으로 표현한 것이다. 사람들이 좋아하지만 스스로 발견할 가능성이 낮은 콘텐츠들을 추천하는 기술은 미디어 OTT, 커머스 등 모든 플랫폼의 경쟁력이 되었다.

AI 추천서비스, 규제안(기본원칙) 발표

얼마 전 방송통신위원회는 ‘인공지능 기반 미디어 추천 서비스 이용자 보호 기본원칙’을 발표했다. 넷플릭스, 웨이브 등의 AI 기반 추천 서비스에 대한 자율규제 지침이다.

"기본원칙에 따르면 서비스 제공자는 알고리즘 추천 시스템을 이용해 서비스를 제공하고 있다는 사실을 이용자에게 통지·표시해야 하고, 콘텐츠의 배열 순서와 방식을 결정하는 '주요 기준'을 이용자가 이해하기 쉬운 형태로 게시하거나 약관에 명시해야 한다. 이때 공개하는 '주요 기준'은 알고리즘 자체를 의미하는 것이 아닌 알고리즘이 이용자에게 콘텐츠 추천을 하는 일련의 기준을 의미한다."

- 미디어스 관련 기사 중 발췌 (독자분들 중 아직 이 규제 내용을 모르신다면 위의 기사를 읽고 함께 고민해보기를 희망한다)

본 이슈에 대해 업계의 시각은 부정적이며 일부 학계의 시각은 ‘기대’와 ‘우려’가 섞여 있다. 특정 산업에 대한 규제는 두 가지 시선이 모두 존재하는 게 당연하다.

글로벌 OTT에 뒤지는 국내 OTT의 추천 기술

매해 성장을 거듭하고 있는 OTT 미디어 산업에서 AI 기반 추천은 어느 정도 수준 이길래 자율 규제 대상으로 거론되는 것일까? 추천 알고리즘의 투명성이 부족하고 추천 결과의 편향성이 빈번해서 이용자 불편과 항의가 속출하고 있는건가? 필자의 의문은 여기서 출발하고자 한다.
글로벌 OTT와 국내 OTT 진영의 추천 기술 수준은 격차가 매우 크다. AI추천 자율 규제의 3대 원칙인 투명성, 공정성, 책무성을 지키기 위해서는 추천 서비스에 대한 약관 명기, 추천 기준을 고객이 알기 쉽도록 정보전달(앱 푸시 등), 추천 서비스를 변경할 수 있도록 하는 옵션 선택, 소비자 분쟁 발생 시 적극적 태도로 문제 해결 등을 해야 한다고 권고한다.

넷플릭스의 추천 작동 방법은 고객센터 홈페이지에 이와 같이 게시되어 있다.

넷플릭스는 개인화된 추천 콘텐츠를 제공하여 관심 있는 TV 프로그램 및 영화를 쉽게 찾도록 도와주는 멤버십 서비스입니다. 이러한 비즈니스 모델의 구현을 위해 넷플릭스는 복합 추천 콘텐츠 시스템을 독점적으로 구축했습니다.

이 설명과 함께 추천의 기술 로직에 대해 고객 언어로 쉽게 설명하고 있다. 넷플릭스 별도 항목에서 고객이 시청한 TV 프로그램 및 영화 장르, 회원이 이전에 평가한 콘텐츠, 회원의 시청 기록, 사용자와 취향이 비슷한 회원의 평가 등을 참고하여 추천한다고 명기하고 있다. 이 정도 수준이라면 방통위 권고 사항인 공개성 원칙을 준수하고 있다. 그렇다면 국내 OTT들은 어떠한가? 추천과 관련된 고객 공지 사항을 찾아보기 힘들다.

넷플릭스와 달리 국내 OTT들의 콘텐츠 큐레이션은 추천 시스템의 작동 범위가 적다. 넷플릭스의 앱 화면은 고객마다 개인화되어 모두 다르게 제공된다. 하지만 국내 OTT들의 앱 화면은 90%가 모두 동일하게 제공된다. 이 차이는 기술의 우위력 차이이기도 하지만 플랫폼 철학이 다르기 때문이다.

국내 OTT 1,2위인 웨이브, 티빙은 넷플릭스 보다 콘텐츠의 양이 3~4배 많다. 매주 쏟아지는 방송 콘텐츠의 수가 20여 편이 넘는다. 국내 OTT들은 신작 위주의 큐레이션에 집중한다. 반면에 넷플릭스는 오리지널 콘텐츠에 비해 압도적으로 많은 구작 콘텐츠의 시청을 유도하는데 기술을 집중한다.

넷플릭스 추천 엔진은 구독자가 앱을 여는 순간 몇 초 안에 매력적인 콘텐츠를 찾도록 도와주어 다른 OTT로 이탈하는 것을 방지하기 위해서 존재한다. 이를 넷플릭스는 “90초의 승부”로 정의한다. 넷플릭스는 구독자의 동영상 선택의 80%가 추천에서 발생한다고 주장한다. 만일 추천 엔진이 없었다면 고객이 이탈하여 매년 10억 달러의 손실을 입을 수 있다고 평가한다.

2010년부터 고도화된 넷플릭스 추천 기술은 최초에는 수작업으로 코딩되었다. 하지만 현재는 2억 명이 넘는 전 세계 구독자 프로필과 5천여 편의 콘텐츠마다 수백 개의 속성을 메타데이터로 입력하여 이를 AI 및 머신러닝(ML) 기반 시스템으로 자동화되어 각기 다른 개인화 화면으로 전송된다.

반면에 국내 OTT들은 콘텐츠 관리 시스템(CMS)에 수작업 또는 반자동 작업으로 입력된 신작 목록, 랭킹 데이터, 콘텐츠 장르 기반 추천, 고객 데이터 기반 추천 목록들이 복합 제공된다. 큐레이션 목록 들의 일부만이 이용자의 시청 기록을 분석한 추천 리스트들이다. 넷플릭스의 추천 기술을 '100'으로 놓고 국내 OTT들의 수준을 비교한다면 ‘50’ 이하로 평가될 수밖에 없다.

OTT 미디어 추천의 편향성은 구조적으로 낮다

방통위가 추진하는 추천 자율규제는 넷플릭스가 주요 대상일 수밖에 없다. 국내 OTT들은 추천 기술을 글로벌 수준까지 강화하는 것도 어려운데 규제부터 고민해야 하는 이상한 현실과 조우하게 된다. 결국 실효성이 크지 않다.

미디어 추천은 이용자들에게 빠른 검색과 적합한 콘텐츠를 선택할 수 있는 편의성을 제공한다. 추천의 불공정성은 기술 알고리즘이 특정 집단 등을 차별화하거나 편향된 추천 결과만을 제공할 수 있다는 우려이다. 넷플릭스와 웨이브, 티빙 등은 심의 절차를 거친 콘텐츠들을 제공한다. 이미 유해성 콘텐츠는 심의 단계에서 걸러지기 때문에 편향된 결과로 이어질 가능성은 그만큼 낮다. 공상과학 영화를 많이 시청한 이용자에게 동일 장르의 구작 콘텐츠만 보이는 것이 토론회 과정에서 ‘편향성’ 사례로 언급되기도 했다.

추천 기술은 소위 ‘콜드 스타트'(cold start : 데이터가 없는 상태에서 결과를 출력할 콘텐츠가 부족한 상태)를 가지고 있다. 이를 방지하기 위해 넷플릭스, 왓챠등은 첫 번째 가입 시에 선호하는 콘텐츠 목록을 선택하게 하거나, 선호 콘텐츠에 찜 기능을 장려하거나, 특정 콘텐츠의 시청 시간 등을 분석하는 등 추천 결과의 다양성을 위해 노력한다.

추천 편향성의 위험 지대 ‘유튜브’

오히려 편향성 문제는 유튜브를 주목해야 한다. 유튜브는 하루 2억 개 이상의 콘텐츠들을 추천한다. 철저하게 고객의 시청기록에 기반하여 유사한 콘텐츠들을 추천한다. 유튜브는 한국을 포함한 수많은 국가들에게 추천 알고리즘의 편향성 시비에 휘말려 있다. AI 기반 추천은 증오심 표현, 정치적 극단주의, 허위/가짜 뉴스들을 여과 없이 이용자들에게 제공해왔다.
유튜브의 추천 알고리즘은 이용자의 과거 행동에 기반한 시청 기록과 해당 콘텐츠의 유사 장르를 관심사로 분류하여 결과물을 추천한다. 특정 채널을 많이 시청하면 동일한 항목이 더 많이 제공된다. 이용자는 추천되는 콘텐츠를 ‘대세’로 믿는 확증편향에 감염된다. 이러한 유튜브 알고리즘의 편향성 이슈는 미국과 유럽 등지에서 우려와 비판을 받아왔다.

알고리즘은 콘텐츠의 ‘좋고 ‘나쁨’을 구분하지 않는다. 오로지 시청 시간을 증식하는 데에만 집중한다. 유튜브는 넷플릭스 등과 달리 누구나 콘텐츠를 올릴 수 있는 ‘오픈 마켓’이다. 유튜브는 콘텐츠의 저작 권리, 불법 콘텐츠 등을 식별, 차단, 신고하는 영역에 기술을 집중하고 있다. 그러함에도 불구하고 유튜브가 정한 가이드라인에 위배되는 콘텐츠들을 국가마다 완벽하게 차단할 수 없다는 점에서 ‘감시’가 필요하다.

미국의 모질라재단은 끊임없이 유튜브의 편향성 이슈를 문제 제기하고 조사와 분석을 통해 유튜브에 시정을 요청해 왔다. 모질라는 2020년 자체 조사 결과 이용자에게 추천된 영상 중 12%가 유튜브 가이드라인을 위반한 콘텐츠 임을 밝혀내고 유튜브가 스스로 편향성 문제를 인정하고 수정 의지를 밝히도록 이끌어 내었다. 가짜 기적 치료제 홍보 영상, 지구가 평평하다고 주장하는 동영상, 911 테러에 대한 가짜 뉴스 등을 유튜브 커뮤니티 가이드라인에 포함시켜 삭제 및 수정을 요청하는 시민 감시 역할을 지속 수행하고 있다.

구글은 올해 초 VVR(Violative View Rate)라는 측정 지표를 공개하기 시작했다. 1만 번의 조회수 중에서 위반 콘텐츠가 얼마나 포함되었는지에 대한 지표이다. 유튜브의 주장으로는 직후 VVR은 0.16%~0.18% (1만 조회 수 중에 16회~18회의 위반 콘텐츠 발생) 수준이라고 한다. 이는 2017년 대비 70% 감소했다는 것이 유튜브의 주장이다. 추천의 공개성, 투명성은 마치 창과 방패와 같다. 미국 시장에서 이런 움직임은 그만큼 시민 사회의 감시 기능이 지속적으로 역할을 했기 때문이다. 국내에서도 유튜브의 편향성 문제는 지속적으로 문제가 되어왔다. 이번 방통위의 AI 추천 자율 규제가 유튜브 까지를 포함 하지는 않는 것으로 보인다.

규제는 소비자 후생을 강화하고, 기업들의 기울어진 운동장을 평균적으로 수렴해주는 역할을 통해 ‘바람직한 혁신’을 만들어내는데 의미가 있다고 믿는다. 국내 OTT들이 추천 기술과 서비스 역량을 넷플릭스 수준까지 끌어올리기 위해서는 투자와 시간이 필요하다. AI추천 규제는 자율이라고 하더라도 아직은 불필요한 의무이다. 오히려 규제의 시선은 다른 곳으로 향해야 한다.

<관련 게시글>