아마존 X-RAY의 진화 : GEN AI 활용법
영화나 드라마 시청 중에 출연진이 궁금하거나 삽입된 배경 음악이 궁금해질때가 있습니다.
시청자들은 모바일을 들고 구글을 찾을 수 있지만 아마존이 제공하는 X-Ray 서비스를 이용하면 리모컨을 눌러 이런 정보들을 손쉽게 확인할 수 있습니다.
특히 스포츠 생중계 중 양쪽 편 선수들의 과거 기록들도 찾아볼 수 있는 점은 매우 편리한 기능입니다.
이런 종류의 서비스들은 한국의 IPTV들도 몇년 전부터 제공해 오던 기술입니다.
최근 아마존은 이 기능에 새로운 기술을 보강했습니다.
X-Ray Recap 출시
시청자들이 새로운 시즌의 드라마가 공개되었을때 이전 시즌의 줄거리가 궁금하거나, 전편 시리즈 중 중간에 드라마를 이어보고 싶을때 이전 회차의 줄거리도 궁금해질때까 있습니다.
이럴때 ‘X-Ray Recap’ 버튼을 누르면 됩니다.
이 기능을 사용하면 시청자는 선택한 드라마의 모든 지점을 빠르게 텍스트로 요약하여 볼 수 있습니다. “AI 요약” 이라고 불러야 하겠군요.
AI 요약 기능 : 스포일러 방지
드라마를 일시 중지한 순간 까지 요약하거나 그 지점 까지 전체 쇼에 대한 정보를 읽거나 지난 시즌에 무슨 일이 있었는지 ‘텍스트’로 화면위에 요약하여 보여줍니다. (아래 화면)
흥미로운 점은 이 기능은 ‘스포일러’를 걸러낸다는 점 입니다.
이 요약은 시청한 지검을 중심으로 조정됩니다. 현재 에피소드의 줄거리, 현재 시즌에서 지금 까지 발생한 드라마의 스토리, 새로운 시즌을 시청하기 전 지난 시즌에 대한 기억을 되살려 줍니다.
아마존 프라임 비디오 세부 정보 페이지에서 언제든지 ‘X-Ray Recap’을 시작할 수 있습니다.
생성형AI 서비스 활용 증가
이 서비스가 획기적인 기술이라고 평가하기는 어렵습니다. 생성형 AI 출현이후 텍스트 기반의 뉴스, 논문, 블로그등을 요약해주는 구글의 ‘Notebook LM’ 도 출시되어 있습니다. 이 기술은 ‘유투브 링크’를 넣으면 동영상 내용도 요약합니다.(다만 스크립트가 제공되는 영상만 가능하군요.)
‘X-Ray Recap’은 아마존 Bedrock 에서 맞춤형 AI 모델을 결합하여 제공됩니다.
Amazon Bedrock은 Anthropic, Cohere, Meta, Mistral AI 등 아마존이 만든 생성형AI와 외부의 기술들을 포함하여 다양한 고성능 파운데이션 모델을 단일 API를 통해 제공하는 관리 인프라입니다.
구글TV도 도입
지난 5월 구글은 ‘구글TV’ 에 AI를 활용하여 ‘추천 및 한줄 요약’ 을 제공한다고 발표한 바 있습니다.
구글의 생성형AI인 ‘Gemini’를 사용하여 구글TV에서 추천 및 콘텐츠 설명을 이용자가 영화등을 선택할 수 확인할 있습니다.
아마존의 ‘X-Ray Recap’이 사용자가 원하는 지점이나 이전 시즌을 선택하는 등 개인화 기능을 갖추고 있고 ‘스포일러 방지’ 가 가능하다는 점에서 구글TV의 AI요약 기능 보다 우위에 있습니다.
‘X-Ray Recap’은 아마존이 제조하는 Fire TV와 특정 콘텐츠에만 제공되고 이후 아마존의 MGM 영화, 시리즈등으로 확대할 예정입니다. 생성형 AI를 ‘X-Ray Recap’에 적합하도록 충분히 훈련시키는 기간을 벌기 위함이겠죠.
생성형AI가 자막, 영상 안에 대화, 다양한 영상 속 장소와 음악 등을 분석하여 텍스트 요약 이외에 제공될 수 있는 콘텐츠 단위들을 더 서비스로 만들어 나갈 수도 있습니다.
마치 리모컨에 ‘GPT 버튼’이 생기는 것일까요?
한국의 KT : AI 골라보기
최근 한국의 통신회사들 사이에서는 AI셋톱박스 출시 경쟁이 한창입니다. 이중에서 KT가 개발한 AI 셋톱박스에도 재미있는 AI 활용 기술이 들어가 있습니다.
시청자가 특정 인물이나 장면을 호출 하면 이것들만 묶어서 시청자들에게 제공합니다. ‘AI골라보기’ 라는 이름의 서비스입니다.
마치 유투브에서 특정 장면들이나 배우, 가수들의 영상을 편집하여 제공하는 ‘숏츠’ 처럼 시청자의 입맛에 맞게 빠르게 편집하여 제공하는 버전입니다.
이 서비스가 시청자들이 음성 입력을 통해 시청자가 원하는 모든 명령을 수행하여 편집 영상을 호출하는지는 분명하지 않습니다.
생성형AI가 시청 가치 증대
생성형 AI를 OTT와 IPTV 등 미디어 플랫폼에 활용하는 사례들은 앞으로 더 늘어나게 될 것입니다. 생성형AI를 영상 시청을 위한 편의 기능으로 만들면 시청자들의 시청 시간을 늘리거나 특정 스트리밍의 충성도를 높이는데 기여할 수 있기 때문입니다.
AI가 영상 안에 객체, 대사, 자막, 장소 등 수많은 요소들을 시간으로 파악하고 이를 분석하는 기술의 난이도는 구현의 방법 보다 반복적 훈련과 결과 값에 대한 정확도를 측정하여 시청자가 만족할 수준의 품질을 만들어 내는게 관건입니다.
AI가 미디어 시청환경을 더욱 흥미롭게 바꾸어가는 다양한 서비스들의 혁신을 기대하겠습니다.
jeremy797@gmail.com