시각장애: 5.5억명의 인구가 당면할 새로운 차별을 마주해야 할 때

바야흐로 유튜브가 제1의 SNS 서비스로 자리잡은 동영상의 시대, 하지만 전세계적으로 4천만명의 맹인과 2억명의 중증시각장애인에겐 이런 변화가 달갑지만은 않습니다. 노령사회로의 빠른 진입 역시 마찬가지의 사회적 문제로 대두되고 있습니다. LANCET 보고에 따르면 2050년 무렵에는 무려 5.5억명의 사람들이 중증시각장애로 어려움을 겪을 것이라는 부정적인 전망을 내 놓기도 합니다. 앞이 잘 보이지 않는 이들에게 지금의 지식혁명은 기회의 차별을 만드는 새로운 글로벌 이슈로 부상하고 있는 것입니다.

Lancet Causes of vision loss worldwide, a systematic analysis

 

열린자막프로젝트(OTP)의 등장이 지식혁명의 기폭제가 되다

2017년 기준으로 유튜브만 놓고 보았을 때 단지 1분만에 300시간 분량의 영상들이 업로드되고 있습니다. 전세계 무려 15억명의 인구가 매일 50억개의 영상을 평균 40분 가량을 시청할 정도로 그야말로 영상 전성시대가 되었습니다[출처:Statista]. 흥미 위주의 컨텐츠라서 그럴까요? 세계지성의 향연 TED를 보겠습니다. 다소 재미요소 보다는 지적이고 어려울 수 있는 아이디어들의 보고인 TED토크의 컨텐츠 조회수는 10억 뷰를 기록할 정도로 인기를 구가하고 있습니다.

그 핵심 중의 하나는 자막입니다. 자막 시스템은 외국어가 익숙하지 않거나 불가능한 전세계의 수많은 사람들, 자막을 읽을 수 없는 어린이, 또한 청각장애인에게 세계의 지식을 접할 수 있는 혁신적인 촉매를 제공합니다. 이른바 지식혁명의 기폭제라고 해도 과언이 아닐 정도로 직관적인 기능 대비 그 가치는 헤아릴 수 없을만큼 큰 것입니다.

세계 언어 지도: 여전히 우리는 다른 언어의 세계에서 살아갑니다

 

인기있는 영상 플랫폼들은 자체 또는 열린자막시스템을 이용해서 제작된 자막을 영상에 오버레이하는 방식으로 보여줍니다. 누구나 소셜 로그인으로 번역시스템에 로그인하여 원하는 영상을 지정, 자막을 작성할 수 있습니다. 주요 문단 단위로, 사람이 읽기 자연스러운 단위로 자막이 작성되고 이를 동기화합니다. 유튜브는 자체 자막 기능을 제공해서 손쉽게 자막을 작성할 수 있고, TED, Udacity 등의 교육 플랫폼은 AMARA라고 하는 열린자막시스템을 통해 제작되는 자막을 동기화하여 화면에 보여줍니다.

지식플랫폼과 열린번역시스템 관계. OTP시스템은 OpenAPI로 외부의 지식플랫폼에 구조화된 자막 데이터를 제공합니다.

 

단순히 자막시스템이라고 할지 모르겠지만, TED를 기준으로 봐도 자막시스템의 도입과 영상의 조회수는 뚜렷한 상관관계를 보인답니다. 결국 번역된 자막을 통해 확산가치가 있는 아이디어들이 언어의 장벽을 넘어, 장애의 장벽을 넘어 세상에 전해질 수 있는 기회를 가지게 되는 것입니다.

TED영상 시청수와 열린자막시스템 도입 시점 관계

 

읽을 수 없는 이들을 위한 솔루션의 도입 필요성

이처럼 지금의 세계에서 일어나는 일들이 자막과 더불어 세상에 널리 전해지고 있습니다. 이에 반해 시각장애를 겪고 있는 이들에게나, 자막을 읽을 수 없는 이들의 입장에선 OTP와 같은 근본적인 솔루션은 아직 미미한 상태로 판단됩니다. 현재는 크게 두가지의 접근방법을 취하고 있습니다

1.책이나 스크립트를 읽어 이를 오디오로 제작하는 형태

장점은 자연스러운 화자의 음성으로 편안하게 컨텐츠를 들을 수 있다는 점입니다.
반면 단점은 참여하는 봉사자의 수가 너무 적다는 것입니다. 좋은 뜻으로 여러 기관과 단체에서 자원봉사자들과 함께 목소리 기부를 캠페인으로 진행하지만 모수가 적다보니, 고전이나 동화 등 보편적인 컨텐츠를 위주로 다루게 되면서 지금의 시대를 따라잡기에는 많이 아쉬움이 따른다는 점입니다. 또한 스크립트를 읽고 녹음하다보니 원래의 영상과는 싱크가 맞지 않아 원 스피커의 자연스러운 톤앤매너를 전하기에는 어려움이 따릅니다. 가장 큰 어려움은 이 컨텐츠들의 접근입니다. 일반인들이 보편적으로 사용하는 플랫폼이 아니라, 자체적인 개별 홈페이지에 게시하거나 지역 기관/도서관/학교 등으로 공급하다보니 내가 기대하는 컨텐츠가 어디에 있는지 발견도 검색도 하기가 쉽지 않다는 점 때문에 활용도 면에서 많이 부족한 것이 사실입니다. 따라서 시각장애인들은 이런 목소리 기부의 ‘수동적 수혜자’ 에서 벗어나지 못하게 된다는 한계가 따릅니다. 청각장애와는 또다른 가능성의 제약이라는 측면에서, 그리고 그 수가 적지 않다는 면에서 우리가 주시해야 할 부분입니다.

2. TTS(Text-to-Speech)로 기계가 자막을 읽어 재생하는 형태

인공지능 시대, 기계가 얼마나 좋아? 인제 TTS기능으로 자막을 기계가 다 읽어주잖아! 하지만 아파트에서 공지용 방송을 들어봤던 경험 (입주자 여러분께 안내의 말씀 드립니다, 금일 13시부터…), 전자책을 TTS로 재생했던 경험을 떠올리면 이미 대답이 될 것입니다. 화자의 느낌을 전혀 살리지 못할 뿐더러, 자연스럽지 않은 기계음성은 듣는 것에도 의지가 필요하다는 것을요. 또한 다양한 스피커의 목소리 대신 비서-남, 비서-여 와 같은 전형적인 기계음색이라는 획일성도 아직은 가야 할 길을 여실히 보여주는 지점입니다. 언젠가 TTS기능이 인간이 구분하지 못할 정도로 자연스러운 수준이 된다면 좋겠지만 우리가 그때까지 기다리고 있어야 할까요?

 

열린더빙프로젝트(ODP:Open Dubbing Project)의 등장이 필요할 때

OTP가 지식혁명의 기폭제가 되었듯, 이제 우리에게 필요한 것은 열린더빙시스템이라고 생각합니다. 지식으로 세상에 기여하고 싶은 이들 누구나 자연스러운 방법으로 ‘더빙’하여 영상에 동기화된 오디오를 제공할 수 있습니다. 우리는 이 시스템을 헬렌 켈러(Helen Keller)의 이름을 따서 헬렌 프로젝트라고 명명합니다. 헬렌은 다음과 같은 구조의 기능을 제공합니다.

  1. 헬렌은 Amara 와 같은 OTP시스템과 연동하여 영상과 완전히 동기화되는 자막을 추출합니다. 자막은 대체적으로 20-40자 단위의 문장으로 구분되어서 제공됩니다.
  2. 참여자는 각 문장 옆에 표시된 더빙 버튼을 클릭하여 해당 문장을 녹음합니다. 이 때, 해당 시간의 음성 구간을 재생하여 들음으로써 원 화자의 스피치 톤을 살려서 녹음할 수 있도록 합니다. 녹음이 불충분하거나 잘못하면 언제든지 해당 구간을 재녹음할 수 있습니다.
    * 시각 장애인들도 더빙에 참여할 수 있는데, 이 경우 번역된 자막을 TTS로 읽어주는 기능이 추가되어 원 화자의 음성과 번역된 문장을 함께 확인할 수 있도록 해줍니다.
  3. 전체 문장을 다 녹음하면 완료를 표시함으로써 해당 영상 컨텐츠의 더빙을 완료합니다.
  4. 다수의 컨텐츠를 더빙한 사람은 리뷰어가 될 수 있는데, 리뷰어는 이렇게 더빙된 컨텐츠를 검수하고 승인할 수 있는 권한을 가집니다.
Helen은 OTP와 연동하여 더빙데이터를 손쉽게 제작, 동기화할 수 있는 플랫폼입니다.

이를 통해 자연스러운 방법으로 더빙을 제공하고, 자연스러운 방법으로 더빙 오디오를 영상과 오버레이하거나, 독립적으로 음성 파일로서만 외부에 제공함으로써 외국어 컨텐츠에 대한 접근을 하고자 하는 누구에게나 유용한 시스템이 될 수 있습니다. 이를 통해 이 시간에도 만들어지고 있는 세계의 지식 컨텐츠, 나아가 엔터테인먼트 컨텐츠에 대해서도 손쉽게 자막을 제공할 수 있는 플랫폼을 제공할 것입니다.

IMPACT 세상에 미치는 영향

  1. 헬렌은 영상 시대, 세계적인 사회문제로 대두된 2억명, 나아가 5억명의 중증시각장애자에 대한 혁신적인 솔루션이 될 것입니다.
  2. 단순 목소리 기수가 아닌, 지식으로 세상에 기여하고자 하는 많은 이들이 참여할 수 있는 매력적인 캠페인이 될 것입니다.
  3. 시각장애인들도, 스스로가 자신만의 카테고리를 지정, 본인의 관심 분야의 컨텐츠들을 더빙하여 자체 채널을 운영하는 크리에이터가 될 수 있습니다.  성우의 세계에 뛰어들어 목소리가 필요한 모든 곳에서 본인의 오디오를 제공할 수 있습니다. 이를 통해 지식산업의 첨병으로 나아갈 수 있는 장을 제공합니다.
  4. 자막을 볼 수 없는 어린이, 외국어가 어려운 사람들, 노인 들을 위한 새로운 컨텐츠 유통의 지점이 될 것입니다.

 

헬렌은 상업적 더빙 플랫폼으로서도 작동 가능

헬렌이 매력적인 이유는 그것이 특정한 소수 계층을 위한 보조적 도구로서가 아니라 우리의 일상에서 누구나 손쉽게 접근가능하고 사용 가치가 높은 보편적인 플랫폼이라는 점입니다. 헬렌은 설명에서 이미 짐작하셨겠지만, 더빙이 필요한 모든 계층과 산업 분야에서 손쉽게 사용가능한 도구입니다. 나래이션이 필요한 모든 영상 컨텐츠에 대해서, 더빙이 필요한 모든 방송 영상물에 대해서 헬렌은 상업적으로도 효용가치가 대단히 높은 시스템이 될 것입니다. 하지만, 헬렌은 비상업적 가치에 대해서는 무료로 제공되며 이 지점을 가장 중요하게 생각합니다. 동시에 헬렌의 지속가능성과 성장을 위해 상업적 목적의 이용에 대해서는 그 목적의 크기에 따라서 사용크기대비비용(Pay-As-You-go) 모델로 다가갈 것입니다.

 

헬렌은 최고의 공유가치창출(CSV)과 사회적책임(CSR)의 지점으로 다가갑니다.

헬렌은 사회적 책임을 가져가는 모든 기업에 있어 함께 참여할 만한 의미있는 캠페인입니다. 글로벌 사회, 전지구적 문제에 대한 적극적인 참여이자 사회적 가치 창출에 대한 혁신적인 접근이 될 것입니다. 투자대비효용(ROI)으로서의 수준이 아니라 글로벌 커뮤니티 성장에의 적극적인 투자 (ROC: Return on Community) 측면에서 함께 공동의 이익을 증진시킬 수 있는 지점을 모색할 수 있는 지점이 될 것입니다.

 

Helen, Bright the Blind with Your Voice
여러분의 목소리로 어둠을 밝혀주세요!

 

 

하나금융그룹 SEN MYSC

Helen은 하나금융그룹과 SEN, MYSC, 그리고 유니크굿컴퍼니가 함께하는 오픈더빙솔루션 프로젝트입니다.

storm

storm

작가, 크리에이터, 기술사상가. 모험가, 리얼월드.

View all posts