데이터의 시대, 디자이너의 일

February 29, 2016

디자이너 두 명이 웹사이트 상품 구매버튼의 색상을 결정하기 위해 토론하고 있다. 디자이너 A는 블루를 사용하길 원하고 디자이너 B는 레드를 사용하길 원한다.

과거였다면 이런 토론은 색채 이론, 색채 심리학, 브랜딩과 컬러 트렌드 등 다양한 이론과 가설이 오고 가며 정답이 아닌 합의점을 찾아내는 설득의 과정에 가까웠을 것이다.

하지만 오늘날 이런 토론은 큰 의미를 갖지 못한다. 버튼 색상 논쟁을 종결짓는 건 이제 이론도, 유행도 아닌 숫자다. 테스트의 간소화와 일반화로 인해 구매 버튼 색상의 차이가 발생시키는 전환율과 매출의 차이는 정확히 측정 가능해졌고, 그 시점부터 실무 논의에서 측정이 어려운 이론이나 가설을 들먹이기란 굉장히 머쓱해졌다. 적어도 컬러는 철저히 브랜드의 영역이자 디자이너의 결정 권한이라 믿었던 통념은, 컬러 역시도 데이터에 기반해 최선의 답을 찾을 수 있는 ‘해결 가능한 문제’라는 인식으로 대체되고 있다.

머지않아 블루나 레드같은 후보색상을 고민할 필요도 없어질 것이다. 컴퓨터가 스스로 수많은 색의 조합을 끊임없이 테스트하며 문맥상 가장 적합하고 효과적인 색상을 직접 결정할 테니 말이다.

와이어드의 크리스 앤더슨이 2008년에 썼던 ‘이론의 종말(The End of Theory)’ 이 당시에는 과학계나 일부 최전선의 테크 기업에 국한된 이야기처럼 느껴졌다면, 지금은 일반 기업들의 업무 프로세스에서도 어렵지 않게 찾아볼 수 있는 보편적 변화로 와 닿는다. 가설을 세우고 변수를 줄여가며 정답에 가까이 다가가던 과정에서 필요했던 직관적 해석의 노력은 이제 더 많은 데이터를 얻어내기 위한 기술로 대체되었고, 빅데이터가 끊임없이 던져주는 수많은 상관관계 앞에 우리의 직관은 하염없이 작아 보이기만 할 뿐이다.

디자인 최종 결정권자: 데이터

데이터 과학이 굉장히 효과적이면서도 한편으로 위험한 이유는, 원인에 대한 이해가 전혀 없어도 충분히 유용한 결과를 얻을 수 있다는 점이다. 상품 구매 페이지에서 원형 버튼이 사각형 버튼보다 25% 높은 전환율을 보여준다면 결과는 이미 정해진 것이나 다름없다. 어떤 조형 심리적 요소가 그 25%의 차이를 만들어냈을지 분석하고 해석하는 시간은 스케줄에 좀처럼 배정되지 않는다. 데이터 드리븐 디자인에서 주도권을 쥐고 있는 건 디자이너의 직관이 아닌 숫자이며, 주관적 의견이나 해석은 테스트 결과에 큰 영향을 끼치지 못한다.

샌프란시스코의 스타트업 The Grid는 여기서 한발 더 나아가 AI Website Design System이라는 디자이너들이 섬뜩해 할만한 문구를 내세우며 등장했다. 텍스트, 이미지, 비디오 등의 컨텐츠를 던져놓으면 시스템이 이를 분석하고 적합한 레이아웃과 타이포그래피, 컬러 등을 결정해 스스로 웹사이트를 디자인한다는 것이 서비스의 기본 컨셉이다. 사이트의 전체적인 톤을 맞추기 위해 이미지들의 톤 보정까지 시스템이 알아서 처리한다고 하니 웹디자인 프로세스에서 디자이너의 필요성을 완전히 없애려는 것 같다. 이 서비스가 계획대로 진전된다면 시스템이 스스로 여러 안을 만들어서 지속적으로 스플릿 테스트를 진행하고 결과를 반영하는 등의 수준까지 발전할 것이다.

그러나 아직까지 The Grid는 거창한 등장만큼 만족할 수준의 결과물을 보여주고 있지는 못한듯하다. AI라는 포장지를 씌워놓은 스크립트 덩어리에 불과하다는 비난도 들린다. 다만 The Grid의 등장으로 인해 디자이너들이 느꼈을 불안감의 근원은 디지털 디자인 프로세스의 발전이 인간보다는 컴퓨터에게 더 많은 결정권을 쥐여주는 방향으로 진행되고 있는 현실에서 디자이너의 역할 중 대부분을 컴퓨터가 대신하는 형태의 프로세스가 제시되었기 때문 아닐까 생각해본다.

“보다 더 정교해진 기계의 지속적인 진보가 인간의 노동력을 대체하며 새로운 기술 발전은 노동자의 작업을 더욱더 기계적인 작업으로 변혁하여 어느 시점에 이르면 기계가 인간의 자리를 대체할 것이다.”
— 칼 마르크스

컴퓨터에게 아름다움을 가르치는 것이 가능할까?

The Grid의 디자이너 Jon Gold는 수개월 전 한 팟캐스트에 출연해 최근 로봇에게 타이포그래피를 가르치고 있다고 했다. 컴퓨터가 시각적 아름다움을 이해하는 것이 가능하다고 생각하냐는 질문에 대해 예술적 의미의 아름다움과 달리 디자인에서의 아름다움은 일련의 규칙에 기반한 것이며, 규칙이 존재한다면 컴퓨터도 배울 수 있다고 답했다.

하지만 실무에서 디자이너들이 디자인의 기본 규칙을 몰라서 고생하는 것이 아니듯, 규칙을 안다고 시각적으로 아름다운 결과물을 만들어낼 수 있는 건 아니다. 오히려 컴퓨터는 규칙을 습득하는 방식보다는 방대한 데이터에 기반한 머신러닝을 통해 인간이 이해하고 있는 ‘시각적 아름다움’이 구조적으로 어떤 것이지 조금씩 알아나갈 가능성이 크다.

“머신 러닝은 향후 5년 안에 컴퓨터가 인간과 마찬가지로 미학적 결정을 내릴 수 있게 할 것입니다.”
— 마티아스 듀아트, 구글 디자인 부사장

기계번역의 역사는 이를 위한 좋은 참고사례다. 기계번역 초창기에 컴퓨터는 수많은 언어의 문법적 규칙과 존재하는 대부분의 단어를 알고 있음에도 여전히 엉터리 문장들을 만들어냈다. 단어와 문법에 기반한 번역은 인간뿐 아니라 컴퓨터에게도 좋은 학습방법이 아니었던 모양이다. 기계번역의 품질이 급격히 개선되기 시작한 것은 머신러닝 방식이 도입된 시점이었다. 방대한 번역 데이터를 흡수하며 마치 어린아이가 새로운 언어를 습득하는 것과 비슷한 방식으로 번역의 정확도를 조금씩 높여나가기 시작한 것이다. 오늘날 영어와 스페인어는 스카이프를 통해 동시통역이 가능한 수준까지 발전했다고 한다.

이와 비슷한 맥락으로 컴퓨터가 시각적 아름다움을 결정짓는 미묘한 차이를 수많은 데이터 분석과 비교를 통해 서서히 알아나간다면, 아름다움에 대한 견해가 인간과 다를 수는 있어도 어느 시점부터 최소한 인간이 보기에 좋은 수준의 시각적 결과물을 지속적으로 만들어내는 단계에 이를 수 있지 않을까?

데이터 맹신과 숫자 만능론

새로운 툴이나 방법론의 등장이 설레는 건 기존의 비효율과 문제점이 개선되었으리라는 기대감 때문일 것이다. 하지만 디터 람스의 말처럼 완벽한 해결책이란 없으며, 우리가 정답에 가까이 왔다고 생각할수록 새로운 문제점들이 모습을 드러내곤 한다.

과학이 통치하는 세상에서 숫자는 신과 같은 존재다. 사회의 복잡성이 인간의 인지능력을 넘어선 순간부터 숫자는 논쟁을 종결짓고 결정을 내리는 역할을 맡아왔다. 언어는 모호하지만 숫자는 절대적이다. 숫자에 대한 깊은 신뢰는 모든 것이 돈으로 환산되는 자본주의와, 득표수에 따라 국가 지도자를 선출하는 민주주의를 가능케 했던 기반이 되었다.

하지만 숫자에 대한 무조건적 신뢰는 종종 숫자가 언제나 객관적이고 절대적이라는 착각으로 이어지기도 한다. 데이터 드리븐 디자인에서 가장 흔한 실수는 양적/질적 데이터와 객관적/주관적 데이터에 대한 혼동이다. 간단히 말하면 숫자 정보로 치환 된 주관적 의견을 객관적 데이터로 신뢰하는 오류다. Dr. Philip Hodgson는 그의 글 Usability Test Data에서 ‘Subjective and objective data’(주관적이고 객관적인 데이터)에 대해 명료하게 정리했다.

컴퓨터를 가지고 있습니까? 라는 질문에 내가 ‘예’라고 대답한다면, 이는 숫자가 아니므로 질적 데이터이지만, 나의 주관이 반영되었다고 볼 수 없으므로 객관적 데이터다. 그러므로 이 경우 나의 대답은 질적/객관적 데이터다.
컴퓨터의 가격에 대해 어떻게 생각합니까? 라는 질문에 ‘내 생각엔 너무 비싼 것 같습니다.’라는 대답은 질적/주관적 데이터다.
컴퓨터 중앙처리장치의 속도가 어떻게 됩니까? 라는 질문에 ‘2GHz’라는 대답은 양적/객관적 데이터다.
당신의 컴퓨터는 얼마나 사용하기 쉬운 편입니까? 1부터 10중 하나의 숫자로 답해주세요. 라는 질문에 ‘7’이라는 대답은 양적/주관적 데이터다.

사람들은 종종 양적(Quantitative) 데이터와 객관적 데이터, 그리고 질적(Qualitative) 데이터와 주관적 데이터를 각각 동의어로 간주하곤 하지만, 위의 예에서 볼 수 있듯 양적, 질적 데이터는 각각 주관적, 객관적일 수 있다.

실무에서 얻는 리서치나 테스트 데이터는 대부분 숫자로 이루어져 있다. 하지만 위의 예시로 보듯 숫자 데이터는 주관적일 수 있다. 적지 않은 경우 우리가 의미하는 객관적 데이터란 그저 수많은 주관적 데이터를 한곳에 모아두고 멀리서 바라보는 것에 지나지 않는다. 그러므로 인간의 직관이나 주관이 마치 신성한 데이터에 스며들어선 안 될 오염 물질인 듯 여겨서는 곤란하다.

데이터 예찬론의 위험성은 그것이 데이터 맹신으로 변질되기 쉽다는 점에 있다. 테스트는 고민을 떠넘기기 위한 수단이 되어서는 안 되며, 데이터는 직관을 비웃기 위한 도구가 되어서는 안 된다.

그것은 디자이너가 비록 단기적 결과에 영향을 줄 수 없을지라도 ‘왜’라는 질문을 멈추지 말아야 할 이유이기도 하다. 왜 그런 테스트 결과가 나왔는지, 왜 사람들이 B안을 A안보다 더 선호했는지, 왜 의도하지 않은 사용패턴이 발견되었는지 등 말이다. 궁금증을 해소하기 위한 사색과 토의가 비록 컴퓨터 입장에선 이해하기 어려운 인간 특유의 비생산적 행위일지 모르겠으나, 호기심은 인간이 지닌 가장 강력한 무기이고, 데이터의 상관관계가 밝혀내지 못하는 혁신적 발상은 언제나 그런 인지적 결핍을 메우기 위한 과정에서 탄생한다고 믿는다.

우리의 작업 프로세스는 계속해서 더 높은 효율성을 추구하고 그 안에서 데이터 과학의 중요도는 점점 더 높아질 것이다. 기술의 발전은 진화와 같아서 누군가의 의지로 멈추거나 되돌릴 수 없다. 그러므로 변화되는 작업 환경에서 우리의 논의는 데이터 과학과 대립각을 세운 채 감성과 아름다움의 중요성을 주창하는 방향이 아닌, 그것들의 중요성을 입증하기 위해 어떻게 데이터를 활용할 수 있을지 고민하는 방향이 되어야 할 것이다.