[#전문칼럼] 구글나우 - 젤리빈의 핵심, '구글나우


(Google Now)'에 주목하자



구글 I/O 2012에서 안드로이드 4.1 젤리빈이 공개되었습니다. 향 상 된 터치속도나 전체적인 구동 속도도 높아지고, 인터페이스 조작도 한결 부드러워지면서 기존 안드로이드와 달리 딱딱하고 버벅이던 모습을 탈피했습니다. 안드로이드를 뒤엎었다고 할 수 있겠는데, 오프라인 타이핑이나 Predictive 키보드 같은 추가 된 기능들 중 가장 핵심은 바로 '구글나우(Google Now)'였습니다.

 

 


 




 

 젤리빈의 핵심, '구글나우(Google Now)'에 주목하자

 

 '구글나우(Google Now)'는 구글의 새로운 빅데이터 서비스입니다. 한 문장으로 설명하자면, 구글의 서비스들이 잘 버무려 새로운 검색 알고리즘을 통해 사용자에게 적합한 알림을 출력해주는 기능이라고 할 수 있습니다.

 구글나우에 주목해야하는 이유는 기술적의 발전과 함께 부작용에 대한 우려 둘 모두 지니고 있기때문입니다.

 

 


 

구글나우

 

 

 구글이 공개한 인트로영상만 보더라도 어떤 서비스인지 대충 짐작할 수 있습니다.


 구글나우는 검색 기능임과 동시에 알림 기능, 두가지를 합친 형태입니다. 기 본 베이스는 검색입니다. 사용자가 검색을 하면 검색한 데이터가 쿠키로 남게 됩니다. 이는 지도나 항공시간들 뿐 아니라 개인의 캘린더 일정도 모두 검색의 대상에 두게 됩니다. 그리고 이 검색 데이터와 함께 현재 위치와 시간을 더해 알림 데이터를 생성하게 됩니다.

 간단하게 설명하자면, 안드로이드를 사용하면서 축적 된 데이터로 알고리즘 지도를 짜고, 이를 활용하여 사용자에게 적합한 알림을 제공하는 것입니다.

 

 예를 들어 사용자가 버스를 타고 이동하려 한다면 지도 데이터를 통해 어떤 버스를 타야 약속시간에 제때 도착할 수 있는지 알려줍니다. A버스가 있고, B버스가 있는데 A버스의 경로가 차가 밀리지 않는다면 B보다 빨리 갈 수 있지만 A버스 경로의 교통 상황이 좋지 않아 도착이 지연 될 것 같은 경우 B버스로도 약속시간에 도착 할 수 있고 교통 상황도 좋다면 B버스를 권한다는 것이죠. 또 비행 중이라면 비행 상태를 체크하거나, 좋아하는 스포츠 경기 데이터를 자동으로 알림해줍니다. 그래서 경기를 볼 수 없는 상황이라도 구글나우가 실시간 중계를 해준다는 것이죠.

 

 현재 데모로는 이정도 내용만을 확인 할 수 있지만, 빅데이터에 기반하고 있다면 쇼핑 정보를 검색했을떼 근처에서 구입할 수 있는 곳을 알려주거나 흥미롭게 봤던 공연 정보를 통해 공연 시작시간에 어디로 어떻게 가서 봐야하는지 등의 알림 제공도 가능합니다.


 검색 데이터가 베이스이기 때문에 구글 검색에 대한 접근성을 높히기 위해 음성인식 기능을 향상 시켰고, 애플의 시리처럼 울프람알파의 지식 데이터를 가져오는 것이 아니라 구글 자체 지식 검색 데이터를 사용하여 알고리즘을 짤 수 있도록 합니다.


 구글의 검색과 서비스를 통해 탄생한 개인을 위한 자동 알림 시스템이라는 것이죠.

 


 

Siri

 


 

 분명 구글나우는 애플의 시리와 '사용자가 디바이스의 조작을 줄여나가는 것'이라는 지향하는 바가 같습니다.

 

 시리는 명령어를 통해 사용자의 해야 할 일을 도맡아하는 음성인식기능이고, 여기에 검색이라는 기능을 덧붙여 음성으로 질문하면 거기에 걸맞는 답을 제시합니다. 사용자가 굳이 타이핑하거나 연락처를 찾지 않아도 홈버튼을 누르고 명령어를 전달하는 것만으로 조작이 가능하다는 것이죠.


 구글나우도 음성인식기능을 이용해 사용자의 질문에 원하는 답을 검색해줍니다. 하지만 시리와 다른점은 '검색'에 포커스가 맞춰졌다는 것입니다. 구글은 구글보이스라는 조작을 위한 음성인식기능이 있습니다. 구글나우는 그 구글보이스와는 다른 영역입니다. 아니 구글보이스가 구글나우라는 큰 틀에 포함되어 있는 것이라고 할 수 있습니다. 구글나우는 완전히 검색을 통한 데이터 축적을 바탕으로 사용자에게 맞는 알림정보를 자동으로 알려주는 것이 주요기능입니다.

 

 시리가 음성으로 조작을 담당하는 것을 넘어 구글나우는 음성인식으로 접근성이 높아진 검색과 일정, 위치, 시간의 축적 된 데이터를 통해 사용자 개인이 굳이 정보를 찾지 않더라도 원하는 정보를 제공하는 능력을 보여줍니다. 시리와 지향하는 바는 동일하지만, 구글나우는 개인의 생활패턴까지 일부분 담당하면서 사용자를 위한 자동연산도구로써 작동하게 됩니다.

 


 

구글나우에 대한 우려

 


 

 구글나우는 놀라운 기능임에 틀림없지만, 개인정보라는 민감한 정보를 다루게 됩니다.


 시리의 경우 일정에 관련 된 명령을 하게 되면 애플의 서버로 넘어가 명령어를 파악해 다시 디바이스로 돌아와 디바이스에 저장 된 캘린더 정보를 여는 방식입니다. 그런데 구글나우는 캘린더의 일정을 분석하기 위해 구글의 서버를 한번 거쳐야합니다. 구글의 서버에서 캘린더 일정이 분석 된 다음 그 결과를 알림으로 설정하여 디바이스로 전달한다는 것이죠.

 이는 캘린더 뿐만 아니라 검색 기록이나 위치와 시간 데이터 등 구글나우에 사용되는 모든 데이터를 의미합니다. 시멘틱 검색을 개인화 시킨 것이라고 보면 이해할 수 있을텐데 개인의 정보를 통해 개인에 적합한 답을 내기 위해 정보를 쿠키로써 수집해간다는 것입니다. 물론 구글에서 공식적으로 쿠키를 가져간다고 밝힌바는 없지만, 저 정보를 디바이스 내에서 분석하여 알림을 준다는 것은 현재 기술로는 불가능합니다. 고로 개인 정보를 구글이 한번 수집하고 분석한다는 것인데, 이에 대한 우려가 나타날 수 있습니다.

 

 구글은 클라우드 서비스를 이야기 할때 보안에 대해서 걱정 할 필요가 없고, 오히려 오프라인보다 클라우드의 보안이 더 좋다고 얘기합니다. 필자도 이에 일정부분 동의하는 바이지만, 그것을 구글이 수집해가야 한다는 의무는 없습니다. 분명 이 구글나우라는 것을 위한 약관이 아직 파악 된 부분이 없지만, 분석을 위해 쿠키를 수집하려한다면 약관에 분명 기재가 될 것입니다.

 

 더군다나 익명성이 보장된다는 것을 의심하게 하는 것이 개인화 서비스를 하기 위해서는 데이터 축적에 필요한 식별이 있어야하고, 그 식별을 구글 계정을 통할텐데 익명성이 과연 보장될 수 있느냐 하는 것입니다. 캘린더도 구글플러스와 합쳐지게 되버렸는데 사용자의 불안감을 잠식시키기 위해서는 우선 구글나우의 데이터 사용에 대한 부분을 구글은 증명 할 수 있어야 할 것입니다.

 


 

안드로이드

 


 

 구글나우는 앞으로 안드로이드의 핵심으로 구글이 지향하는 바가 될 것입니다. 현재는 데모정도의 서비스이지만, 분석할 수 있는 데이터의 범위와 양이 늘어나게 되면 안드로이드가 좀 더 개인에 맞춰진 기기가 되고, 그에 따른 정보를 지속적으로 제공하게 될 것입니다.

 개인정보보호에 대한 논란이 생길 순 있겠지만, 확실히 미래의 인공지능을 지닌 비서가 개인을 완벽히 인식하는 수준은 아니더라도 안드로이드가 그런식으로 다가갈 수 있는 밑바탕을 구글나우에서 보여주고 있는 것이죠.

 이는 단순한 기능추가로 끝나는 것이 아닌 시리가 애플의 미래 핵심이듯, 구글나우는 구글의 미래 핵심으로써 지속적인 발전을 이뤄나갈 것입니다. 

[전문가 칼럼 ] 김윤호 전문위원의 금융 칼럼-

빅 데이터의 가치의 성공적 이용은 실험과 탐구가 필요하다.

 

저자 : Edd Dumbill
역자 : 한순보
원문 : What is big data?

빅 데이터는 전통적인 데이터베이스 시스템 처리 용량을 넘어서는 데이터다. 빅 데이터는 아주 크고, 매우 빨리 변하며,

기존 데이터베이스 아키텍처의 구조에 맞지 않는다. 이 데이터에서 가치를 얻으려면, 그것을 처리할 다른 방법을 택해야 한다.

2012년 인기 있는 IT 유행어(buzzword)인 빅 데이터는 가능한 것(viable)이 되었는데, 이는 비용 대비 효율 높은 접근 방법이

나타나 대량 데이터의 부피, 속도, 그리고 가변성을 잘 다루었기 때문이다. 빅 데이터 안에는 이전에는 데이터에서의 추출에

필요한 작업량 때문에 숨어 있던 가치 있는 패턴 및 정보가 존재한다. 월마트나 구글 같은 선도기업에는 얼마 전부터 이러한

능력이 있었지만, 엄청난 비용이 들었다. 오늘날의 일반적인 하드웨어, 클라우드 아키텍처와 오픈 소스 소프트웨어는 리소스가

다소 부족한 회사도 빅 데이터 처리를 고려할 수 있게 했다. 빅 데이터 처리는 클라우드에서 값싸게 서버 시간을 빌릴 수 있는

차고(garage)에서 시작하는 작은 스타트업 회사에서도 충분히 가능한 일이다.

한 기관에 빅 데이터의 가치는 분석적 사용과 신제품 조력(enabling)의 두 범주로 나뉜다. 빅 데이터 분석은 쇼핑객의 거래

내용과 사회적, 지리적 데이터를 분석하여 드러나는 고객 간 또래 영향력(peer influence)과 같이, 처리에 비용이 너무 많이

드는 데이터 때문에 이전에는 숨어있던 통찰력을 제공한다. 합리적 시간 내에 모든 데이터 항목을 처리하는 것은 표본 추출이(sampling)라는 골칫거리의 필요성을 제거하고, 미리 정해진 보고서(report)를 게재하는 다소 정적인 특징과 달리 데이터를

조사하는 접근방법을 돕는다.

지난 10년간 성공한 웹 스타트업은 빅 데이터를 새로운 제품과 서비스를 가능하게 한 도구로써 이용한 주요한 예다. 예를 들면,

페이스북은 사용자와 친구의 행동에서 많은 신호를 결합해 상당히 개인화된 사용자 경험을 정성껏 제공하고, 사업 광고의

새로운 방법을 만들 수 있었다. 빅 데이터를 뒷받침하는 아이디어와 도구의 핵심이 구글, 야후, 아마존과 페이스북서 나온 것은

우연이 아니다.

산업에서 빅 데이터가 떠오르는 것은 필연적 상대(counterpart)를 가져온다. 민첩함(agility). 빅 데이터의 가치의 성공적 이용은

실험과 탐구가 필요하다. 새로운 제품을 만들든지 경쟁력 있는 장점을 얻는 방법을 찾든지 이 작업은 호기심과 기업가 세계관을

요구한다. 



빅 데이터는 어떻게 생겼는가?

"클라우드"가 다양한 기술을 포함한 용어인 것처럼, 포괄적 용어 "빅 데이터"는 아주 모호할 수 있다. 빅 데이터 시스템의

입력 데이터는 소셜 네트워크, 웹 서버 로그, 차량 흐름 센서, 인공위성 이미지, 방송 음성 스트림, 은행 거래 내역, 락 음악

MP3, 웹 페이지 콘텐츠, 정부 스캔 문서, GPS 경로 기록, 자동차 원격 측정치, 금융 시장 데이터로부터 쏟아질 수 있고,

이 목록은 끝이 없다. 이들이 정말 모두 같은가?

문제를 명확히 하기 위해, 부피(volume), 속도(velocity), 가변성(variability), V로 시작하는 세 가지가 빅 데이터의 각각 다른

면을 특징짓는데 흔히 사용된다. 이것은 데이터의 특성과 데이터 이용을 가능하게 하는 소프트웨어 플랫폼을 살펴보고

이해하는 것을 도와주는 렌즈이다. 십중팔구 당신은 어느 정도는 이것들과 씨름하게 될 것이다.

부피(Volume)

많은 양의 정보를 처리하는 능력에서 얻는 이익이 빅 데이터 분석의 주요 매력이다. 더 많은 데이터를 갖는 것이 더 나은

모델을 갖는 것보다 낫다. 많은 양의 데이터에 간단한 산수를 적용하는 것이 생각보다 훨씬 효과적일 수 있다. 6가지 요소를

고려하는 것보다 300가지를 고려해 예측한다면 수요를 더 잘 예측할 수 있을까?

부피는 전통적 IT 구조에 가장 직접적 도전이다. 부피는 확장 가능한 저장 공간과 질의에 대한 분산 접근 방식을 요구한다.

많은 회사가 이미 대량의 로그 형태로 보관 데이터를 가지고 있지만, 그것을 처리할 능력은 없다.

데이터 부피가 전통적 관계형 데이터베이스 인프라가 다룰 수 있는 것보다 크다면, 처리 옵션은 크게 Greenplum 같은

데이터웨어하우스(data warehouse) 혹은 데이터베이스의 대량 병렬 처리 아키텍처와 아파치 하둡 기반의 솔루션으로 나뉜다.

보통 다른 V요소 중 하나인 가변(variety)이 작동하는 정도에 의해 선택이 정해진다. 일반적으로, 데이터웨어하우스 접근 방식은

미리 정해진 스키마를 포함하고, 규칙적이고 느리게 변하는 데이터 세트에 적합하다. 반면 아파치 하둡은 처리하는 데이터

구조에 조건이 없다.

하둡의 핵심은 다수 서버에 걸친 분산 컴퓨팅 문제를 위한 플랫폼이라는 점이다. 하둡은 야후가 처음 개발 배포했는데, 이는

검색 인덱스를 컴파일하는 데 구글이 개척한 MapReduce 접근 방식을 구현한다. 하둡의 MapReduce는 여러 서버 간 데이터

세트를 분산하는 것과 데이터에 작업하는 것을 포함한다("map" 단계). 그리고 부분 결과를 다시 결합한다("reduce" 단계).

데이터를 저장하기 위해 하둡은 고유의 분산 파일시스템인 HDFS를 이용하는데, 이것은 다수의 컴퓨팅 노드에서 데이터를

이용할 수 있게 한다. 일반적인 하둡 이용 패턴은 세 단계를 포함한다.

  • HDFS에 데이터를 로드

  • MapReduce 작업, 그리고

  • HDFS에서 결과 추출

이 과정은 본래 분석적이거나 혹은 인터랙티브하지 않은(non-interactive) 컴퓨팅 작업에 적합한 배치 작업이다. 이것 때문에,

하둡 자체는 데이터베이스나 데이터웨어하우스 솔루션이 아니지만, 이들의 분석을 도와주는 역할을 할 수 있다.

가장 잘 알려진 하둡 사용자인 페이스북의 모델은 이 패턴을 따른다. MySQL 데이터베이스가 핵심 데이터를 저장한다. 그리고는

친구의 관심에 근거한 사용자 추천을 하는 계산이 이뤄지는 하둡에 반영된다. 페이스북은 결과를 MySQL로 전달하여 페이지에서

사용자에게 이를 제공한다.

(중략 )

 

 

 

빅 데이터는 엉망이다(Big data is messy)

인프라구조에 대한 것만은 아니다. Pete Warden이 그의 빅 데이터 용어집에서 "아마도, 엉망인 소스 데이터를 유용한 것으로

바꾸는데 드는 시간이 데이터 분석 처리를 하는 나머지 시간을 합한 것보다 많이 든다."라고 했듯이, 빅 데이터 전문가는

데이터를 다루는데 80%의 노력이 데이터를 먼저 깔끔하게 하는 것이라고 계속 보고한다. 데이터 수집과 정리의 고비용에 때문에,

스스로 얻기 위해 실제 필요한 것을 고려할 가치가 있다. 데이터 시장은 일반 데이터를 얻는 수단이며, 종종 역으로 개선한 것으로

이바지할 수 있다. 물론 품질은 가변적이지만, 점점 더 데이터 시장이 경쟁해야 할 벤치마크가 될 것이다.

문화(Culture)

빅 데이터 현상은 수학, 프로그래밍, 그리고 과학적 직관을 결합한 지식 분야인 데이터 과학 출현에 밀접히 얽혀있다. 빅 데이터로

이익을 얻는 것은 기술이 있는 팀에 투자하고, 이익을 위해 데이터를 이해하며 사용하기 위해 조직적으로 팀을 곁에 기꺼이 두는 것을 의미한다.

D.J. Patil은 "데이터 과학팀 구성(Building Data Science Teams)" 보고서에서 데이터 과학자를 다음 자질을 가진 것으로 특징지었다.

  • 테크니컬 전문가: 일반적으로 최고의 데이터 과학자는 어떤 과학 분야에 깊은 전문 지식을 가진다.

  • 호기심: 내부에 숨겨진 것을 알려는, 문제를 발견하고, 테스트할 수 있는 매우 명확한 가설 집합으로 만드는 갈망

  • 이야기하기(storytelling): 이야기하기 위해 데이터를 사용하고 효과적으로 전달할 능력

  • 영리함: 창의적 방식으로 문제를 다르게 보는 능력

빅 데이터 분석 프로젝트에 지대한 영향을 가져올 특징은 불편한 측면이 있을 수 있다. 데이터는 캐지기 위해 저장고(silos)에서

벗어나야 하고, 기관은 분석 결과를 전달하고 해석하는 법을 배워야 한다.

이야기하기와 영리함은 분석하는 노력의 이득이 기관에 흡수될지 궁극적으로 좌우하는 관문 요소(gateway factor)다. 데이터

시각화 기술과 실제가 점점 의미 있는 방식으로 분석적 통찰력을 조정하기 위해 인간과 컴퓨터의 틈을 메우는 데 중요해진다.

당신이 가고자 하는 곳을 알아라

마지막으로, 빅 데이터는 만병통치약이 아니다. 당신은 데이터에서 패턴과 단서를 찾을 수 있지만, 그다음에 무엇인가?

북아메리카 지역 IBM의 선행 분석의 리더인 Christer Johnson이 빅 데이터로 시작하는 기업에 충고한다. 우선 무슨 문제를

풀려는지 정하라.

어떻게 광고 전략을 바꿔 고객당 비용을 증가시킬 수 있는가와 같이 실제 비즈니스 문제를 택한다면, 그것이 구현으로 이끌

것이다. 빅 데이터 작업은 기업가 정신에서 이익을 얻지만, 구체적 목표에서도 강력한 이익을 얻는다.

 

 

 

 

 

 

+ Recent posts