[전문가 칼럼] 김윤호 전문위원의 금융칼럼 -

 

트위터 네트워크의 ‘연결요소’ 분석해 투자 시뮬레이션

 

 

양대 소셜네트워킹서비스(SNS)의 회원이 총 13억 명을 돌파했다. 페이스북(Facebook) 가입자는 최근 8억 명을 넘어섰고

트위터(Twitter)는 5억 이상의 회원을 확보했다. 이들이 하루에 올리는 게시물의 수는 일일이 헤아리기 어려울 정도다.

 

SNS 메시지를 분석해 동향을 알아내는 분석도 각광을 받고 있다.

각국에서 오가는 수십에서 수백만 건의 자료를 분석하는 ‘빅데이터

(Big Data) 기법’과 여러 정보 간의 상관성을 조사해 숨겨진 의미를

찾아내는 ‘’데이터 마이닝(Data Mining) 기법’이 대표적이다. 최근에는

트위터 메시지를 전산학적으로 분석해 사용자의 감정까지 알아내는

 새로운 분석법까지 등장하는 추세다. 지난달에는 트위터를 분석해

다음날의 주가와 거래량까지 예측하는 기술까지 등장했다.미국

캘리포니아대학교 리버사이드 캠퍼스의 컴퓨터공학과는 지난달

미국컴퓨터협회(ACM) 주최로 시애틀에서 열린 ‘제5회 웹검색 및

데이터 마이닝 국제컨퍼런스(WSDM)’에서 ‘SNS 활동과 관련된 금융

시계열 분석(Correlating Financial Time Series with Micro-Blogging Activity)‘

이라는 논문을 발표했다.특정 기업에 대해 언급한 SNS 메시지를 수집해서

실제 주식시장 변동과 비교했더니 유의미한 결과를 얻었다는 것이다. 4개월

동안 컴퓨터 시뮬레이션으로 식을 사고 팔았더니 평균 손실률보다 훨씬 나은

성과를 기록했다.


▲ 지난달 미국 캘리포니아대 연구진이 SNS 메시지를

분석해 주가와 거래량을 예측하는 데 성공했다고 발표했다.

 ⓒImageToday

트위터 네트워크의 ‘연결요소’ 분석해 투자 시뮬레이션

연구에는 바겔리스 리스티디스(Vagelis Hristidis) 교수뿐만 아니라 야후 바르셀로나 연구센터(YRB)의 연구자 3명이 참여했다.

이들은 데이터 마이닝 기법을 이용해 트윗(tweet)이라 불리는 트위터 메시지를 연구해왔다.

이번 실험에서는 트윗의 변화와 주식시장의 변동성 간에 연관이 있을 것이라는 가설 하에 분석을 진행했다. 트위터 사용자들이

특정 기업에 대한 언급을 많이 한다면 주식을 구매할 가능성이 높다고 봤기 때문이다. 또한 요즘은 시장 관련 소식이 트위터를

통해 가장 먼저 공개되므로 핵심정보를 미리 얻어낼 수도 있다고 보았다.



연구진은 미국 신용평가회사 스탠다드앤푸어스가 집계하는 종합주가지수 ‘S&P 500’의 2010년 상반기 자료 중에서 무작위로

150개 기업을 선정하고 매일의 폐장시 주가와 당일 거래량을 조사했다.

또한 특정 기업과 연관된 트윗만을 골라내는 필터링 프로그램도 개발했다. 예를 들어 애플사에 대한 트윗이 갑자기 늘어나는

것은 실제로 변동사항이 생겼거나 향후 주식 매입이나 매도에 영향을 끼칠 가능성이 높다는 의미다.


연구 초반에는 트윗의 숫자가 많을수록, 다시 말해 특정 기업에 대한 언급이 증가하거나 다른 사용자들이 이를 퍼뜨리기

시작하면 단순히 주식 거래량이 늘어날 것으로 예상했다. 그런데 분석을 시작하자 의외의 결과가 나타나기 시작했다.

거래량뿐만 아니라 주가까지도 예측이 가능했던 것이다.

논문은 ‘연결요소(connected components)’라는 개념을 이용해 트위터와 주식시장의 상관성을 설명하고 있다. 새로운 CEO,

새로 출시된 상품, 최근의 재무보고서 등 특정 기업의 변화를 언급하는 트윗들은 나름의 네트워크를 구축하며 여기저기로

퍼져나간다는 것이다.



특정 트윗이 여러 사용자에게 퍼져 나가는 방법은 여러 가지가 있다. 특정 사용자가 많은 팔로워(follower)를 거느리면 트윗을

읽는 사람도 그만큼 늘어나 영향력이 커진다. 다른 사용자가 리트윗(retweet) 기능을 이용해 또 다른 네트워크로 퍼뜨리기도

하고, 멘션(mention) 기능을 통해 답변과 논의를 주고받기도 한다.

또한 특별한 목록으로 구분하는 해시태그(hashtag)를 붙여 관련 트윗을 한자리에 모으기도 하고, 메시지에 별도의

웹주소(URL)을 부여해 트위터 이외의 SNS 서비스로 이동시키기도 한다.



다우존스 산업평균지수보다 높은 이익 얻어내

연구진은 트위터의 특성과 네트워크를 고려한 분석기법을 개발해 모의 주식투자를 진행하기도 했다. 해당 기업에 대해

2010년 3월 1일부터 6월 30일까지 4개월 동안 가상으로 매입하고 매도하는 시뮬레이션 프로그램을 적용시킨 것이다.

트위터의 데이터를 이용한 투자 시뮬레이션과 더불어 회귀분석 모델, 무작위 모델, 고정 모델 등도 대조군으로 사용했다.

 

 

회귀분석 모델은 지난 몇 일 동안의 주가 변동을 기반으로 매일 주식을

매입하는 방식으로, 시뮬레이션 결과 4개월 동안의 투자 손실률은 8.9~13.1

퍼센트에 달했다.무작위 모델은 매일 아무 주식이나 골라 매입했다가 폐장 전에

매도하고 다음날 다시 매입과 매도를 반복하는 방식이며 4개월 동안 평균 손실은

5.5퍼센트 정도였다. 고정모델은 시가 총액, 회사 규모, 총부채 등을 최상으로

조합해 주식을 매입하고 시뮬레이션 기간 내내 보유하고 있는 방식이다. 이

방식의 평균 손실은 3.8퍼센트였다.그런데 트위터의 데이터를 이용하는 분석법

으로 모델을 개발해 시뮬레이션에 적용하자 평균 손실률이 2.4퍼센트에 불과해

가장 낮은 수치를 기록했다. 이 기간의 다우존스 산업평균지수(DJIA)는 4.2퍼센트

가량 추락했으니 보통 수준을 뛰어넘는 이익을 낸 셈이다.논문은 투자의 비법으로 ‘연결요소의 선정과 분석’을 꼽았다. 트위터 상에서 특정 메시지와 높은 연관성을

지닌 트윗을 찾아내어 이를 추적해 전체 네트워크 구성을 밝혀내야 한다는 것이다. 연결요소가 많아질수록 거래량이 많아지고 주가가 변화하는 등 상호작용 정도가

강해졌다.
▲ 연구진이 분석한 트위터 메시지의 연결구조.

빨간색은 트위터 메시지, 초록색은 사용자,

파란색은 웹주소이며 유사성이 높은 노드끼리는

검은 선으로 이어져 있다. ⓒWSDM 2012

 


물론 이 방법에도 허점은 있다. 연구를 이끈 리스티디스 교수는 캘리포니아대 발표자료를 통해 “트위터를 이용한 투자 전략은

다우존스가 하강한 기간에만 들어맞았고 다우존스가 상승하는 기간에는 큰 성과를 내지 못했다”고 밝혔다. 또한 단기간 예측

에서는 정확도가 떨어진다. 연구진의 모델이 다우존스 산업평균지수 이상의 이익을 내기 시작한 것은 시뮬레이션을 시작한지

한 달이 지나서였다.

그럼에도 이번 논문은 새로운 영역을 개척했다는 점에서 뜨거운 관심을 받고 있다. 지금까지 트위터를 이용한 주식시장 예측

시도는 트윗에 담긴 사용자의 감정을 긍정과 부정으로 나누어 전체 거래량을 예상하는 방향으로만 진행되어 왔다.

그러나 이번 연구는 단순한 트윗 숫자뿐만 아니라 트윗 간의 네트워크 관계를 밝혀 개별 주식의 거래와 등락을 예측했다는

점에서 높은 평가를 이끌어내고 있다.

 

 

임동욱 객원기자 | im.dong.uk@gmail.com

저작권자 2012.03.30 ⓒ ScienceTimes

 

 

[트위트] 트윗트에서 띄워쓰기는 생명이다 

아버지가방에들어가신다." 이 예에서 제가 뭘 말씀드리려 하는지 다 아실 겁니다. 우리말의 띄어쓰기 중요성을 대표적으로 보여 주는 예지요. 그럼 도대체 이것과 트위터가 무슨 관련이 있는지 궁금해하는 분 있으실 거예요. 이번엔 트위터 예를 들어 볼까요?

위 두 가지 예에서 차이점이 보이나요? 링크, 즉 'http'로 시작하는 부분의 색이 다릅니다. 첫 번째 예는 띄어쓰기를 제대로 한 경우고 두 번째는 띄어쓰기를 올바르게 하지 않고 바로 적은 경우입니다. 트위터 상에 글을 적을 땐 띄어쓰기를 제대로 해야 링크가 제대로 나타나고, 또 그래야만 다른 사용자가 그 링크로 연결된 웹사이트를 확인할 수 있다는 거죠. 보시다시피, 띄어쓰기를 하지 않은 두 번째 예에선 클릭할 수 있게끔 나타나야 할 하이퍼링크가 일반 문자화돼버렸습니다.

또 다른 예를 들어보겠습니다.

이번엔 트위터 이름이예요. 첫 번째는 멘션을 하면서 트위터 이름을 앞뒤로 띄어쓰기했습니다. 두 번째 예에서는 앞은 띄어 쓰고 뒤는 하지 않았습니다. 마지막 세 번째는 앞뒤 모두 띄어쓰기를 하지 않은 예입니다. "리플라이와 멘션의 차이"에서 말씀드렸듯이, 멘션은 상대방이 내 트윗을 확인할 수 있게끔 한다는 취지의 용도입니다. 그럼 이 예에서 @odlinuf 는 위 세 가지를 모두 확인할 수 있을까요? 정답은 "맨 첫 번째 트윗만 확인할 수 있다."입니다. 증거를 보여 드려야겠지요?

위 그림은 제 트위터 계정(@odlinuf)에서 오른쪽 사이드바의 '@odlinuf' 메뉴를 펼친 화면입니다. 분명히 @odlinuf를 넣어 세 번을 트위팅했는데 이곳에선 맨 마지막에 올린 트윗 하나밖에 확인할 수 없습니다. 나머지 두 개는 웹 어딘가에서 갈 곳을 잃은 채 떠돌 거예요. 실수일 수도 있지만 이런 경우를 자주 목격합니다.

띄어쓰기하지 않아도 제대로 나타나는 경우가 물론 있습니다. 실험해보니 링크는 느낌표(!)와 슬래시(/), 리트윗할 때 쓰는 콜론(:) 등 몇몇 특수문자를 제외하곤 띄어쓰기와 무관하더군요. 또한, 트위터 이름도 위 예에서는 웹브라우저를 사용했지만 몇몇 트위터 클라이언트를 쓰면 띄어쓰기를 하지 않아도 확인할 수 있다는 걸 발견했습니다. 그러나 이것도 역시 실험을 해보니 항상 그런 것만은 아니었어요. (트위터 클라이언트는 일종의 인터넷 메신저같은 것으로 나중에 소개하려고 합니다.)

따라서 저는 트위터에서 안전하게 링크를 전달하거나 상대방 이름을 언급하려면 앞뒤를 모두 띄어쓰기하는 것이 바람직하다고 보는 겁니다.

RT(리트윗)할 때 띄어쓰기는 더 중요합니다. 다른 사람이 올린 트윗을 리트윗했는데 RT와 이름을 띄어쓰기하지 않았다고 생각해보세요. 누군가는 원래 트윗을 올린 사람 이름을 클릭해 그 사람 트위터 페이지로 가려고 할 텐데 링크가 나타나지 않아 이름을 복사해서 주소창에 붙여 넣어야 하는 불편함이 생길 것이며, 원래 트윗을 올린 사람은 내 글이 리트윗을 통해 트위터에 퍼진다는 걸 모르고 지나칠 수 있습니다. 이래서는 리트윗하는 의미가 사라지고 맙니다.

웹은 링크가 생명입니다. 링크를 통해 이곳저곳을 연결해 주죠. 트위터도 웹의 일부니 만큼 링크는 제대로 처리해줘야 한다고 생각합니다. 이것이 바로 제가 트위터에선 띄어쓰기가 생명이라고 제목을 지은 이유기도 하고요. 트위터 쓰시는 여러분, 공감하시나요? : )

[트윗트] 트위터 활용으로 얻어지는 순기능의 장점 

트위터를 사용하면 웹 이용 습관마저 바뀝니다. 이게 바로 제가 넉 달 남짓 트위터를 사용해보면서 느낀 점이에요. 장점을 제목으로 내걸었으니 물론 좋은 쪽입니다. 트위터를 어떻게 보느냐는 개인마다 다르겠죠. 트위터는 시간 낭비에 불과하다며 등을 보이는 분도 있을 테고 드물지만, 트위터를 생업 수단으로 삼는 분도 있을 겁니다. 그래서 과연 트위터는 나에게 어떤 장점이 있는지 되짚어 보니 크게 다섯 개가 떠오르더군요.

첫째는 네트워킹입니다. 소셜 네트워킹 서비스니 만큼 당연하겠지요. 저는 트위터에서 현재 750여 명과 교류를 합니다. 750명 모두 트위터를 쓰기 전에는 얼굴 한 번 본적 없는 분들이에요. 앞으로 얼마나 많은 분과 인맥을 형성해 나갈지 짐작조차 되질 않습니다. 특히, 트위터는 Kevin Bacon의 6단계 분리(6 Degrees of Separation) 법칙을 뛰어넘습니다. 제가 트위터를 하지 않았다면 김주하 앵커나 영화배우 박중훈 씨와 평생 인사나 제대로 주고받을 수 있었을까요? 여섯 단계를  건너뛰게 해준 도구가 바로 트위터입니다.

또한, 블로그를 운영하다 보니 블로그를 통해 교류했던 분들도 트위터에서 뵙는데 블로그에서 댓글로 대화를 나눌 때는 느끼지 못했던 친밀감이 생깁니다. 그것을 기반으로 관계는 더욱 돈독해졌고요. 트위터가 새로운 인연만 만나게 해주는 건 아닙니다. 기존에 알던 사람과의 관계도 마음 먹기에 따라 발전시킬 수 있습니다.

둘째, 트위터 지식인입니다. 트위터가 거의 실시간 대화형 미디어다 보니 일단 질문을 하면 답이 바로 올라옵니다.  질문을 접한 분이 자신이 대답하기 어렵다 싶은 것은 리트윗을 해줌으로써 내가 follow 하지 않는 분께서 해답을 알려주시기도 합니다. 언제 한번은 서울 어느 곳에서 모임을 주최하시는 분이 원래 가려던 식당에 자리가 없다며 근처에 괜찮은 곳이 있는지 알아보려고 트위터에 질문하시더군요. 물론 이 질문을 본 분들은 그냥 지나치지 않고 여러 군데를 추천해주셨던 걸로 기억합니다. 트위터 쓰는 분들 사이에선 트위터 지식인이라고 부르기도 하지요.

셋째, 공식 기사가 나오기도 전에 남들보다 먼저 뉴스를 접할 수 있습니다. 약간 과장이 섞인 표현입니다만, 그만큼 뉴스 올라오는 속도가 빠릅니다. 지난 2009년 5월, 노무현 전 대통령이 돌아가셨죠. 저는 이 소식을 트위터를 통해 들었습니다. 처음 사건 발생부터 서거 소식까지. 트위터 특파원이라고 부를 수 있을 만큼 이런 현장을 직접 찾아가 사진이나 동영상까지 찍어서 트위터에 신속하게 알리시는 분도 더러 계십니다.

넷째는 블로그 글감 찾기입니다. 블로그를 운영하지 않는 분에겐 해당하지 않는 장점인데요, CNN, 뉴욕타임스와 같은 대형 언론사는 물론이거니와 외국 블로거들은 이제 대부분 트위터를 씁니다. 이들이 트위터에  올리는 트윗은 블로거로서 아주 좋은 블로깅 소재가 됩니다. 특히 특정 주제로 블로그를 운영하시는 분은 평소 자신이 즐겨 찾는 블로그나 웹사이트를 들러 트위터 배지가 있는지 살펴보세요. 아마 십중팔구는 있을 겁니다. 저는 트위터를 시작한 뒤로 피드 리더에서 글감을 발견하기보단 트위터에서 발견하는 일이 훨씬 많아졌습니다.

마지막 다섯째도 블로거에게만 해당하는 사항으로, 블로그 트래픽입니다. 그러나 애초에 트래픽을 바라고 트위터를 시작한 건 아닙니다. 오히려 아예 염두에 놓지도 않았지요. 지금 저는 Oddly Enough와 여기 트위터란을 운영합니다. 트위터란은 트위터가 주제인 블로그니 두말할 것 없고 Oddly Enough에서도 트위터로부터의 유입은 무시할 수 없더군요. 5월부터 8월까지 유입 사이트 순위를 보면 트위터가 9위를 차지합니다. 등장한 지 넉 달 만에 종합 순위 10위권으로 올라왔습니다. 트위터를 이용하는 사람 중 70% 이상이 트위터 클라이언트를 쓴다고 보면 유입은 더 올라갑니다. 트위터 클라이언트에서 오는 유입은 유입 경로에 잡히지 않거든요.

그밖에 personal branding이 있지만 아직은 미약하다고 판단했습니다. 제가 좀 더 노력하고 시간이 지나면 트위터에서 저를 더 확실히 branding 할 수 있겠지요

[트위터] 트위터에 익숙해 지는 방법 

앞선 글에서 트위터에 새로 가입한 사람이 좀 더 쉽게 적응하도록 기존 트위터 사용자 여러분이 해주셨으면 하는 내용을 담아 글을 올렸는데요, 글 말미에 언급한 대로 이번엔 반대로 트위터에 처음 가입해서 아직 익숙지 않은 분이 적응을 빨리할 수 있는 지름길을 그간 제가 경험하고 본 것을 토대로 알려 드릴까 합니다.

쿨해지기
갓 가입하신 분은 자신이 다른 사람에게 리플라이를 보내거나 기타 의사 전달을 시도했는데 상대방이 반응이 없다고 실망하고 의기소침하지 않는 게 정말 중요합니다. 트위터를 좀 더 써보면서 following, followers 수가 늘면 자연스레 터득하시겠지만, 트위터에서 모든 리플라이에 답을 할 순 없답니다. 여러분과 달리 상대방은 수십 개의 리플라이를 받을 수 있고 트위터 시스템 실수로 메시지가 그 사람에게 전달되지 못하는 일이 가끔 발생하기도 하며, 다른 여러 가지 이유로 답을 하지 못하는 상황일 수 있습니다.

처음엔 누군가의 반응이 정말 반갑고 고맙기까지 하다는 거 잘 압니다. 트위터에 계신 분들 대부분은 모두 답을 해주려고 애쓰시니 지레 걱정은 마시고, 여러분도 답을 받을 거란 기대는 하지 않는 것이 스트레스받지 않고 정신 건강에도 좋습니다. 의연하게 대처하세요.

Following 수 늘리기
following 수를 자신이 감당할 수 있을 만큼 늘려보시기 바랍니다. 사람이 많아야 내가 끼어들 만한 대화가 나타날 가능성도 커지고 타임라인 보는 재미도 있습니다. 기존에 알던 사람들과만 트위터를 사용하는 분이 아니라면 1000-2000 명까지 꾸준히 follow 하시길 권합니다. 적당히 follow 하셨으면 이제 다른 사람들은 트위터를 어떻게 쓰는지, 리플라이나 멘션, 리트윗은 어떻게 하는지 눈여겨보세요. 트위터라는 공간에서 꼭 이렇게 사용해야 한다는 정답은 없지만, 여러분이 적응하시는데 도움되는 것만은 분명합니다.

모니터만 바라보지 말고 대화를 시도하세요! photo by tashmahal. (c) Some rights reserved.

먼저 다가가기
누군가 내게 먼저 말을 걸어오리라고 절대 기대하지 마세요. 트위터에 계신 분들이 매정하다고 말씀드리는 게 아니라 먼저 여러분의 존재를 알리는 게 중요하다고 말씀드리는 겁니다. 기다리지 말고 여러분이 먼저 다가가세요. 먼저 다가가면 십중팔구 상대방도 반응을 보이게 마련입니다. 그 반응 정도에 따라 또다시 follow/unfollow를 결정하면 됩니다.

대화 시도하기
트위터는 파티장을 연상케 할 만큼 끊임없이 대화가 이루어지는 곳입니다. 트위터에 가입하신 여러분은 그 파티 참석자고요. 파티를 나 혼자 즐길 수 있나요? 자리를 옮겨다니면서 꾸준히 다른 사람들과 대화를 해야 그 파티가 재미있습니다. 트위터도 다르지 않다고 생각합니다. 나 혼자 떠들면 따분하고 금방 지치기 일쑤겠죠. 그래서 following 수를 일정 수준으로 끌어올린 다음 타임라인에 올라오는 사람들과 어울리시라는 겁니다.

손가락에 철판 깔기
내성적이라 먼저 말 걸기가 쑥스럽다고요? 단상에 올라 수많은 사람들 앞에서 일장 연설을 하는 것도 아닌데 뭐가 두려우신가요? 여러분은 모니터를 보는 거지 직접 그 사람과 마주 앉아 얘기를 나누는 게 아닙니다. 여러분이 조금만 적극적으로 나선다면 저를 포함 기존 트위터 사용자분들이 많이 도와주실 겁니다. 도와주고 싶어 안달인 분들이 많이 계시니 그런 걱정은 떨쳐버리세요.


+ Recent posts