지난 번 포스트

를 작성한 후, 야후코리아 검색으로 들어온 레퍼러가 많았다.
왜 그런가 봤더니, 이요원~ 서제스트 1위였다.
야후코리아 검색으로 들어온 레퍼러에도 종종 'fr=kr-autotype_fp'이란 파라메터가 붙어 있었다.
아래 캡쳐화면을 보면, '이요원 9년전'이라는 키워드는 야후코리아 에서만 볼 수 있다.

012345



각 검색서비스마다 검색어 자동완성으로 서제스트해주는 키워드에 차이가 있다는 것을 알 수 있다.
이러한 차이가 나는 원인이 무엇일지 궁금하다. 무엇일까?

Wolfram Alpha (

http://www.wolframalpha.com/

)에서는 Google과는 또 다른 가능성을 볼 수 있었다.

THE SECRET BEHIND THE COMPUTATIONAL ENGINE IN WOLFRAM|ALPHA :

http://blog.wolframalpha.com/2009/05/01/the-secret-behind-the-computational-engine-in-wolframalpha/
Why does computation matter?
Because computation is what turns generic information into specific answers.

데이터에 대한 개인적인 생각을 정리해 봤다.
value chain : Contents - Platform  - Network - Terminal - End Users


흔히들 정보가 중요하다고들 한다.
데이터를 빠르게 해석하여, 유의미한 정보를 만들어내고 활용하는 기업이 경쟁우위를 점할 수 있을 것이다.

그럼, 대량의 데이터는 어디에서 수집할 수 있을까?
사실 어떤 기업이든지 데이터는 모아지고 있을 것이다. 많은 기업들이 데이터를 모으고 해석하는 능력이 가능하다.
하지만, 불특정 다수의 전체 소비자에 대해 알 수 있는 기업들을 꼽아본다면, 아래와 같은 업체들이 아닐까 한다.

1. 대형 유통업체

Wall-mart나 이마트 등과 같은 대형유통업체들이 있다.
전국 각 요지에 있는 대형유통업체들은 소비자들의 직접적인 구매행태를 데이터로 모을 수 있다.
백화점이나 할인마트에서 멤버쉽 서비스를 하는 이유가 여기에 있다. 

2. Telecom Network 서비스 제공자

SKT나 KT 등과 같은 통신사업자들이 있다.
통신서비스는 소비자들의 트랜잭션이 활발하다.
특히, 오늘날에는 이동통신 서비스들은 이동성을 무기로 사람들의 활발한 커뮤니케이션을 기반으로 한다.

통신 서비스회사들 또한 멤버쉽서비스를 제공하고 있다.
가격할인과 포인트적립 등의 부가서비스 제공하고 통합 membership을 구축하여,
고객의 Loyalty를 높이고 고객의 Life-Time Value를 극대화하려는 노력이다.
이것은 Transaction Data를 Communication에서 주요 Consumption expenditure까지 확대했다는 것을 의미한다.

3. Credit Card 서비스 제공자

금융업은 서비스과정에서 소비자들이 자신의 자산 데이터를 제공하고 있는 곳이다.
예금, 대출, 결제 등을 통해서, 고객들의 현금흐름이 발생한다. 
특히, 신용카드회사들은 소비지출 데이터를 모을 수 있다.
신용카드는 기본적으로 멤버쉽 서비스를 기반으로 한다.
이런 관점에서 본다면, 누가 뭐래도 가장 많은 데이터를 모을 수 있는 곳은 국세청이다.

텔레콤회사는 제휴된 업체들에서의 소비행태만을 고려가능하지만,
신용카드회사는 소비자의 소비지출 대부분을 커버가능하다는 장점이 있다.
물론, 대부분의 결제를 그 신용카드로 한다면 말이다.
텔레콤회사의 멤버십카드는 주로 다른 결제수단에 덧붙여 사용되기 때문에, 고객의 메인카드가 아니어도 된다.
신용카드는 메인으로 사용되어야 한다는 단점이 있다. 그래서, 신용카드는 Wallet Share가 특히 중요한 듯 하다.

4. 검색 서비스 제공자

현재 소비자들의 attention을 가장 많이 모을 수 있는 기업은 어디일까?
세계적으로는 Google이고, 국내에서는 nhn이다.   

Google의 핵심역량도 '대용량의 데이터를 빠르게 잘 해석하는 능력'에 있는 것 같다.
Google의 기술은 모두 그것을 위해 필요한 것이다.
 
그런데, 검색 서비스 업체들의 데이터가 Telecom Network Service기업과 
credit Card Service 기업에 비해 취약한 부분이 바로 이동성이다.

Telecom Network 기업은 Mobile Device를 Terminal에 접점을 가지고 있고,
Credit card 기업들은 신용카드라는 Terminal에 접점을 가지고 있다.

이에 비해, 검색서비스는 검색창을 제공하는데, 현재는 주로 Desktop PC와 인터넷망을 통해 접근하고 있어,
장소에 제약을 받고 있다. 최근 모바일기기의 인터넷이 활성화되면서 이러한 장소의 제약은 사라질 가능성이 있다.

그리고, 위 4개의 기업들이 제공하는 서비스들은 모두 Mobile Device 같은 하나의 Terminal로 통합될 수 있다.
과연 이 모바일 플랫폼을 지배할 곳은 어디가 될 지도 흥미롭게 지켜볼 일이다.

5. 덧붙이는 생각

위 기업들의 공통점이 바로 소비자들의 니즈에 따라 Transaction이 발생한다는 점이다.
데이터 통합, 수집 및 해석 등은 항상 개인정보 노출과 사생활 침해의 가능성을 함께 가지고 있다.
이러한 부작용을 제거하는 것이 대단히 중요할 것이다.

그리고, 이러한 데이터를 어떻게 활용하여 비즈니스와 연결시킬 수 있을 지에 대한 문제도 있다.
막상 데이터에서 유의미한 정보들을 만들어내고, 이를 활용할 방법을 찾는 것이 어려운 부분이다.

또, 다른 생각을 덧붙인다면, 바로 이러한 기능을 서비스화하는 기업들의 가능성에 대한 것이다.
몇몇 기업들은 대량의 데이터를 모으고 해석하는 데에 필요한 컴퓨팅 자원을 적절하게 제공함으로써, 
각 기업들안에 모이는 데이터를 분석을 제대로 제공하는 유틸리티 서비스도 활발해지지 않을까 하는 생각을 해 봤다.

특히, 위 4개의 기업들이 자신들의 내부 데이터 분석을 기반으로, 외부 기업들이 가진 데이터 분석에도 활용가능하다면 어떨까?
그리고, 거기에 가장 가까운 기업은 어디일까?
허나, 당분간은 이러한 데이터 수집, 분석 자체가 차별화된 자산이므로, 기업 내부에 두게 될 것 같기도 하다.

며칠 전에, OO님과 싸이월드에 관한 이야기를 하게 되었다.
싸이월드 이야기를 하다가, 예전에 생각하던 게 있어서 적어본다.

1. C2 Project : 싸이월드 블로그

cyworld C2라는 프로젝트가 있었다.
마이베이스, 홈 두 가지 주요 모듈로 진행되었던 것 같다.
마이베이스는 결국 중지됐고, 홈은 블로그 서비스가 되어 버렸다.

마이베이스는 축소되어 거의 없어졌고, 마이싸이월드로 대체, 흡수되었다.
홈은 개인 미디어 공간으로, C2는 처음부터 미니홈피와 충돌이 되는 서비스였다.
현재의 모습은 홈만 블로그 서비스로 이름이 변경되어, 미니홈피와 공존하는 모습이 되었다.

C2 프로젝트는 2006년 하반기부터 시작되어, 2007년 내내 진행되었다.
그 동안 다수의 사용자들은 싸이 미니홈피에서 개인미디어에 대한 경험을 쌓고 있었다.
그리고, 그 경험을 확장시키는 기로에서 몇몇의 사용자들은 블로그 서비스로 이동 중이었다.

네이버에서는 블로그 시즌2를 오픈하게 된다.
네이버에서는 이미 2003년에 블로그 서비스를 시작했고,
확장판 격인 네이버 블로그 시즌2가 2006년 하반기에 시범서비스를 거쳐서,
2007년 1월 1일에 정식 오픈한다.
또한, 다음은 2007년 11월에 티스토리를 정식 오픈했다.

미니홈피 서비스를 지속적으로 성장시키기 위해서는 어떻게 해야 했을까?
미니홈피는 Toy로 인식되든 SNS였든간에, 재미있는 서비스였는데...
우리에겐 아직 그 다음판이 없다.


2. 싸이월드 미니라이프 : 가상세계로의 경험 확장

싸이월드는 미니홈피의 성공 이후, C2를 통해서 사용자경험의 확장을 시도하게 된다.
그런데, 이는 앞서 말한 바와 같이, 블로그 서비스에서 그쳤다.

그 후, 싸이월드는 <미니라이프>를 통해서, <세컨드라이프>와 같은 SNS의 형태를 시도한다.
3D 가상세계를 아기자기하게 꾸며놓고, 3D버전의 미니미가 돌아 다니도록 했다.

사실 이러한 virtual world 를 만드려는 시도는 이미 커뮤니티 게임 쪽에서 많이 이루어지고 있었다.
전투 게임들도 많지만, 순수하게 가상 커뮤니티만을 위한 게임도 있었다.

지금은 온라인 농구 게임 <freestyle>로 유명해졌지만, JC Entertainment의 <조이시티>였던가? 
(JC가 Joy City의 약자인 걸로 기억한다.)
지금 생각나는 게임들 중에는 그 게임이 가상 커뮤니티를 표방하는 게임이었다.
그리고, 외국에서는 - 약간 다른 스타일이긴 하지만, Will Wright이 제작한 <sims>를 온라인으로 확장한 Sims Online 이 그러한 게임이라고 볼 수 있겠다.

online MMORPG는 기본적으로 가상사회를 만들고 있다.
가상사회를 만들어서 그 안에서 전투나 사회적 커뮤니티가 이루어진다.
대부분의 게임이 몹들과의 전투로 아바타를 성장시킨다.
<Ultima Online>처럼 게임 속에서 실제 세계와 유사한 직업을 가지게 되는 게임들이 있기도 했다.
하지만, 그것들은 판타지 세계관에서의 직업들이고, 대부분이 전투에 필요한 물건을 생산하는 직업들이다.

온라인게임들은 대부분 3인칭 시점의 화면을 가지고 있는데,
게임들이 2D에서 3D로 이동하면서, FPS처럼 1인칭 시점의 화면을 가지고 있는 경우도 많아졌다.

가상세계에서의 커뮤니티 서비스는 컨텐츠 부족이 한계라고 생각할 수도 있지만,
실감나는 인터페이스의 부족도 적지 않은 한계로 보인다.
현실세계의 물리적인 요소들을 본따서 가상세계로 옮겨놓는 데에 중점을 두는 것은 아직 어려울 것 같다.

사람들이 로봇의 형체에 대해서 어떻게 느끼는지에 대한 이야기를 들은 것이 생각난다.
사람과 거의 닮은 경우에 가장 친밀감을 느끼지만, 어설프게 사람을 흉내낸 로봇에 대해 위화감을 느낀다는 것이다. 어설프게 흉내낸 것보다는 오히려 아예 다른 형태를 지닌 경우가 더 나은 친밀감을 보였다는 점이다.

결국에는 영화 <

론머맨

>이나 <

매트릭스

>에 나오는 가상세계의 인터페이스가 되지 않을까?
(개인적으로, 이 두 영화에서 나오는 그 장면(?)들은 잊혀지지 않는다.)
wii 인터페이스처럼 실제의 액션이 그대로 가상세계의 액션이 되는 것을 보면,
그러한 미래도 멀지 않은 듯 하다.

인터페이스 기술의 발전으로 가상세계와 현실세계가 융합되면,
이런 virtual World와 이를 활용한 SNS도 더 활성화 되지 않을까 싶다.

오늘 아침에 뉴스기사를 보다가 발견했다.
구글 애드센스가 게임으로 확장된다고 한다.
게임과 광고의 결합은 재미있는 생각이다.

게임은 대부분 사용자의 어텐션이 높은 편이라서 광고효과가 좋을 것 같다.
광고가 게임의 사용자 경험에 방해가 되지 않는다면 말이다.

물론 이전부터 게임 내 광고는 시도되어 왔다.
하지만, 게임광고도 광고주 및 영업채널망 관리, 적절한 노출방법을 플랫폼화할 수 있다면,
지금보다 더 지속적인 수익 창출의 기반을 만들 수 있을 것이다.
검색광고처럼 사용자의 관심 또는 컨텐츠와의 관련이 있어야 할 듯 하다.

최근, nhn이 지주회사를 추진한다는 설이 있는데,
순수지주회사 아래에, 검색포털(네이버) - 온라인광고(nhn광고) - 온라인게임(한게임)
세 가지 사업분야로 구분해서 가는 것도 가능할 것이다.
물론, 세 가지 사업 중 하나를 사업으로 가져가는 사업지주회사 형태도 생각해 볼 수 있다.

특히, 온라인광고를 검색이나 포털과 게임 서비스에 적극적으로 결합시킬 수 있지 않을까 싶다.
향후 모바일+지역광고+온라인게임 등을 통해, 온라인광고를 플랫폼으로 만들 가능성이 있다.

덧) nhn이 물적분할하여, nhn IBP를 설립한다고 공시했다. 2009.03.05.
     지주회사 추진은 아직 미확인이다.

Introduction to Linear Algebra

2005년 봄...
선형대수 강의를 듣는데, 쉬어가기 페이지처럼 쓰여진 위 페이지를 보게 되었다.
SVD 응용 분야를 이야기하면서, HITS algorithm을 소개하는 내용이었다.
신기하고 재밌었다.

원래 그 전에는 국내에 위 책이 나오지 않아서, 같은 저자 Gilbert Strang 이 쓴 
<Linear Algebra and Its Applications>로 공부했었다. 그 책이 계속 교재였다면, 위 페이지는 못 봤을텐데...... -_-;;

암튼, 추가로 아래 글들을 찾아보고 HITS와 PageRank에 대해 좀 더 알아보다가, '검색'은 내 관심사 중의 하나가 되어버렸다.
- <

The Use of the Linear Algebra by Web Search Engines

> by Amy N. Langville and Carl D. Meyer
- <

구글 페이지랭크(PageRank) 알고리듬

>, 출처: 이명헌 경영스쿨
- <

구글 검색 엔진의 해부학('The anatomy of large scale search engine' 번역)

>, 출처: 이명헌 경영스쿨
- <

Authoritative sources in a hyperlinked environment (HITS algorithm)

>, 출처: 이명헌 경영스쿨
-

HITS algorithm from wikipedia

-

PageRank from wikipedia

당시에, <

링크(Linked)

>를 다시 읽고 있었는데, 그 내용과 연관되어 자꾸 관심이 커져버렸다.
과거에 컴퓨터를 처음 만져봤을 때와 인터넷을 처음 경험했을 때의 호기심이 다시 발동했다. 그러면서 드는 생각이...
'이거 미래의 우리 주위에 두루 퍼져 있을지도 모르는, Intelligent Agent 의 시작이 될 수도 있겠는걸?'

그리고, 아래 책이 나오길래 도서관에서 무작정 찾아봤다.
<Google's PageRank and Beyond : the Science of Search Engine Rankings> (

Amazon.com에서 보기

,

Daum 책에서 보기

)
구글에서 찾았던 <The Use of the Linear Algebra by Web Search Engines>의 저자들이 책으로 냈다.

도서관에 책이 들어오자마자 대출중이라, 대출 예약을 걸어두었다.
도서대출기간이 긴 사람 - 대학원생이나 교수님 - 이 빌려갔는지 좀 오래 기다려야 했다. 이 사람 대출기간도 넘겼다. -_-;;

이 책을 겨우 대출받아 보는데, 끊임없이 전개되는 행렬 연산 수식에 질려서 완독을 하지 못했다.
그냥 훑어 봐서는 완벽히 이해하기가 좀 어려웠다.
수학을 좋아하지만 잘하지는 못해서 항상 부족함을 느꼈는데, 수학공부의 중요함을 다시 한번 생각하게 됐다.
그런데, 수학공부를 계속 했느냐? 그렇지 못했다.
그 자리에서 바로 삽질을 하고 싶었지만, 워낙에 바쁜 시절인지라. -_-;;;

수학공부는 계속 되어야 한다. ㅋ
"The math learning must go on."

그 전에 읽었던 <

구글스토리

>라는 책도 다시 읽게 되었고,
드물게도 검색의 스타트업을 끊었던

첫눈

의 시작과 끝을 보고...

몇몇 강연과 수업들. 그 때 적었던 메모들...
연습장에 쓰여진 낙서같은 아이디어들...
조금씩 찾아보던 검색서비스들...

저 페이지를 읽을 때만 해도, 현재의 ... 시작점이 될 줄은 몰랐다.
그야말로 나비효과처럼...

그 때를 생각해보니, 재미있어서 소설 한 번 써 봤다.
C'est la vie ~!

싸이월드에서 C2프로젝트를 처음 접했을 때.
내가 C2 project에 기대했던 건 '개인 아카이브'였다.
개인적으로, 개인 아카이브 형태의 서비스가 굉장히 필요하다.

아직도 종이와 펜이 아직도 가장 편하긴 하다.
우주시대를 그린 소설 <은하영웅전설>에서도 종이는 사라지지 않고 등장한다.
종이를 대체할 수 있는 편한 것을 떠올리기 어려웠나보다.
종이는 읽고 쓰기에는 매우 편하지만, 가장 큰 단점이
그 이후의 보관이 불편하고, 검색이 불가능하다는 것이다.

현재 유사한 기능을 제공하고 사람들이 많이 사용하는 서비스는
flickr나 Google Note, Google Docs&spreadsheet인 듯 하다.
임시 메모로는 윈도우 메모장이 최고라는 사람도 있다.

현재 국내 서비스중에 개인 아카이브에 가장 근접한 서비스가 스프링노트인 듯 하다.
하지만, 이것은 문서 기반의 서비스이다.

이미지, 음성, 동영상, 문서, 슬라이드, 스프레드시트, URL링크, 다양한 자료를
한 번에 분류하고 보관할 수 있는 서비스.
그리고, 그 중 몇 가지는 블로그나 공유 서비스로 퍼블리싱도 가능한 서비스.
flickr나 picasa, itunes, webhard, deicious, search engine, office, blog, wiki 등
이 모든 서비스를 한방에 할 수 있는 방법은 없을까?

개인 아카이브에서 중요한 것이 보안과 안정성, 지속가능성인데,
온라인만으로는 그것을 보증하기가 어렵기 때문이다.
또한, 업체 입장에서는 스토리지 부담이 늘어나고, 그만큼 수익을 보장하기가 어려운 듯 하다.

그 동안 개인 아카이브 기능을 유사하게 제공하는 서비스들이 있었으며,
그 서비스를 이용하는 사람들이 있을 것이다.
또는, 기존의 서비스들을 개인 아카이브로 사용하는 사용자들이 있을 것이다.
블로그도 그렇고, 스크랩 기능이나 copy&paste 기능이 그렇다.
블로그만 이용한다면, windows Live writer를 사용해도 좋을 것이다.

내가 생각하는 개인 아카이브 서비스는 굳이 온라인 웹서비스라기 보다는 온오프연동이 아닐까 싶다.
오프라인에 보관하고 관리하면서, 일부만 온라인에 연동시킬 수 있는 서비스가 필요하다.
이러한 개인아카이브는 수집-분류-보관-공유-공개-발행, 저작권 보호 기능으로 구성되어 있다.

그리고, 모바일 디바이스로 언제 어디서나 온라인에 접속해서 자신의 아카이브에 접근이 가능한 것도 필요하다.
책이나 음반도 한번 구입하여 저장해두었다가, 한번씩 접속해서 들어보는 것도 좋을 것이다.
이것에 기반해 다른 사람과의 커뮤니케이션도 중요할 것 같다.

언제쯤 이런 서비스가 만들어질까? or 만들 수 있을까?


Amazon에는 SIPs라는 서비스가 있다. 책에서 주요 키워드를 보여준다.
SIPs는 Statistically Improbable Phrases 의 약자이다.
그 아래로는 CAPs도 있는데, CApitalized Phrases 의 약자이다.

두 가지 모두 Key Phrases 그 책을 대표하는 키워드를 보여주는 것이다.
한 책에서만 나타나는 키워드는 그 책의 고유한 특성을 보여줄 수 있다.

TF*IDF 개념과 비슷하지만, 통계적으로 불가능하다는 의미가 키워드 빈도의 분포곡선에서 오른쪽 꼬리 끝에 위치하는 부분을 의미하는 게 아닐까 싶다. 무작위성으로는 발생하기 어려운 이벤트라고 생각하면 이해하기 쉽다.


우리는 블로그나 카페 등의 서비스를 사용하고 있는데, 거기에 쌓여 있는 데이터들은
과연 누구의 소유라 할 수 있을까?
작성자가 익명의 다수에게 공유한 것일까?
아니면 작성자가 서비스에 필요한 것들을 서비스 제공업체에게 빌려서 사용하는 것이라 볼 수 있을까?
회원 약관을 읽어봐야 하나?
Ghost or Shell ?
...


Long tail?
Chris Anderson의 저서 <

롱테일 경제학

>이라는 책은 읽어보지 않았지만,
워낙에 자주 언급되는 단어라서, 여기저기에서 많이 듣게 된다.
롱테일 이론에 따르면, 꼬리(tail)는 길(long) 뿐만 아니라, 통통하기도(fat) 하다.

롱테일 이론은 아래와 같다. (물론, 내가 이해한대로... -_-;;)

1. 생산 측면
Digital Products의 특성상 한계비용이 0(제로)에 가깝게 줄어든다는 점이다.

2. 수요 측면
상품이나 서비스에 대한 비용이 낮아진다. 기존에 비용이 효용보다 낮아서 만족시키지 못했던 롱테일 쪽의 수요가 발생 가능하다.

그런데, 이러한 생각과는 반대의 글 - <롱테일은 환상이다>이 HBR에 발표됐다.
여기서는 '블록버스터 전략'이라고 알려진 전통적 마케팅 방식과 비교해 설명하고 있다. 블록버스터 전략은 미디어나 엔터테인먼트 분야에서 많이 사용한다고 한다.
블록버스터 전략의 사례로 그랜드 센트럴 퍼블리싱 (옛 워너북스)의 사례를 들고 있다. 매장 진열대를 가진 전통적인 유통방식에는 공간의 제약이 있기 마련이다. 따라서 베스트 셀러가 될 가능성이 높은 몇 가지 제품에 마케팅 재원을 집중적으로 투자한다.
  
2006년 자료인가? 출시한 책의 20%가 전체 매출의 약 80%를 차지하는데, 이 20%의 책이 전체 이윤에서 차지하는 비중은 훨씬 더 컸다고 한다.
 나도 예전에는 검색이 접근성을 높여주어, 롱테일 현상이 발생하고 대등하게 경쟁할 수 있을거라 생각했다.
그런데 요즘에는 그게 아니라는 생각이 들기도 한다.

+ Recent posts