- Searching the Web, Introduction to Linear Algebra, 3/E international Edition, by Gilbert Strang -

2005년 봄...
선형대수 강의를 듣는데, 쉬어가기 페이지처럼 쓰여진 위 페이지를 보게 되었다.
SVD 응용 분야를 이야기하면서, HITS algorithm을 소개하는 내용이었다.
신기하고 재밌었다.

원래 그 전에는 국내에 위 책이 나오지 않아서, 같은 저자 Gilbert Strang 이 쓴 
<Linear Algebra and Its Applications>로 공부했었다. 그 책이 계속 교재였다면, 위 페이지는 못 봤을텐데...... -_-;;

암튼, 추가로 아래 글들을 찾아보고 HITS와 PageRank에 대해 좀 더 알아보다가, '검색'은 내 관심사 중의 하나가 되어버렸다.
- <The Use of the Linear Algebra by Web Search Engines> by Amy N. Langville and Carl D. Meyer
- <구글 페이지랭크(PageRank) 알고리듬>, 출처: 이명헌 경영스쿨
- <구글 검색 엔진의 해부학('The anatomy of large scale search engine' 번역)>, 출처: 이명헌 경영스쿨
- <Authoritative sources in a hyperlinked environment (HITS algorithm)>, 출처: 이명헌 경영스쿨
- HITS algorithm from wikipedia
- PageRank from wikipedia

당시에, <링크(Linked)>를 다시 읽고 있었는데, 그 내용과 연관되어 자꾸 관심이 커져버렸다.
과거에 컴퓨터를 처음 만져봤을 때와 인터넷을 처음 경험했을 때의 호기심이 다시 발동했다. 그러면서 드는 생각이...
'이거 미래의 우리 주위에 두루 퍼져 있을지도 모르는, Intelligent Agent 의 시작이 될 수도 있겠는걸?'

그리고, 아래 책이 나오길래 도서관에서 무작정 찾아봤다.
<Google's PageRank and Beyond : the Science of Search Engine Rankings> (Amazon.com에서 보기, Daum 책에서 보기)
구글에서 찾았던 <The Use of the Linear Algebra by Web Search Engines>의 저자들이 책으로 냈다.

도서관에 책이 들어오자마자 대출중이라, 대출 예약을 걸어두었다.
도서대출기간이 긴 사람 - 대학원생이나 교수님 - 이 빌려갔는지 좀 오래 기다려야 했다. 이 사람 대출기간도 넘겼다. -_-;;

이 책을 겨우 대출받아 보는데, 끊임없이 전개되는 행렬 연산 수식에 질려서 완독을 하지 못했다.
그냥 훑어 봐서는 완벽히 이해하기가 좀 어려웠다.
수학을 좋아하지만 잘하지는 못해서 항상 부족함을 느꼈는데, 수학공부의 중요함을 다시 한번 생각하게 됐다.
그런데, 수학공부를 계속 했느냐? 그렇지 못했다.
그 자리에서 바로 삽질을 하고 싶었지만, 워낙에 바쁜 시절인지라. -_-;;;

수학공부는 계속 되어야 한다. ㅋ
"The math learning must go on."

그 전에 읽었던 <구글스토리>라는 책도 다시 읽게 되었고,
드물게도 검색의 스타트업을 끊었던 첫눈의 시작과 끝을 보고...

몇몇 강연과 수업들. 그 때 적었던 메모들...
연습장에 쓰여진 낙서같은 아이디어들...
조금씩 찾아보던 검색서비스들...

저 페이지를 읽을 때만 해도, 현재의 ... 시작점이 될 줄은 몰랐다.
그야말로 나비효과처럼...

그 때를 생각해보니, 재미있어서 소설 한 번 써 봤다.
C'est la vie ~!

서비스명 : Google 학술 검색
URL : http://scholar.google.co.kr/

Google Scholar in Korean

Google Scholar in Korean

Google Scholar의 한글버전 서비스이다.
원래 영문 서비스를 하고 있다가, 이번에 한글 서비스가 오픈했다.

"거인의 어깨에 올라서서 더 넓은 세상을 바라보라" - Sir Isaac Newton
눈에 띄는 문구다. 멋지게 번역을 잘 한 듯... (참고: Standing on the shoulders of giants)

구글을 탄생시킨 PageRank는 논문 검색 서비스의 ranking 모델로 적합하다는 생각이 든다. 관련 논문들의 참조에 헛된 것이 거의 없고, 학술 자료간의 인용 구조는 페이지랭크에서 가정하는 웹페이지간의 링크 구조와 일치한다. 페이지랭크의 기본 컨셉이 웹페이지에 인용된 링크에 있는데, 어쩌면 그 시작은 논문 참조에서 아이디어를 떠올린 듯 하다.

실제로 대학원에서 논문이 실리는 학술지들의 영향력이나 권위 등의 연구를 위해, 논문이 인용 혹은 참조된 회수를 조사하는 것을 본 적이 있는데, 페이지랭크를 활용해 점수화하면 좋겠다는 생각이 들었었다.

논문은 대부분 특정한 형식을 따르기 때문에, 일반 웹페이지보다 구조적인 분석이 가능할 것이다.
그래서, Google Scholar에는 일반 웹검색과는 달리, 1) 인용된 논문 정보, 2) 관련 논문 정보, 3) 각 대학 도서관으로 연결 4) 그룹단위 문서 등이 있다. 고급검색기능으로, 저자 검색, 발행물별, 날짜별 검색이 가능하고, 제목에서만 검색도 가능하다. 이러한 검색기능은 사용자가 정확히 알고 있는 정보를 활용하여, 정확한 자료를 찾는 데에 도움이 될 듯 하다.
Google Scholar 도움말

Google Scholar 도움말 중에서


사실, 학술자료를 찾고자 하는 학생이나 연구원들은 Google Scholar가 아니더라도 구글검색을 많이 이용해왔다. 학술 연구를 목적으로 검색하는 사람들은 굳이 한글 논문자료를 검색하려고 하지 않지만, 구글 학술검색은 한글 논문까지 그 검색범위를 넓혔다는데에 의의가 있다. 아직 국내 논문은 많지 않은 듯...

현재 국내 여러 사이트에서 논문 검색 서비스를 하고 있으나, 검색결과의 관련성이 떨어지는 경우가 많다.
구글의 검색결과는 관련성이 높은 자료들이 검색되어서 검색이 편하지만, 대부분의 검색결과가 서지정보만 제공하는 페이지로 연결이 된다. 실제 자료을 보거나 다운받아야 할 경우에는, 결국 해당 사이트에서 별도로 가능하다는 불편함이 있다. 그래도, 이 정도로 대량의 학술 자료들 중에서, 꽤 관련성이 높은 자료들을 빠르게 검색해 주는 것은 구글의 강점 중의 하나인 듯하다.

개인적으로, 구글이 진행하고 있는 정보 집적과 관련된 프로젝트들에 관심이 간다. Google Library, Google University, Google Store or Google Mart, Google Bank, Google Credit, Google Hospital 같은 게 생길지가 기대된다. (전혀 사실무근)

::: Google Labs 구경하러 가기~

+ Recent posts