서비스명 : Google 학술 검색
URL : http://scholar.google.co.kr/

Google Scholar의 한글버전 서비스이다.
원래 영문 서비스를 하고 있다가, 이번에 한글 서비스가 오픈했다.

"거인의 어깨에 올라서서 더 넓은 세상을 바라보라" - Sir Isaac Newton
눈에 띄는 문구다. 멋지게 번역을 잘 한 듯... (참고: Standing on the shoulders of giants)

구글을 탄생시킨 PageRank는 논문 검색 서비스의 ranking 모델로 적합하다는 생각이 든다. 관련 논문들의 참조에 헛된 것이 거의 없고, 학술 자료간의 인용 구조는 페이지랭크에서 가정하는 웹페이지간의 링크 구조와 일치한다. 페이지랭크의 기본 컨셉이 웹페이지에 인용된 링크에 있는데, 어쩌면 그 시작은 논문 참조에서 아이디어를 떠올린 듯 하다.

실제로 대학원에서 논문이 실리는 학술지들의 영향력이나 권위 등의 연구를 위해, 논문이 인용 혹은 참조된 회수를 조사하는 것을 본 적이 있는데, 페이지랭크를 활용해 점수화하면 좋겠다는 생각이 들었었다.

논문은 대부분 특정한 형식을 따르기 때문에, 일반 웹페이지보다 구조적인 분석이 가능할 것이다.
그래서, Google Scholar에는 일반 웹검색과는 달리, 1) 인용된 논문 정보, 2) 관련 논문 정보, 3) 각 대학 도서관으로 연결 4) 그룹단위 문서 등이 있다. 고급검색기능으로, 저자 검색, 발행물별, 날짜별 검색이 가능하고, 제목에서만 검색도 가능하다. 이러한 검색기능은 사용자가 정확히 알고 있는 정보를 활용하여, 정확한 자료를 찾는 데에 도움이 될 듯 하다.


사실, 학술자료를 찾고자 하는 학생이나 연구원들은 Google Scholar가 아니더라도 구글검색을 많이 이용해왔다. 학술 연구를 목적으로 검색하는 사람들은 굳이 한글 논문자료를 검색하려고 하지 않지만, 구글 학술검색은 한글 논문까지 그 검색범위를 넓혔다는데에 의의가 있다. 아직 국내 논문은 많지 않은 듯...

현재 국내 여러 사이트에서 논문 검색 서비스를 하고 있으나, 검색결과의 관련성이 떨어지는 경우가 많다.
구글의 검색결과는 관련성이 높은 자료들이 검색되어서 검색이 편하지만, 대부분의 검색결과가 서지정보만 제공하는 페이지로 연결이 된다. 실제 자료을 보거나 다운받아야 할 경우에는, 결국 해당 사이트에서 별도로 가능하다는 불편함이 있다. 그래도, 이 정도로 대량의 학술 자료들 중에서, 꽤 관련성이 높은 자료들을 빠르게 검색해 주는 것은 구글의 강점 중의 하나인 듯하다.

개인적으로, 구글이 진행하고 있는 정보 집적과 관련된 프로젝트들에 관심이 간다. Google Library, Google University, Google Store or Google Mart, Google Bank, Google Credit, Google Hospital 같은 게 생길지가 기대된다. (전혀 사실무근)

::: Google Labs 구경하러 가기~

이용자에 의해 생성되는 키워드 길이에 대한 조사결과를 보다가, 재미있는 것을 발견했다.
조사결과의 히스토그램을 보는 순간, 포아송 분포와 닮았다는 생각이 들었다.
평균길이가 대략 4 ~ 5 인 포아송 분포를 따르는 것처럼 보였다.

이용자가 특정 키워드 하나를 생성할 때 발생하는 음절 수를 확률변수라고 한다면,
그 확률변수는 포아송 분포를 따를 수도 있을 것 같다.
자세한 것은 검증이 필요할 수도 있지만, 위 생각은 틀렸을 수도?
각 음절이 독립적으로 발생한다고 보기에는 무리가 있으려나?

So what ?
이러한 지적 호기심에서, 그 다음으로 무엇이 이어질 수 있는지는 모르겠다.
깊게 들어가면, 항상 내공이 부족함을 느끼게 된다.

책장에 꽂아두었던 확률 책을 다시 한번 꺼내 봐야겠다.
꺼내 본다고, 알 수 있으려나 ~ -_-;;
다시는 볼 일이 없을 줄 알았는데......

확률 공부를 깊이있게 하지 않았던 게... ...
기초가 참 중요한데... 알고 있지만, 어렵단 말이다.

포아송분포 관련 URL :
- Poisson Distribution From Wikipedia

+ Recent posts