현재 섹션 : 칼럼/메모

구글의 검색기술 [번역문]

구글은 더 많은 사이트를 더 빠르게 검색하며, 가장 적절한 결과를 제공한다.
소개

구글은 진보된 하드웨어와 소프트웨어 간의 탁월한 결합으로 작동한다. 사용자가 경험하는 속도는 부분적으로 구글의 검색 알고리즘의 효율성 덕분이고, 또 한편으로는 고속의 검색 엔진을 만들기 위해 연결된 수천대의 저렴한 PC들 덕분이다.

구글 소프트웨어의 심장은 PageRank™이다. 이것은 구글의 설립자인 Larry Page와 Sergey Brin이 스탠포드 대학에서 개발한 웹페이지 랭킹 시스템이다. 그리고 매일 수십명의 엔지니어들이 구글의 모든 면을 향상시키기 위해서 일하고 있는 동안, PageRank는 계속해서 구글 웹 검색도구의 모든 원리를 제공하고 있다.

PageRank 설명

PageRank는 거대한 링크 구조를 개별적인 페이지의 가치 척도로 사용함으로써 웹의 독특한 민주주의적 특성에 의존한다. 본질적으로, 구글은 A 페이지에서 B 페이지로 연결된 링크를 A 페이지가 B 페이지에 한 표를 던진 것으로 해석한다. 그러나 구글은 페이지들이 받은 표나 링크의 단순량 이상의 것에 주목하기 때문에, 표를 던진 페이지도 분석한다. "중요한" 페이지가 던진 표는 더욱 비중있게 다루어지고, 다른 페이지들을 "중요한" 페이지로 만든다.

중요하고 수준높은 사이트들은 더 높은 PageRank를 받는다. 구글은 검색을 수행할 때마다 매번 그것을 기억한다. 물론 중요한 페이지들은 사용자의 쿼리에 부합하지 않으면 아무런 의미도 없다. 그래서 구글은 PageRank를 정교한 text-matching 기술과 조합한다. 이것은 중요하면서도 사용자의 검색에 관련된 페이지들을 찾는 기술이다. 구글은 사용자의 쿼리에 잘 부합하는지 정의하기 위해 페이지에 나타나는 용어의 횟수를 넘어서 페이지 컨텐츠(와 그 용어에 링크된 페이지의 컨텐츠)의 모든 면을 검토한다.

정직성

구글의 복잡하고 자동화된 방법은 사람이 검색결과에 간섭하려는 것을 극도로 어렵게 만든다. 그리고 구글은 검색결과에 밀접하게 관련된 광고를 수행할지라도, 검색결과 내의 배치 자체를 판매하지 않는다. (즉, 아무도 더 높은 PageRank를 살 수 없다.) 구글 검색은 사용자의 검색과 관련된 정보를 가진 수준 높은 웹사이트들을 찾는 쉽고, 정직하고, 객관적인 방법이다.

by 나쥬니

태그 : 구글, PageRank, 검색엔진, Larry Page, Sergey Brin, 랭킹 시스템, 하드웨어, 소프트웨어