Amy N. Langville「Google's Pagerank and Beyond: The Science of Search Engine Rankings」



PageRankをもっとしっかりと理解するために勉強した本。

大学の図書館にたまたまあったのでとりあえず読んでみたが、GooglePageRankを中心に検索技術についてかなり詳しく解説している。
数学的に難しいので数式を追えない部分がかなりあったが、大体の内容は理解できた。
教科書的というか論文的というか、全体的に学術色の強い本だった。
最後の章では本書で使われている線形代数を中心とした数学の解説がまとめられている。
PageRankはinlinkの解析しか行っていないが、IBMのAlmaden Research Centerで研究されていたHITSアルゴリズムでは、outlinkの解析も行っているらしい。
HITSアルゴリズムではinlinkによるポイントとoutlinkによるポイントの間に数式的な関係があり、どちらかが増加するともう一方も増加する。
outlinkを増やすこと容易なため、それによるポイントの増加が全体的なランキングを増加させるというのはちょっとどうかと思った。
本書の中で、将来の検索についてLarry PageはIntellectual Agentのような形態を考えているという記述があったが、
このアイデアはこのblogに以前投稿したPersonal Semantic Search Agentにかなり近いのではないかと思った。
最近、ちょこちょこ目にするようになったが、やはりAgent志向的な考え方は次世代を担う技術としてかなり有力なのではないかと思う。
ちなみに、Personal Semantic Search Agentというキーワードは2006年12月時点ではこのblogがGoogleでトップだったが、
現在はWikipediaSemantic Webがトップになりこのblogが2位になっている。
まぁ、このblogは更新頻度も低いし特にリンクが張られているわけではないしPageRankも低いので下がっても仕方ないと思うが、
こんなことを考えている人間は意外と少ないのかなと当時は思った。