Pagerank Nedir?
Page Rank
Nedir?
Pagerank metodu Google tarafından, sitelerin birbirleriyle orantılı
olarak önemlerini yani kısaca popüleritelerini tespit etmek için
bulundu. Bu metod oluşturulurken siteler arasındaki linkler baz
alınarak internetteki topoloji örneklendi.
Page Rank'in ana fikri şöyledir: Eğer bir A sitesi B sitesinin
linkini yayınlamışsa bunun nedeni B sayfasının A sayfası
ziyaretçileri tarafından dolaşılabilecek olarak düşünülmüş
olmasıdır. Bu yapıya göre A sayfası B sayfasının pagerankini
yükseltmiş olacaktır.
Ancak Pagerank kavramı sadece bunlarla sınırlı değildir. Aşağıda
belirttiğim iki fikir de önemli başrol oynar.
A sayfası ne kadar yüksek pageranke sahipse B sayfasının pagerank
değeri de buna orantılı olarak artacaktır.
A sayfasında ne kadar az dışarı link varsa, B sayfasının pagerank
değeri o kadar yüksek olacaktır. Bu mantığa göre A sayfası sadece B
sayfasını link verilecek değerde görmüşse, B sayfasının pageranki
çok daha fazla artacaktır.
Mantığı açıkladıktan sonra, bu sistemi gelin formülize edelim.
Başlamadan önce açıklayalım, bu formülü Google'ın iki kurucusundan
aldık. Formül şu ana kadar değişilik geçirmiştir ancak temel mantığı
halen aynıdır.
A 1, A 2 , ..., An B sayfasına link veren sayfalar olsun. PR(Ak)'yı
da A k sayfasının pageranki olarak kabul edelim. N(Ak) ise Ak
sayfasının dış sayfalara verdiği link sayısı olsun. d ise 0 ile 1
arasında değişen ve genellikle 0.85 olan bir katsayı olsun.
Bu durumda PageRank'in matematiksel değeri şöyle olacaktır:
PR(B) = (1-d) + d x ( PR(A1) / N(A1) + ... + PR(An) / N(An) )
Belki bu formülün hem basit hem de karmaşık olduğunu
düşünebilirsiniz. Basit çünkü sadece birkaç koşula bağlı, karmaşık
çünkü hesaplamak için daha önceden başka bir sitenin pagerankini
hesaplamanız gerekir.
Aslında bu çok basittir, tüm pagerankleri belli bir değere
sabitlerseniz olur biter. Eğer her sayfaya aynı değeri verirseniz;
bu değeri kaç alırsanız alın sonuç değişmeyecektir.
Formülü tekrarlamaya başladığınızda sonuç bir önceki hesaplamaya
bağlı olarak tekrar hesaplanacaktır. İşlem ilerledikçe pagerank
değerleri yerine oturmaya başlayacak, ve bir hesaplamadan diğerine
kadar hiçbir değişiklik olmayacaktır.
Rastgele Yürüme Modeli
PageRank değerinin hesaplanmasında formül dışında bir başka model
daha vardır. Bu model de internetde dolaşan birinin simüle
edilmesiyle, rastgele linkler arasında dolaşılmasıdır.
Bir düşünün, birisi bir sayfada dolaşırken bir link dikkatini çeker
ve ona tıklayarak o sayfada dolaşmaya başlar. Böylece giderek birçok
sayfa dolaşılır .
Page Rank değeri bir ziyaretçinin sayfada harcadığı süreye de bağlı
olabilir.
Eğer gidilen bir sayfada geriye dönüş için de link bulunuyorsa
olasılık daha da artacaktır. Bu da formülün ikinci terimine denk
gelmektedir.
İlk terim ise sayfadan çıkılmadan içeri de ne kadar dolaşılabileceği
olasılığını modeller. Formülde ifade ettiğmiz d sembolü aslında
budur.
|