|
Cos'è il PageRank? A cosa serve il Page Rank?
Vediamo di dare delle risposte a queste domande
che spesso si pongono i webmaster.
E lo facciamo dando un paio di nozioni ...
Iniziamo subito col dire che il PageRank è uno
dei brevetti di Google, il famosissimo
motore
di ricerca che è diventato ormai da tempo, senza ombra di
dubbi,o il motore di ricerca più utilizzato al mondo come si
evidenzia nelle innumerevoli statistiche eseguite dagli istituti
di ricerca.
Il grado di affluenza da parte dei navigatori al motore Google è
dovuta in larga parte al modo semplice con cui si utilizza la sua
interfaccia, stilizzata e priva di contenuti che potrebbero
appesantire la pagine. Un altro fattore determinate che ha
sicuramente influito nell'accrescere la preferenza degli utenti
verso Google è stata la qualità dei risultati ottenuti dalle
ricerche, che sono sempre stati molto più rilevanti rispetto a
quelli degli altri motori di ricerca presenti sul web. Tali
risultati di grande qualità sono dovuti in primis proprio
all'utilizzo del PageRank, un sistema per assegnare alle pagine
web un punteggio di qualità messo a punto dai due fondatori di
Google: Sergey Brin e Lawrence Page. Il PageRank viene
quantificato da Google per tutti i documenti all'interno del suo
database, quindi per ogni pagina web e ciò avviene dinamicamente
e istantaneamente. Il calcolo del PageRank viene aggiornato per
quanto riguarda utility come la Google Tool Bar solo
periodicamente in quella che va sotto il nome di "Google
Dance", ma come detto il PageRank , per quanto riguarda la
visione di Google, varia dinamicamente. L'aasegnazione del PR Page
Rank ha come scopo quella di calcolare la qualità dei documenti e
al pari di altri fattori, và ad influenzare il posizionamento che
una determinata pagina ha nella classifica delle ricerche via
Google.
Prima del sistema PageRank i motori di ricerca utilizzavano un
altro sistema detto link-popularity come parametro di correzione
dell'ordinamento nei loro algoritmi , alcuni webmaster avevano così
iniziato a capire come aumentarla artificialmente, creando
centinaia o anche migliaia pagine web che contenessero link ai
siti da portare ai primi posti dei motori di ricerca, dando spesso
risultati falsati e quindi non attinenti ne utili alle ricerche
degli utenti.
Il concetto migliorativo della link-popularity e che forma la base
dell'algoritmo del PageRankè il seguente:
Tutti i documenti presenti nel database di Google hanno un
punteggio (PageRank) che si basa sul numero di link che riceve
dagli altri documenti, ma non tutti i link che il documento riceve
hanno la stessa capacità di dare lo stesso punteggio, infatti
quelli ricevuti da documenti importanti, cioè da documenti che a
loro volta ricevono molti link, contano di più. Quindi il
PageRank di un documento è collegato al PageRank dei documenti
che lo linkano, ma anche il PageRank di questi ultimi sono
collegati a quelli di altri siti che linkano loro e così via.
Risulta quindi abbastanza chiaro che il calcolo del PageRank è un
calcolo ricorsivo, che deve essere ripetuto un certo numero di
volte per avere un risultato che possa essere considerato stabile.
Alla fine dei calcoli ogni documento indicizzato da Google avrà
il suo valore di PageRank che servirà come fattore correttivo
nella fase di ordinamento dei risultati delle ricerche degli
utenti, per cui a parità di altri fattori il documento con
PageRank più alto avrà un posizionamento migliore. Bisogna dire
che però l'algoritmo del PageRank viene migliorato di volta in
volta e non è possibile definire una regola stabile per il
calcolo del PageRank.
PageRank : valore che Google attribuisce ad una pagina
web. Questo valore accresce con il tempo, con la bontà
dei contenuti e quindi con i back link, ossia i link di
altri siti che puntano a quella determinata pagina.
Il primo concetto di PageRank messo a punto da
Sergey Brin e Lawrence Page alla Stanford University si fondava
sulla formula basata esclusivamente sul computo dei link che le
pagine web si scambiano fra loro. Sicuramente oggi quella formula
è stata implementata con altri fattori di diversa natura adatti a
correggere "i bug" utilizzati per aumentare
"impropriamente" il PR dai webmaster che, ormai da tempo
maneggiano vendite e scambi di link ad alto PR.
Gli ingegneri di Google cercano sempre nuovi sistemi atti a
migliorare il calcolo del PageRank di un documento. Detto questo
ribadiamo il concetto che sulla formula del PageRank possiamo fare
solo ipotesi, anche se alcune di esse sono molto fondate all'atto
pratico.
Partiamo quindi dalla formula originale del
PageRank, così svolgiamo un'analisi della formula originale per
il calcolo del PageRank per arrivare poi a provare e quindi
verificare il funzionamento di un meccanismo di valutazione dei
documenti web attraverso parametri esterni.
La formula originale del Page Rank è stata pubblicata da Sergey
Brin e Larry Page nel documento The Anatomy of a Large-Scale
Hypertextual Web Search Engine, risalente al 1998:
PR(A) = (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))-
PR(A) è il PageRank della pagina
A- n è il numero delle pagine che linkano la
pagina
A- PR(T1) - PR(Tn) sono i valori di PageRank delle n pagine
T1 - Tn che linkano la pagina A- C
(T1) - C(Tn) sono il numero di link in uscita presenti nelle
pagine
T1 - Tn- d è un fattore correttivo di attenuazione che può
assumere valori fra 0 e 1
Dalla formula si capisce chiaramente che il PageRank di ogni
pagina nel database di Google è influenzato dal PageRank delle
pagine che contengono un link a quella stessa pagina.
Inoltre dall'espressione PR(Tn)/C(Tn)) si evince che il PR di una
pagina T(n) che contiene un link alla pagina A non fa aumentare il
PR di questa di una quantità direttamente proporzionale al
PageRank della pagina Tn ma di un valore dipendente dal numero dei
link in uscita presenti.
Questo significa che se la pagina Tn ha molti link in uscita
aumenterà di una quantità minore il PR della Pagina A ed
ovviamente di tutte le altre pagine a cui puntano i suoi link in
uscita.
Una conseguenza di questa formula è che una pagina web può avere
un alto PR se molte pagine, anche a basso PR, contengono un link
ad essa oppure può averlo anche se riceve un solo link da una
pagina ad alto PR, cioè da un documento "importante"
perché a sua volta molto citato e magari con pochi link uscenti.
Testo riportato dal
sito :
http://www.sponsorizzati.it/formula-pagerank.asp |