page rank sub

Upload: riteshz

Post on 09-Apr-2018

225 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/8/2019 Page Rank Sub

    1/17

  • 8/8/2019 Page Rank Sub

    2/17

    a s k i n g a n o b s c u r e q u e s t i o n a b o u t a n I B M c o m p u t e r i s v e r y d i e r e n t f r o m t h e I B M h o m e p a g e . A

    r e s e a r c h a r t i c l e a b o u t t h e e e c t s o f c e l l u l a r p h o n e u s e o n d r i v e r a t t e n t i o n i s v e r y d i e r e n t f r o m a n

    a d v e r t i s e m e n t f o r a p a r t i c u l a r c e l l u l a r p r o v i d e r . T h e a v e r a g e w e b p a g e q u a l i t y e x p e r i e n c e d b y a

    u s e r i s h i g h e r t h a n t h e q u a l i t y o f t h e a v e r a g e w e b p a g e . T h i s i s b e c a u s e t h e s i m p l i c i t y o f c r e a t i n g

    a n d p u b l i s h i n g w e b p a g e s r e s u l t s i n a l a r g e f r a c t i o n o f l o w q u a l i t y w e b p a g e s t h a t u s e r s a r e u n l i k e l y

    t o r e a d .

    T h e r e a r e m a n y a x e s a l o n g w h i c h w e b p a g e s m a y b e d i e r e n t i a t e d . I n t h i s p a p e r , w e d e a l

    p r i m a r i l y w i t h o n e - a n a p p r o x i m a t i o n o f t h e o v e r a l l r e l a t i v e i m p o r t a n c e o f w e b p a g e s .

    1 . 2 P a g e R a n k

    I n o r d e r t o m e a s u r e t h e r e l a t i v e i m p o r t a n c e o f w e b p a g e s , w e p r o p o s e P a g e R a n k , a m e t h o d f o r

    c o m p u t i n g a r a n k i n g f o r e v e r y w e b p a g e b a s e d o n t h e g r a p h o f t h e w e b . P a g e R a n k h a s a p p l i c a t i o n s

    i n s e a r c h , b r o w s i n g , a n d t r a c e s t i m a t i o n .

    S e c t i o n 2 g i v e s a m a t h e m a t i c a l d e s c r i p t i o n o f P a g e R a n k a n d p r o v i d e s s o m e i n t u i t i v e j u s t i -

    c a t i o n . I n S e c t i o n 3 , w e s h o w h o w w e e c i e n t l y c o m p u t e P a g e R a n k f o r a s m a n y a s 5 1 8 m i l l i o n

    h y p e r l i n k s . T o t e s t t h e u t i l i t y o f P a g e R a n k f o r s e a r c h , w e b u i l t a w e b s e a r c h e n g i n e c a l l e d G o o g l e

    ( S e c t i o n 5 ) . W e a l s o d e m o n s t r a t e h o w P a g e R a n k c a n b e u s e d a s a b r o w s i n g a i d i n S e c t i o n 7 . 3 .

    2 A R a n k i n g f o r E v e r y P a g e o n t h e W e b

    2 . 1 R e l a t e d W o r k

    T h e r e h a s b e e n a g r e a t d e a l o f w o r k o n a c a d e m i c c i t a t i o n a n a l y s i s G a r 9 5 ] . G o m a n G o f 7 1 ] h a s

    p u b l i s h e d a n i n t e r e s t i n g t h e o r y o f h o w i n f o r m a t i o n o w i n a s c i e n t i c c o m m u n i t y i s a n e p i d e m i c

    p r o c e s s .

    T h e r e h a s b e e n a f a i r a m o u n t o f r e c e n t a c t i v i t y o n h o w t o e x p l o i t t h e l i n k s t r u c t u r e o f l a r g e

    h y p e r t e x t s y s t e m s s u c h a s t h e w e b . P i t k o w r e c e n t l y c o m p l e t e d h i s P h . D . t h e s i s o n \ C h a r a c t e r i z i n g

    W o r l d W i d e W e b E c o l o g i e s " P i t 9 7 , P P R 9 6 ] w i t h a w i d e v a r i e t y o f l i n k b a s e d a n a l y s i s . W e i s s

    d i s c u s s c l u s t e r i n g m e t h o d s t h a t t a k e t h e l i n k s t r u c t u r e i n t o a c c o u n t W V S

    +

    9 6 ] . S p e r t u s S p e 9 7 ]

    d i s c u s s e s i n f o r m a t i o n t h a t c a n b e o b t a i n e d f r o m t h e l i n k s t r u c t u r e f o r a v a r i e t y o f a p p l i c a t i o n s .

    G o o d v i s u a l i z a t i o n d e m a n d s a d d e d s t r u c t u r e o n t h e h y p e r t e x t a n d i s d i s c u s s e d i n M F H 9 5 , M F 9 5 ] .

    R e c e n t l y , K l e i n b e r g K l e 9 8 ] h a s d e v e l o p e d a n i n t e r e s t i n g m o d e l o f t h e w e b a s H u b s a n d A u t h o r i t i e s ,

    b a s e d o n a n e i g e n v e c t o r c a l c u l a t i o n o n t h e c o - c i t a t i o n m a t r i x o f t h e w e b .

    F i n a l l y , t h e r e h a s b e e n s o m e i n t e r e s t i n w h a t \ q u a l i t y " m e a n s o n t h e n e t f r o m a l i b r a r y c o m -

    m u n i t y T i l ] .

    I t i s o b v i o u s t o t r y t o a p p l y s t a n d a r d c i t a t i o n a n a l y s i s t e c h n i q u e s t o t h e w e b ' s h y p e r t e x t u a l

    c i t a t i o n s t r u c t u r e . O n e c a n s i m p l y t h i n k o f e v e r y l i n k a s b e i n g l i k e a n a c a d e m i c c i t a t i o n . S o ,

    a m a j o r p a g e l i k e h t t p : / / w w w . y a h o o . c o m / w i l l h a v e t e n s o f t h o u s a n d s o f b a c k l i n k s ( o r c i t a t i o n s )

    p o i n t i n g t o i t .

    T h i s f a c t t h a t t h e Y a h o o h o m e p a g e h a s s o m a n y b a c k l i n k s g e n e r a l l y i m p l y t h a t i t i s q u i t e

    i m p o r t a n t . I n d e e d , m a n y o f t h e w e b s e a r c h e n g i n e s h a v e u s e d b a c k l i n k c o u n t a s a w a y t o t r y t o b i a s

    t h e i r d a t a b a s e s i n f a v o r o f h i g h e r q u a l i t y o r m o r e i m p o r t a n t p a g e s . H o w e v e r , s i m p l e b a c k l i n k c o u n t s

    h a v e a n u m b e r o f p r o b l e m s o n t h e w e b . S o m e o f t h e s e p r o b l e m s h a v e t o d o w i t h c h a r a c t e r i s t i c s o f

    t h e w e b w h i c h a r e n o t p r e s e n t i n n o r m a l a c a d e m i c c i t a t i o n d a t a b a s e s .

    2

  • 8/8/2019 Page Rank Sub

    3/17

    2 . 2 L i n k S t r u c t u r e o f t h e W e b

    W h i l e e s t i m a t e s v a r y , t h e c u r r e n t g r a p h o f t h e c r a w l a b l e W e b h a s r o u g h l y 1 5 0 m i l l i o n n o d e s ( p a g e s )

    a n d 1 . 7 b i l l i o n e d g e s ( l i n k s ) . E v e r y p a g e h a s s o m e n u m b e r o f f o r w a r d l i n k s ( o u t e d g e s ) a n d b a c k l i n k s

    ( i n e d g e s ) ( s e e F i g u r e 1 ) . W e c a n n e v e r k n o w w h e t h e r w e h a v e f o u n d a l l t h e b a c k l i n k s o f a p a r t i c u l a r

    p a g e b u t i f w e h a v e d o w n l o a d e d i t , w e k n o w a l l o f i t s f o r w a r d l i n k s a t t h a t t i m e .

    A

    B

    C

    F i g u r e 1 : A a n d B a r e B a c k l i n k s o f C

    W e b p a g e s v a r y g r e a t l y i n t e r m s o f t h e n u m b e r o f b a c k l i n k s t h e y h a v e . F o r e x a m p l e , t h e

    N e t s c a p e h o m e p a g e h a s 6 2 , 8 0 4 b a c k l i n k s i n o u r c u r r e n t d a t a b a s e c o m p a r e d t o m o s t p a g e s w h i c h

    h a v e j u s t a f e w b a c k l i n k s . G e n e r a l l y , h i g h l y l i n k e d p a g e s a r e m o r e \ i m p o r t a n t " t h a n p a g e s w i t h

    f e w l i n k s . S i m p l e c i t a t i o n c o u n t i n g h a s b e e n u s e d t o s p e c u l a t e o n t h e f u t u r e w i n n e r s o f t h e N o b e l

    P r i z e S a n 9 5 ] . P a g e R a n k p r o v i d e s a m o r e s o p h i s t i c a t e d m e t h o d f o r d o i n g c i t a t i o n c o u n t i n g .

    T h e r e a s o n t h a t P a g e R a n k i s i n t e r e s t i n g i s t h a t t h e r e a r e m a n y c a s e s w h e r e s i m p l e c i t a t i o n

    c o u n t i n g d o e s n o t c o r r e s p o n d t o o u r c o m m o n s e n s e n o t i o n o f i m p o r t a n c e . F o r e x a m p l e , i f a w e b

    p a g e h a s a l i n k o t h e Y a h o o h o m e p a g e , i t m a y b e j u s t o n e l i n k b u t i t i s a v e r y i m p o r t a n t o n e .

    T h i s p a g e s h o u l d b e r a n k e d h i g h e r t h a n m a n y p a g e s w i t h m o r e l i n k s b u t f r o m o b s c u r e p l a c e s .

    P a g e R a n k i s a n a t t e m p t t o s e e h o w g o o d a n a p p r o x i m a t i o n t o \ i m p o r t a n c e " c a n b e o b t a i n e d j u s t

    f r o m t h e l i n k s t r u c t u r e .

    2 . 3 P r o p a g a t i o n o f R a n k i n g T h r o u g h L i n k s

    B a s e d o n t h e d i s c u s s i o n a b o v e , w e g i v e t h e f o l l o w i n g i n t u i t i v e d e s c r i p t i o n o f P a g e R a n k : a p a g e h a s

    h i g h r a n k i f t h e s u m o f t h e r a n k s o f i t s b a c k l i n k s i s h i g h . T h i s c o v e r s b o t h t h e c a s e w h e n a p a g e

    h a s m a n y b a c k l i n k s a n d w h e n a p a g e h a s a f e w h i g h l y r a n k e d b a c k l i n k s .

    2 . 4 D e n i t i o n o f P a g e R a n k

    L e t u b e a w e b p a g e . T h e n l e t F

    u

    b e t h e s e t o f p a g e s u p o i n t s t o a n d B

    u

    b e t h e s e t o f p a g e s t h a t

    p o i n t t o u . L e t N

    u

    = j F

    u

    j b e t h e n u m b e r o f l i n k s f r o m u a n d l e t c b e a f a c t o r u s e d f o r n o r m a l i z a t i o n

    ( s o t h a t t h e t o t a l r a n k o f a l l w e b p a g e s i s c o n s t a n t ) .

    W e b e g i n b y d e n i n g a s i m p l e r a n k i n g , R w h i c h i s a s l i g h t l y s i m p l i e d v e r s i o n o f P a g e R a n k :

    R ( u ) = c

    X

    v 2 B

    u

    R ( v )

    N

    v

    3

  • 8/8/2019 Page Rank Sub

    4/17

    100

    9

    53

    50

    50

    50

    3

    3

    3

    F i g u r e 2 : S i m p l i e d P a g e R a n k C a l c u l a t i o n

    T h i s f o r m a l i z e s t h e i n t u i t i o n i n t h e p r e v i o u s s e c t i o n . N o t e t h a t t h e r a n k o f a p a g e i s d i v i d e d

    a m o n g i t s f o r w a r d l i n k s e v e n l y t o c o n t r i b u t e t o t h e r a n k s o f t h e p a g e s t h e y p o i n t t o . N o t e t h a t

    c

  • 8/8/2019 Page Rank Sub

    5/17

    A

    0.4B

    0.2

    C

    0.4

    0.2

    0.2 0.2

    0.4

    F i g u r e 3 : S i m p l i e d P a g e R a n k C a l c u l a t i o n

    F i g u r e 4 : L o o p W h i c h A c t s a s a R a n k S i n k

    w h e r e E ( u ) i s s o m e v e c t o r o v e r t h e w e b p a g e s t h a t c o r r e s p o n d s t o a s o u r c e o f r a n k ( s e e S e c -

    t i o n 6 ) . N o t e t h a t i f E i s a l l p o s i t i v e , c m u s t b e r e d u c e d t o b a l a n c e t h e e q u a t i o n . T h e r e f o r e , t h i s

    t e c h n i q u e c o r r e s p o n d s t o a d e c a y f a c t o r . I n m a t r i x n o t a t i o n w e h a v e R

    0

    = c ( A R

    0

    + E ) . S i n c e

    j j R

    0

    j j

    1

    = 1 , w e c a n r e w r i t e t h i s a s R

    0

    = c ( A + E 1 ) R

    0

    w h e r e 1 i s t h e v e c t o r c o n s i s t i n g o f a l l o n e s .

    S o , R

    0

    i s a n e i g e n v e c t o r o f ( A + E 1 ) .

    2 . 5 R a n d o m S u r f e r M o d e l

    T h e d e n i t i o n o f P a g e R a n k a b o v e h a s a n o t h e r i n t u i t i v e b a s i s i n r a n d o m w a l k s o n g r a p h s . T h e

    s i m p l i e d v e r s i o n c o r r e s p o n d s t o t h e s t a n d i n g p r o b a b i l i t y d i s t r i b u t i o n o f a r a n d o m w a l k o n t h e

    g r a p h o f t h e W e b . I n t u i t i v e l y , t h i s c a n b e t h o u g h t o f a s m o d e l i n g t h e b e h a v i o r o f a \ r a n d o m

    s u r f e r " . T h e \ r a n d o m s u r f e r " s i m p l y k e e p s c l i c k i n g o n s u c c e s s i v e l i n k s a t r a n d o m . H o w e v e r , i f a

    r e a l W e b s u r f e r e v e r g e t s i n t o a s m a l l l o o p o f w e b p a g e s , i t i s u n l i k e l y t h a t t h e s u r f e r w i l l c o n t i n u e

    i n t h e l o o p f o r e v e r . I n s t e a d , t h e s u r f e r w i l l j u m p t o s o m e o t h e r p a g e . T h e a d d i t i o n a l f a c t o r E c a n

    b e v i e w e d a s a w a y o f m o d e l i n g t h i s b e h a v i o r : t h e s u r f e r p e r i o d i c a l l y \ g e t s b o r e d " a n d j u m p s t o a

    5

  • 8/8/2019 Page Rank Sub

    6/17

    r a n d o m p a g e c h o s e n b a s e d o n t h e d i s t r i b u t i o n i n E .

    S o f a r w e h a v e l e f t E a s a u s e r d e n e d p a r a m e t e r . I n m o s t t e s t s w e l e t E b e u n i f o r m o v e r a l l

    w e b p a g e s w i t h v a l u e . H o w e v e r , i n S e c t i o n 6 w e s h o w h o w d i e r e n t v a l u e s o f E c a n g e n e r a t e

    \ c u s t o m i z e d " p a g e r a n k s .

    2 . 6 C o m p u t i n g P a g e R a n k

    T h e c o m p u t a t i o n o f P a g e R a n k i s f a i r l y s t r a i g h t f o r w a r d i f w e i g n o r e t h e i s s u e s o f s c a l e . L e t S b e

    a l m o s t a n y v e c t o r o v e r W e b p a g e s ( f o r e x a m p l e E ) . T h e n P a g e R a n k m a y b e c o m p u t e d a s f o l l o w s :

    R

    0

    S

    l o o p :

    R

    i + 1

    A R

    i

    d j j R

    i

    j j

    1

    ; j j R

    i + 1

    j j

    1

    R

    i + 1

    R

    i + 1

    + d E

    j j R

    i + 1

    ; R

    i

    j j

    1

    w h i l e >

    N o t e t h a t t h e d f a c t o r i n c r e a s e s t h e r a t e o f c o n v e r g e n c e a n d m a i n t a i n s j j R j j

    1

    . A n a l t e r n a t i v e

    n o r m a l i z a t i o n i s t o m u l t i p l y R b y t h e a p p r o p r i a t e f a c t o r . T h e u s e o f d m a y h a v e a s m a l l i m p a c t

    o n t h e i n u e n c e o f E .

    2 . 7 D a n g l i n g L i n k s

    O n e i s s u e w i t h t h i s m o d e l i s d a n g l i n g l i n k s . D a n g l i n g l i n k s a r e s i m p l y l i n k s t h a t p o i n t t o a n y p a g e

    w i t h n o o u t g o i n g l i n k s . T h e y a e c t t h e m o d e l b e c a u s e i t i s n o t c l e a r w h e r e t h e i r w e i g h t s h o u l d

    b e d i s t r i b u t e d , a n d t h e r e a r e a l a r g e n u m b e r o f t h e m . O f t e n t h e s e d a n g l i n g l i n k s a r e s i m p l y p a g e s

    t h a t w e h a v e n o t d o w n l o a d e d y e t , s i n c e i t i s h a r d t o s a m p l e t h e e n t i r e w e b ( i n o u r 2 4 m i l l i o n p a g e s

    c u r r e n t l y d o w n l o a d e d , w e h a v e 5 1 m i l l i o n U R L s n o t d o w n l o a d e d y e t , a n d h e n c e d a n g l i n g ) . B e c a u s e

    d a n g l i n g l i n k s d o n o t a e c t t h e r a n k i n g o f a n y o t h e r p a g e d i r e c t l y , w e s i m p l y r e m o v e t h e m f r o m

    t h e s y s t e m u n t i l a l l t h e P a g e R a n k s a r e c a l c u l a t e d . A f t e r a l l t h e P a g e R a n k s a r e c a l c u l a t e d , t h e y

    c a n b e a d d e d b a c k i n , w i t h o u t a e c t i n g t h i n g s s i g n i c a n t l y . N o t i c e t h e n o r m a l i z a t i o n o f t h e o t h e r

    l i n k s o n t h e s a m e p a g e a s a l i n k w h i c h w a s r e m o v e d w i l l c h a n g e s l i g h t l y , b u t t h i s s h o u l d n o t h a v e

    a l a r g e e e c t .

    3 I m p l e m e n t a t i o n

    A s p a r t o f t h e S t a n f o r d W e b B a s e p r o j e c t P B 9 8 ] , w e h a v e b u i l t a c o m p l e t e c r a w l i n g a n d i n d e x i n g

    s y s t e m w i t h a c u r r e n t r e p o s i t o r y o f 2 4 m i l l i o n w e b p a g e s . A n y w e b c r a w l e r n e e d s t o k e e p a d a t a b a s e

    o f U R L s s o i t c a n d i s c o v e r a l l t h e U R L s o n t h e w e b . T o i m p l e m e n t P a g e R a n k , t h e w e b c r a w l e r

    s i m p l y n e e d s t o b u i l d a n i n d e x o f l i n k s a s i t c r a w l s . W h i l e a s i m p l e t a s k , i t i s n o n - t r i v i a l b e c a u s e

    o f t h e h u g e v o l u m e s i n v o l v e d . F o r e x a m p l e , t o i n d e x o u r c u r r e n t 2 4 m i l l i o n p a g e d a t a b a s e i n a b o u t

    v e d a y s , w e n e e d t o p r o c e s s a b o u t 5 0 w e b p a g e s p e r s e c o n d . S i n c e t h e r e a b o u t a b o u t 1 1 l i n k s o n

    a n a v e r a g e p a g e ( d e p e n d i n g o n w h a t y o u c o u n t a s a l i n k ) w e n e e d t o p r o c e s s 5 5 0 l i n k s p e r s e c o n d .

    A l s o , o u r d a t a b a s e o f 2 4 m i l l i o n p a g e s r e f e r e n c e s o v e r 7 5 m i l l i o n u n i q u e U R L s w h i c h e a c h l i n k m u s t

    b e c o m p a r e d a g a i n s t .

    6

  • 8/8/2019 Page Rank Sub

    7/17

    M u c h t i m e h a s b e e n s p e n t m a k i n g t h e s y s t e m r e s i l i e n t i n t h e f a c e o f m a n y d e e p l y a n d i n t r i c a t e l y

    a w e d w e b a r t i f a c t s . T h e r e e x i s t i n n i t e l y l a r g e s i t e s , p a g e s , a n d e v e n U R L s . A l a r g e f r a c t i o n o f

    w e b p a g e s h a v e i n c o r r e c t H T M L , m a k i n g p a r s e r d e s i g n d i c u l t . M e s s y h e u r i s t i c s a r e u s e d t o h e l p

    t h e c r a w l i n g p r o c e s s . F o r e x a m p l e , w e d o n o t c r a w l U R L s w i t h / c g i - b i n / i n t h e m . O f c o u r s e i t

    i s i m p o s s i b l e t o g e t a c o r r e c t s a m p l e o f t h e " e n t i r e w e b " s i n c e i t i s a l w a y s c h a n g i n g . S i t e s a r e

    s o m e t i m e s d o w n , a n d s o m e p e o p l e d e c i d e t o n o t a l l o w t h e i r s i t e s t o b e i n d e x e d . D e s p i t e a l l t h i s , w e

    b e l i e v e w e h a v e a r e a s o n a b l e r e p r e s e n t a t i o n o f t h e a c t u a l l i n k s t r u c t u r e o f p u b l i c l y a c c e s s i b l e w e b .

    3 . 1 P a g e R a n k I m p l e m e n t a t i o n

    W e c o n v e r t e a c h U R L i n t o a u n i q u e i n t e g e r , a n d s t o r e e a c h h y p e r l i n k i n a d a t a b a s e u s i n g t h e i n t e g e r

    I D s t o i d e n t i f y p a g e s . D e t a i l s o f o u r i m p l e m e n t a t i o n a r e i n P B 9 8 ] . I n g e n e r a l , w e h a v e i m p l e m e n t e d

    P a g e R a n k i n t h e f o l l o w i n g m a n n e r . F i r s t w e s o r t t h e l i n k s t r u c t u r e b y P a r e n t I D . T h e n d a n g l i n g

    l i n k s a r e r e m o v e d f r o m t h e l i n k d a t a b a s e f o r r e a s o n s d i s c u s s e d a b o v e ( a f e w i t e r a t i o n s r e m o v e s t h e

    v a s t m a j o r i t y o f t h e d a n g l i n g l i n k s ) . W e n e e d t o m a k e a n i n i t i a l a s s i g n m e n t o f t h e r a n k s . T h i s

    a s s i g n m e n t c a n b e m a d e b y o n e o f s e v e r a l s t r a t e g i e s . I f i t i s g o i n g t o i t e r a t e u n t i l c o n v e r g e n c e , i n

    g e n e r a l t h e i n i t i a l v a l u e s w i l l n o t a e c t n a l v a l u e s , j u s t t h e r a t e o f c o n v e r g e n c e . B u t w e c a n s p e e d

    u p c o n v e r g e n c e b y c h o o s i n g a g o o d i n i t i a l a s s i g n m e n t . W e b e l i e v e t h a t c a r e f u l c h o i c e o f t h e i n i t i a l

    a s s i g n m e n t a n d a s m a l l n i t e n u m b e r o f i t e r a t i o n s m a y r e s u l t i n e x c e l l e n t o r i m p r o v e d p e r f o r m a n c e .

    M e m o r y i s a l l o c a t e d f o r t h e w e i g h t s f o r e v e r y p a g e . S i n c e w e u s e s i n g l e p r e c i s i o n o a t i n g p o i n t

    v a l u e s a t 4 b y t e s e a c h , t h i s a m o u n t s t o 3 0 0 m e g a b y t e s f o r o u r 7 5 m i l l i o n U R L s . I f i n s u c i e n t

    R A M i s a v a i l a b l e t o h o l d a l l t h e w e i g h t s , m u l t i p l e p a s s e s c a n b e m a d e ( o u r i m p l e m e n t a t i o n u s e s

    h a l f a s m u c h m e m o r y a n d t w o p a s s e s ) . T h e w e i g h t s f r o m t h e c u r r e n t t i m e s t e p a r e k e p t i n m e m o r y ,

    a n d t h e p r e v i o u s w e i g h t s a r e a c c e s s e d l i n e a r l y o n d i s k . A l s o , a l l t h e a c c e s s t o t h e l i n k d a t a b a s e ,

    A , i s l i n e a r b e c a u s e i t i s s o r t e d . T h e r e f o r e , A c a n b e k e p t o n d i s k a s w e l l . A l t h o u g h t h e s e d a t a

    s t r u c t u r e s a r e v e r y l a r g e , l i n e a r d i s k a c c e s s a l l o w s e a c h i t e r a t i o n t o b e c o m p l e t e d i n a b o u t 6 m i n u t e s

    o n a t y p i c a l w o r k s t a t i o n . A f t e r t h e w e i g h t s h a v e c o n v e r g e d , w e a d d t h e d a n g l i n g l i n k s b a c k i n a n d

    r e c o m p u t e t h e r a n k i n g s . N o t e a f t e r a d d i n g t h e d a n g l i n g l i n k s b a c k i n , w e n e e d t o i t e r a t e a s m a n y

    t i m e s a s w a s r e q u i r e d t o r e m o v e t h e d a n g l i n g l i n k s . O t h e r w i s e , s o m e o f t h e d a n g l i n g l i n k s w i l l h a v e

    a z e r o w e i g h t . T h i s w h o l e p r o c e s s t a k e s a b o u t v e h o u r s i n t h e c u r r e n t i m p l e m e n t a t i o n . W i t h l e s s

    s t r i c t c o n v e r g e n c e c r i t e r i a , a n d m o r e o p t i m i z a t i o n , t h e c a l c u l a t i o n c o u l d b e m u c h f a s t e r . O r , m o r e

    e c i e n t t e c h n i q u e s f o r e s t i m a t i n g e i g e n v e c t o r s c o u l d b e u s e d t o i m p r o v e p e r f o r m a n c e . H o w e v e r , i t

    s h o u l d b e n o t e d t h a t t h e c o s t r e q u i r e d t o c o m p u t e t h e P a g e R a n k i s i n s i g n i c a n t c o m p a r e d t o t h e

    c o s t r e q u i r e d t o b u i l d a f u l l t e x t i n d e x .

    4 C o n v e r g e n c e P r o p e r t i e s

    A s c a n b e s e e n f r o m t h e g r a p h i n F i g u r e 4 P a g e R a n k o n a l a r g e 3 2 2 m i l l i o n l i n k d a t a b a s e c o n v e r g e s

    t o a r e a s o n a b l e t o l e r a n c e i n r o u g h l y 5 2 i t e r a t i o n s . T h e c o n v e r g e n c e o n h a l f t h e d a t a t a k e s r o u g h l y

    4 5 i t e r a t i o n s . T h i s g r a p h s u g g e s t s t h a t P a g e R a n k w i l l s c a l e v e r y w e l l e v e n f o r e x t r e m e l y l a r g e

    c o l l e c t i o n s a s t h e s c a l i n g f a c t o r i s r o u g h l y l i n e a r i n l o g n .

    O n e o f t h e i n t e r e s t i n g r a m i c a t i o n s o f t h e f a c t t h a t t h e P a g e R a n k c a l c u l a t i o n c o n v e r g e s r a p i d l y

    i s t h a t t h e w e b i s a n e x p a n d e r - l i k e g r a p h . T o u n d e r s t a n d t h i s b e t t e r , w e g i v e a b r i e f o v e r v i e w o f

    t h e t h e o r y o f r a n d o m w a l k s o n g r a p h s r e f e r t o M o t w a n i - R a g h a v a n M R 9 5 ] f o r f u r t h e r d e t a i l s . A

    r a n d o m w a l k o n a g r a p h i s a s t o c h a s t i c p r o c e s s w h e r e a t a n y g i v e n t i m e s t e p w e a r e a t a p a r t i c u l a r

    n o d e o f t h e g r a p h a n d c h o o s e a n o u t e d g e u n i f o r m l y a t r a n d o m t o d e t e r m i n e t h e n o d e t o v i s i t a t

    t h e n e x t t i m e s t e p . A g r a p h i s s a i d t o b e a n e x p a n d e r i f i t i s t h e c a s e t h a t e v e r y ( n o t t o o l a r g e )

    s u b s e t o f n o d e s S h a s a n e i g h b o r h o o d ( s e t o f v e r t i c e s a c c e s s i b l e v i a o u t e d g e s e m a n a t i n g f r o m n o d e s

    7

  • 8/8/2019 Page Rank Sub

    8/17

    i n S ) t h a t i s l a r g e r t h a n s o m e f a c t o r t i m e s j S j h e r e , i s c a l l e d t h e e x p a n s i o n f a c t o r . I t i s t h e

    c a s e t h a t a g r a p h h a s a g o o d e x p a n s i o n f a c t o r i f a n d o n l y i f t h e l a r g e s t e i g e n v a l u e i s s u c i e n t l y

    l a r g e r t h a n t h e s e c o n d - l a r g e s t e i g e n v a l u e . A r a n d o m w a l k o n a g r a p h i s s a i d t o b e r a p i d l y - m i x i n g

    i f i t q u i c k l y ( t i m e l o g a r i t h m i c i n t h e s i z e o f t h e g r a p h ) c o n v e r g e s t o a l i m i t i n g d i s t r i b u t i o n o n t h e

    s e t o f n o d e s i n t h e g r a p h . I t i s a l s o t h e c a s e t h a t a r a n d o m w a l k i s r a p i d l y - m i x i n g o n a g r a p h i f

    a n d o n l y i f t h e g r a p h i s a n e x p a n d e r o r h a s a n e i g e n v a l u e s e p a r a t i o n .

    T o r e l a t e a l l t h i s t o t h e P a g e R a n k c o m p u t a t i o n , n o t e t h a t i t i s e s s e n t i a l l y t h e d e t e r m i n a t i o n o f

    t h e l i m i t i n g d i s t r i b u t i o n o f a r a n d o m w a l k o n t h e W e b g r a p h . T h e i m p o r t a n c e r a n k i n g o f a n o d e

    i s e s s e n t i a l l y t h e l i m i t i n g p r o b a b i l i t y t h a t t h e r a n d o m w a l k w i l l b e a t t h a t n o d e a f t e r a s u c i e n t l y

    l a r g e t i m e . T h e f a c t t h a t t h e P a g e R a n k c o m p u t a t i o n t e r m i n a t e s i n l o g a r i t h m i c t i m e i s e q u i v a l e n t t o

    s a y i n g t h a t t h e r a n d o m w a l k i s r a p i d l y m i x i n g o r t h a t t h e u n d e r l y i n g g r a p h h a s a g o o d e x p a n s i o n

    f a c t o r . E x p a n d e r g r a p h s h a v e m a n y d e s i r a b l e p r o p e r t i e s t h a t w e m a y b e a b l e t o e x p l o i t i n t h e

    f u t u r e i n c o m p u t a t i o n s i n v o l v i n g t h e W e b g r a p h .

    0 7.5 15 22.5 30 37.5 45 52.5

    Number of Iterations

    10

    100

    1000

    10000

    100000

    1000000

    10000000

    100000000

    ota

    erence

    rom

    revousteraton

    Convergence of PageRank Computation322 Million Links

    161 Million Links

    F i g u r e 5 : R a t e s o f C o n v e r g e n c e f o r F u l l S i z e a n d H a l f S i z e L i n k D a t a b a s e s

    5 S e a r c h i n g w i t h P a g e R a n k

    A m a j o r a p p l i c a t i o n o f P a g e R a n k i s s e a r c h i n g . W e h a v e i m p l e m e n t e d t w o s e a r c h e n g i n e s w h i c h u s e

    P a g e R a n k . T h e r s t o n e w e w i l l d i s c u s s i s a s i m p l e t i t l e - b a s e d s e a r c h e n g i n e . T h e s e c o n d s e a r c h

    e n g i n e i s a f u l l t e x t s e a r c h e n g i n e c a l l e d G o o g l e B P ] . G o o g l e u t i l i z e s a n u m b e r o f f a c t o r s t o r a n k

    s e a r c h r e s u l t s i n c l u d i n g s t a n d a r d I R m e a s u r e s , p r o x i m i t y , a n c h o r t e x t ( t e x t o f l i n k s p o i n t i n g t o w e b

    p a g e s ) , a n d P a g e R a n k . W h i l e a c o m p r e h e n s i v e u s e r s t u d y o f t h e b e n e t s o f P a g e R a n k i s b e y o n d

    t h e s c o p e o f t h i s p a p e r , w e h a v e p e r f o r m e d s o m e c o m p a r a t i v e e x p e r i m e n t s a n d p r o v i d e s o m e s a m p l e

    r e s u l t s i n t h i s p a p e r .

    8

  • 8/8/2019 Page Rank Sub

    9/17

    T h e b e n e t s o f P a g e R a n k a r e t h e g r e a t e s t f o r u n d e r s p e c i e d q u e r i e s . F o r e x a m p l e , a q u e r y

    f o r \ S t a n f o r d U n i v e r s i t y " m a y r e t u r n a n y n u m b e r o f w e b p a g e s w h i c h m e n t i o n S t a n f o r d ( s u c h a s

    p u b l i c a t i o n l i s t s ) o n a c o n v e n t i o n a l s e a r c h e n g i n e , b u t u s i n g P a g e R a n k , t h e u n i v e r s i t y h o m e p a g e

    i s l i s t e d r s t .

    5 . 1 T i t l e S e a r c h

    T o t e s t t h e u s e f u l n e s s o f P a g e R a n k f o r s e a r c h w e i m p l e m e n t e d a s e a r c h e n g i n e t h a t u s e d o n l y t h e

    t i t l e s o f 1 6 m i l l i o n w e b p a g e s . T o a n s w e r a q u e r y , t h e s e a r c h e n g i n e n d s a l l t h e w e b p a g e s w h o s e

    t i t l e s c o n t a i n a l l o f t h e q u e r y w o r d s . T h e n i t s o r t s t h e r e s u l t s b y P a g e R a n k . T h i s s e a r c h e n g i n e

    i s v e r y s i m p l e a n d c h e a p t o i m p l e m e n t . I n i n f o r m a l t e s t s , i t w o r k e d r e m a r k a b l y w e l l . A s c a n b e

    s e e n i n F i g u r e 6 , a s e a r c h f o r \ U n i v e r s i t y " y i e l d s a l i s t o f t o p u n i v e r s i t i e s . T h i s g u r e s h o w s o u r

    M u l t i Q u e r y s y s t e m w h i c h a l l o w s a u s e r t o q u e r y t w o s e a r c h e n g i n e s a t t h e s a m e t i m e . T h e s e a r c h

    e n g i n e o n t h e l e f t i s o u r P a g e R a n k b a s e d t i t l e s e a r c h e n g i n e . T h e b a r g r a p h s a n d p e r c e n t a g e s s h o w n

    a r e a l o g o f t h e a c t u a l P a g e R a n k w i t h t h e t o p p a g e n o r m a l i z e d t o 1 0 0 % , n o t a p e r c e n t i l e w h i c h i s

    u s e d e v e r y w h e r e e l s e i n t h i s p a p e r . T h e s e a r c h e n g i n e o n t h e r i g h t i s A l t a v i s t a . Y o u c a n s e e t h a t

    A l t a v i s t a r e t u r n s r a n d o m l o o k i n g w e b p a g e s t h a t m a t c h t h e q u e r y \ U n i v e r s i t y " a n d a r e t h e r o o t

    p a g e o f t h e s e r v e r ( A l t a v i s t a s e e m s t o b e u s i n g U R L l e n g t h a s a q u a l i t y h e u r i s t i c ) .

    F i g u r e 6 : C o m p a r i s o n o f Q u e r y f o r \ U n i v e r s i t y "

    9

  • 8/8/2019 Page Rank Sub

    10/17

    W e b P a g e P a g e R a n k ( a v e r a g e i s 1 . 0 )

    D o w n l o a d N e t s c a p e S o f t w a r e 1 1 5 8 9 . 0 0

    h t t p : / / w w w . w 3 . o r g / 1 0 7 1 7 . 7 0

    W e l c o m e t o N e t s c a p e 8 6 7 3 . 5 1

    P o i n t : I t ' s W h a t Y o u ' r e S e a r c h i n g F o r 7 9 3 0 . 9 2

    W e b - C o u n t e r H o m e P a g e 7 2 5 4 . 9 7

    T h e B l u e R i b b o n C a m p a i g n f o r O n l i n e F r e e S p e e c h 7 0 1 0 . 3 9

    C E R N W e l c o m e 6 5 6 2 . 4 9

    Y a h o o ! 6 5 6 1 . 8 0

    W e l c o m e t o N e t s c a p e 6 2 0 3 . 4 7

    W u s a g e 4 . 1 : A U s a g e S t a t i s t i c s S y s t e m F o r W e b S e r v e r s 5 9 6 3 . 2 7

    T h e W o r l d W i d e W e b C o n s o r t i u m ( W 3 C ) 5 6 7 2 . 2 1

    L y c o s , I n c . H o m e P a g e 4 6 8 3 . 3 1

    S t a r t i n g P o i n t 4 5 0 1 . 9 8

    W e l c o m e t o M a g e l l a n ! 3 8 6 6 . 8 2

    O r a c l e C o r p o r a t i o n 3 5 8 7 . 6 3

    T a b l e 1 : T o p 1 5 P a g e R a n k s : J u l y 1 9 9 6

    5 . 2 R a n k M e r g i n g

    T h e r e a s o n t h a t t h e t i t l e b a s e d P a g e R a n k s y s t e m w o r k s s o w e l l i s t h a t t h e t i t l e m a t c h e n s u r e s

    h i g h p r e c i s i o n , a n d t h e P a g e R a n k e n s u r e s h i g h q u a l i t y . W h e n m a t c h i n g a q u e r y l i k e \ U n i v e r s i t y "

    o n t h e w e b , r e c a l l i s n o t v e r y i m p o r t a n t b e c a u s e t h e r e i s f a r m o r e t h a n a u s e r c a n l o o k a t . F o r

    m o r e s p e c i c s e a r c h e s w h e r e r e c a l l i s m o r e i m p o r t a n t , t h e t r a d i t i o n a l i n f o r m a t i o n r e t r i e v a l s c o r e s

    o v e r f u l l - t e x t a n d t h e P a g e R a n k s h o u l d b e c o m b i n e d . O u r G o o g l e s y s t e m d o e s t h i s t y p e o f r a n k

    m e r g i n g . R a n k m e r g i n g i s k n o w n t o b e a v e r y d i c u l t p r o b l e m , a n d w e n e e d t o s p e n d c o n s i d e r a b l e

    a d d i t i o n a l e o r t b e f o r e w e w i l l b e a b l e t o d o a r e a s o n a b l e e v a l u a t i o n o f t h e s e t y p e s o f q u e r i e s .

    H o w e v e r , w e d o b e l i e v e t h a t u s i n g P a g e R a n k a s a f a c t o r i n t h e s e q u e r i e s i s q u i t e b e n e c i a l .

    5 . 3 S o m e S a m p l e R e s u l t s

    W e h a v e e x p e r i m e n t e d c o n s i d e r a b l y w i t h G o o g l e , a f u l l - t e x t s e a r c h e n g i n e w h i c h u s e s P a g e R a n k .

    W h i l e a f u l l - s c a l e u s e r s t u d y i s b e y o n d t h e s c o p e o f t h i s p a p e r , w e p r o v i d e a s a m p l e q u e r y i n

    A p p e n d i x A . F o r m o r e q u e r i e s , w e e n c o u r a g e t h e r e a d e r t o t e s t G o o g l e t h e m s e l v e s B P ] .

    T a b l e 1 s h o w s t h e t o p 1 5 p a g e s b a s e d o n P a g e R a n k . T h i s p a r t i c u l a r l i s t i n g w a s g e n e r a t e d i n

    J u l y 1 9 9 6 . I n a m o r e r e c e n t c a l c u l a t i o n o f P a g e R a n k , M i c r o s o f t h a s j u s t e d g e d o u t N e t s c a p e f o r

    t h e h i g h e s t P a g e R a n k .

    5 . 4 C o m m o n C a s e

    O n e o f t h e d e s i g n g o a l s o f P a g e R a n k w a s t o h a n d l e t h e c o m m o n c a s e f o r q u e r i e s w e l l . F o r e x a m p l e ,

    a u s e r s e a r c h e d f o r \ w o l v e r i n e " , r e m e m b e r i n g t h a t t h e U n i v e r s i t y o f M i c h i g a n s y s t e m u s e d f o r a l l

    a d m i n i s t r a t i v e f u n c t i o n s b y s t u d e n t s w a s c a l l e d s o m e t h i n g w i t h a w o l v e r i n e i n i t . O u r P a g e R a n k

    b a s e d t i t l e s e a r c h s y s t e m r e t u r n e d t h e a n s w e r \ W o l v e r i n e A c c e s s " a s t h e r s t r e s u l t . T h i s i s s e n s i b l e

    s i n c e a l l t h e s t u d e n t s r e g u l a r l y u s e t h e W o l v e r i n e A c c e s s s y s t e m , a n d a r a n d o m u s e r i s q u i t e l i k e l y

    t o b e l o o k i n g f o r i t g i v e n t h e q u e r y \ w o l v e r i n e " . T h e f a c t t h a t t h e W o l v e r i n e A c c e s s s i t e i s a g o o d

    c o m m o n c a s e i s n o t c o n t a i n e d i n t h e H T M L o f t h e p a g e . E v e n i f t h e r e w e r e a w a y o f d e n i n g g o o d

    1 0

  • 8/8/2019 Page Rank Sub

    11/17

    m e t a - i n f o r m a t i o n o f t h i s f o r m w i t h i n a p a g e , i t w o u l d b e p r o b l e m a t i c s i n c e a p a g e a u t h o r c o u l d

    n o t b e t r u s t e d w i t h t h i s k i n d o f e v a l u a t i o n . M a n y w e b p a g e a u t h o r s w o u l d s i m p l y c l a i m t h a t t h e i r

    p a g e s w e r e a l l t h e b e s t a n d m o s t u s e d o n t h e w e b .

    I t i s i m p o r t a n t t o n o t e t h a t t h e g o a l o f n d i n g a s i t e t h a t c o n t a i n s a g r e a t d e a l o f i n f o r m a t i o n

    a b o u t w o l v e r i n e s i s a v e r y d i e r e n t t a s k t h a n n d i n g t h e c o m m o n c a s e w o l v e r i n e s i t e . T h e r e i s a n

    i n t e r e s t i n g s y s t e m M a r 9 7 ] t h a t a t t e m p t s t o n d s i t e s t h a t d i s c u s s a t o p i c i n d e t a i l b y p r o p a g a t i n g

    t h e t e x t u a l m a t c h i n g s c o r e t h r o u g h t h e l i n k s t r u c t u r e o f t h e w e b . I t t h e n t r i e s t o r e t u r n t h e p a g e

    o n t h e m o s t c e n t r a l p a t h . T h i s r e s u l t s i n g o o d r e s u l t s f o r q u e r i e s l i k e \ o w e r " t h e s y s t e m w i l l

    r e t u r n g o o d n a v i g a t i o n p a g e s f r o m s i t e s t h a t d e a l w i t h t h e t o p i c o f o w e r s i n d e t a i l . C o n t r a s t t h a t

    w i t h t h e c o m m o n c a s e a p p r o a c h w h i c h m i g h t s i m p l y r e t u r n a c o m m o n l y u s e d c o m m e r c i a l s i t e t h a t

    h a d l i t t l e i n f o r m a t i o n e x c e p t h o w t o b u y o w e r s . I t i s o u r o p i n i o n t h a t b o t h o f t h e s e t a s k s a r e

    i m p o r t a n t , a n d a g e n e r a l p u r p o s e w e b s e a r c h e n g i n e s h o u l d r e t u r n r e s u l t s w h i c h f u l l l t h e n e e d s

    o f b o t h o f t h e s e t a s k s a u t o m a t i c a l l y . I n t h i s p a p e r , w e a r e c o n c e n t r a t i n g o n l y o n t h e c o m m o n c a s e

    a p p r o a c h .

    5 . 5 S u b c o m p o n e n t s o f C o m m o n C a s e

    I t i s i n s t r u c t i v e t o c o n s i d e r w h a t k i n d o f c o m m o n c a s e s c e n a r i o s P a g e R a n k c a n h e l p r e p r e s e n t .

    B e s i d e s a p a g e w h i c h h a s a h i g h u s a g e , l i k e t h e W o l v e r i n e A c c e s s c i t e , P a g e R a n k c a n a l s o r e p r e s e n t

    a c o l l a b o r a t i v e n o t i o n o f a u t h o r i t y o r t r u s t . F o r e x a m p l e , a u s e r m i g h t p r e f e r a n e w s s t o r y s i m p l y

    b e c a u s e i t i s l i n k e d i s l i n k e d d i r e c t l y f r o m t h e N e w Y o r k T i m e s h o m e p a g e . O f c o u r s e s u c h a s t o r y

    w i l l r e c e i v e q u i t e a h i g h P a g e R a n k s i m p l y b e c a u s e i t i s m e n t i o n e d b y a v e r y i m p o r t a n t p a g e . T h i s

    s e e m s t o c a p t u r e a k i n d o f c o l l a b o r a t i v e t r u s t , s i n c e i f a p a g e w a s m e n t i o n e d b y a t r u s t w o r t h y

    o r a u t h o r i t a t i v e s o u r c e , i t i s m o r e l i k e l y t o b e t r u s t w o r t h y o r a u t h o r i t a t i v e . S i m i l a r l y , q u a l i t y o r

    i m p o r t a n c e s e e m s t o t w i t h i n t h i s k i n d o f c i r c u l a r d e n i t i o n .

    6 P e r s o n a l i z e d P a g e R a n k

    A n i m p o r t a n t c o m p o n e n t o f t h e P a g e R a n k c a l c u l a t i o n i s E { a v e c t o r o v e r t h e W e b p a g e s w h i c h

    i s u s e d a s a s o u r c e o f r a n k t o m a k e u p f o r t h e r a n k s i n k s s u c h a s c y c l e s w i t h n o o u t e d g e s ( s e e

    S e c t i o n 2 . 4 ) . H o w e v e r , a s i d e f r o m s o l v i n g t h e p r o b l e m o f r a n k s i n k s , E t u r n s o u t t o b e a p o w e r f u l

    p a r a m e t e r t o a d j u s t t h e p a g e r a n k s . I n t u i t i v e l y t h e E v e c t o r c o r r e s p o n d s t o t h e d i s t r i b u t i o n o f w e b

    p a g e s t h a t a r a n d o m s u r f e r p e r i o d i c a l l y j u m p s t o . A s w e s e e b e l o w , i t c a n b e u s e d t o g i v e b r o a d

    g e n e r a l v i e w s o f t h e W e b o r v i e w s w h i c h a r e f o c u s s e d a n d p e r s o n a l i z e d t o a p a r t i c u l a r i n d i v i d u a l .

    W e h a v e p e r f o r m e d m o s t e x p e r i m e n t s w i t h a n E v e c t o r t h a t i s u n i f o r m o v e r a l l w e b p a g e s w i t h

    j j E j j

    1

    = 0 : 1 5 . T h i s c o r r e s p o n d s t o a r a n d o m s u r f e r p e r i o d i c a l l y j u m p i n g t o a r a n d o m w e b p a g e .

    T h i s i s a v e r y d e m o c r a t i c c h o i c e f o r E s i n c e a l l w e b p a g e s a r e v a l u e d s i m p l y b e c a u s e t h e y e x i s t .

    A l t h o u g h t h i s t e c h n i q u e h a s b e e n q u i t e s u c c e s s f u l , t h e r e i s a n i m p o r t a n t p r o b l e m w i t h i t . S o m e

    W e b p a g e s w i t h m a n y r e l a t e d l i n k s r e c e i v e a n o v e r l y h i g h r a n k i n g . E x a m p l e s o f t h e s e i n c l u d e

    c o p y r i g h t w a r n i n g s , d i s c l a i m e r s , a n d h i g h l y i n t e r l i n k e d m a i l i n g l i s t a r c h i v e s .

    A n o t h e r e x t r e m e i s t o h a v e E c o n s i s t e n t i r e l y o f a s i n g l e w e b p a g e . W e t e s t e d t w o s u c h E ' s {

    t h e N e t s c a p e h o m e p a g e , a n d t h e h o m e p a g e o f a f a m o u s c o m p u t e r s c i e n t i s t , J o h n M c C a r t h y . F o r

    t h e N e t s c a p e h o m e p a g e , w e a t t e m p t t o g e n e r a t e p a g e r a n k s f r o m t h e p e r s p e c t i v e o f a n o v i c e u s e r

    w h o h a s N e t s c a p e s e t a s t h e d e f a u l t h o m e p a g e . I n t h e c a s e o f J o h n M c C a r t h y ' s h o m e p a g e w e

    w a n t t o c a l c u l a t e p a g e r a n k s f r o m t h e p e r s p e c t i v e o f a n i n d i v i d u a l w h o h a s g i v e n u s c o n s i d e r a b l e

    c o n t e x t u a l i n f o r m a t i o n b a s e d o n t h e l i n k s o n h i s h o m e p a g e .

    I n b o t h c a s e s , t h e m a i l i n g l i s t p r o b l e m m e n t i o n e d a b o v e d i d n o t o c c u r . A n d , i n b o t h c a s e s , t h e

    r e s p e c t i v e h o m e p a g e g o t t h e h i g h e s t P a g e R a n k a n d w a s f o l l o w e d b y i t s i m m e d i a t e l i n k s . F r o m

    1 1

  • 8/8/2019 Page Rank Sub

    12/17

    W e b P a g e J o h n M c C a r t h y ' s V i e w N e t s c a p e ' s V i e w

    T i t l e P a g e R a n k P e r c e n t i l e P a g e R a n k P e r c e n t i l e

    J o h n M c C a r t h y ' s H o m e P a g e 1 0 0 . 0 0 % 9 9 . 2 3 %

    J o h n M i t c h e l l ( S t a n f o r d C S T h e o r y G r o u p ) 1 0 0 . 0 0 % 9 3 . 8 9 %

    V e n t u r e L a w ( L o c a l S t a r t u p L a w F i r m ) 9 9 . 9 4 % 9 9 . 8 2 %

    S t a n f o r d C S H o m e P a g e 1 0 0 . 0 0 % 9 9 . 8 3 %

    U n i v e r s i t y o f M i c h i g a n A I L a b 9 9 . 9 5 % 9 9 . 9 4 %

    U n i v e r s i t y o f T o r o n t o C S D e p a r t m e n t 9 9 . 9 9 % 9 9 . 0 9 %

    S t a n f o r d C S T h e o r y G r o u p 9 9 . 9 9 % 9 9 . 0 5 %

    L e a d e r s h a p e I n s t i t u t e 9 5 . 9 6 % 9 7 . 1 0 %

    T a b l e 2 : P a g e R a n k s f o r T w o D i e r e n t V i e w s : N e t s c a p e v s . J o h n M c C a r t h y

    t h a t p o i n t , t h e d i s p a r i t y d e c r e a s e d . I n T a b l e 2 , w e s h o w t h e r e s u l t i n g p a g e r a n k p e r c e n t i l e s f o r

    a n a s s o r t m e n t o f d i e r e n t p a g e s . P a g e s r e l a t e d t o c o m p u t e r s c i e n c e h a v e a h i g h e r M c C a r t h y - r a n k

    t h a n N e t s c a p e - r a n k a n d p a g e s r e l a t e d t o c o m p u t e r s c i e n c e a t S t a n f o r d h a v e a c o n s i d e r a b l y h i g h e r

    M c C a r t h y - r a n k . F o r e x a m p l e , t h e W e b p a g e o f a n o t h e r S t a n f o r d C o m p u t e r S c i e n c e D e p t . f a c u l t y

    m e m b e r i s m o r e t h a n s i x p e r c e n t i l e p o i n t s h i g h e r o n t h e M c C a r t h y - r a n k . N o t e t h a t t h e p a g e r a n k s

    a r e d i s p l a y e d a s p e r c e n t i l e s . T h i s h a s t h e e e c t o f c o m p r e s s i n g l a r g e d i e r e n c e s i n P a g e R a n k a t

    t h e t o p o f t h e r a n g e .

    S u c h p e r s o n a l i z e d p a g e r a n k s m a y h a v e a n u m b e r o f a p p l i c a t i o n s , i n c l u d i n g p e r s o n a l s e a r c h

    e n g i n e s . T h e s e s e a r c h e n g i n e s c o u l d s a v e u s e r s a g r e a t d e a l o f t r o u b l e b y e c i e n t l y g u e s s i n g a

    l a r g e p a r t o f t h e i r i n t e r e s t s g i v e n s i m p l e i n p u t s u c h a s t h e i r b o o k m a r k s o r h o m e p a g e . W e s h o w a n

    e x a m p l e o f t h i s i n A p p e n d i x A w i t h t h e \ M i t c h e l l " q u e r y . I n t h i s e x a m p l e , w e d e m o n s t r a t e t h a t

    w h i l e t h e r e a r e m a n y p e o p l e o n t h e w e b n a m e d M i t c h e l l , t h e n u m b e r o n e r e s u l t i s t h e h o m e p a g e

    o f a c o l l e a g u e o f J o h n M c C a r t h y n a m e d J o h n M i t c h e l l .

    6 . 1 M a n i p u l a t i o n b y C o m m e r c i a l I n t e r e s t s

    T h e s e t y p e s o f p e r s o n a l i z e d P a g e R a n k s a r e v i r t u a l l y i m m u n e t o m a n i p u l a t i o n b y c o m m e r c i a l i n -

    t e r e s t s . F o r a p a g e t o g e t a h i g h P a g e R a n k , i t m u s t c o n v i n c e a n i m p o r t a n t p a g e , o r a l o t o f

    n o n - i m p o r t a n t p a g e s t o l i n k t o i t . A t w o r s t , y o u c a n h a v e m a n i p u l a t i o n i n t h e f o r m o f b u y i n g

    a d v e r t i s e m e n t s ( l i n k s ) o n i m p o r t a n t s i t e s . B u t , t h i s s e e m s w e l l u n d e r c o n t r o l s i n c e i t c o s t s m o n e y .

    T h i s i m m u n i t y t o m a n i p u l a t i o n i s a n e x t r e m e l y i m p o r t a n t p r o p e r t y . T h i s k i n d o f c o m m e r c i a l m a -

    n i p u l a t i o n i s c a u s i n g s e a r c h e n g i n e s a g r e a t d e a l o f t r o u b l e , a n d m a k i n g f e a t u r e s t h a t w o u l d b e g r e a t

    t o h a v e v e r y d i c u l t t o i m p l e m e n t . F o r e x a m p l e f a s t u p d a t i n g o f d o c u m e n t s i s a v e r y d e s i r a b l e

    f e a t u r e , b u t i t i s a b u s e d b y p e o p l e w h o w a n t t o m a n i p u l a t e t h e r e s u l t s o f t h e s e a r c h e n g i n e .

    A c o m p r o m i s e b e t w e e n t h e t w o e x t r e m e s o f u n i f o r m E a n d s i n g l e p a g e E i s t o l e t E c o n s i s t o f

    a l l t h e r o o t l e v e l p a g e s o f a l l w e b s e r v e r s . N o t i c e t h i s w i l l a l l o w s o m e m a n i p u l a t i o n o f P a g e R a n k s .

    S o m e o n e w h o w i s h e d t o m a n i p u l a t e t h i s s y s t e m c o u l d s i m p l y c r e a t e a l a r g e n u m b e r o f r o o t l e v e l

    s e r v e r s a l l p o i n t i n g a t a p a r t i c u l a r s i t e .

    1 2

  • 8/8/2019 Page Rank Sub

    13/17

    7 A p p l i c a t i o n s

    7 . 1 E s t i m a t i n g W e b T r a c

    B e c a u s e P a g e R a n k r o u g h l y c o r r e s p o n d s t o a r a n d o m w e b s u r f e r ( s e e S e c t i o n 2 . 5 ) , i t i s i n t e r e s t i n g

    t o s e e h o w P a g e R a n k c o r r e s p o n d s t o a c t u a l u s a g e . W e u s e d t h e c o u n t s o f w e b p a g e a c c e s s e s f r o m

    N L A N R N L A ] p r o x y c a c h e a n d c o m p a r e d t h e s e t o P a g e R a n k . T h e N L A N R d a t a w a s f r o m s e v e r a l

    n a t i o n a l p r o x y c a c h e s o v e r t h e p e r i o d o f s e v e r a l m o n t h s a n d c o n s i s t e d o f 1 1 , 8 1 7 , 6 6 5 u n i q u e U R L s

    w i t h t h e h i g h e s t h i t c o u n t g o i n g t o A l t a v i s t a w i t h 6 3 8 , 6 5 7 h i t s . T h e r e w e r e 2 . 6 m i l l i o n p a g e s i n t h e

    i n t e r s e c t i o n o f t h e c a c h e d a t a a n d o u r 7 5 m i l l i o n U R L d a t a b a s e . I t i s e x t r e m e l y d i c u l t t o c o m p a r e

    t h e s e d a t a s e t s a n a l y t i c a l l y f o r a n u m b e r o f d i e r e n t r e a s o n s . M a n y o f t h e U R L s i n t h e c a c h e a c c e s s

    d a t a a r e p e o p l e r e a d i n g t h e i r p e r s o n a l m a i l o n f r e e e m a i l s e r v i c e s . D u p l i c a t e s e r v e r n a m e s a n d p a g e

    n a m e s a r e a s e r i o u s p r o b l e m . I n c o m p l e t e n e s s a n d b i a s a p r o b l e m i s b o t h t h e P a g e R a n k d a t a a n d

    t h e u s a g e d a t a . H o w e v e r , w e d i d s e e s o m e i n t e r e s t i n g t r e n d s i n t h e d a t a . T h e r e s e e m s t o b e a h i g h

    u s a g e o f p o r n o g r a p h i c s i t e s i n t h e c a c h e d a t a , b u t t h e s e s i t e s g e n e r a l l y h a d l o w P a g e R a n k s . W e

    b e l i e v e t h i s i s b e c a u s e p e o p l e d o n o t w a n t t o l i n k t o p o r n o g r a p h i c s i t e s f r o m t h e i r o w n w e b p a g e s .

    U s i n g t h i s t e c h n i q u e o f l o o k i n g f o r d i e r e n c e s b e t w e e n P a g e R a n k a n d u s a g e , i t m a y b e p o s s i b l e t o

    n d t h i n g s t h a t p e o p l e l i k e t o l o o k a t , b u t d o n o t w a n t t o m e n t i o n o n t h e i r w e b p a g e s . T h e r e a r e

    s o m e s i t e s t h a t h a v e a v e r y h i g h u s a g e , b u t l o w P a g e R a n k s u c h a s n e t s c a p e . y a h o o . c o m . W e b e l i e v e

    t h e r e i s p r o b a b l y a n i m p o r t a n t b a c k l i n k w h i c h s i m p l y i s o m i t t e d f r o m o u r d a t a b a s e ( w e o n l y h a v e

    a p a r t i a l l i n k s t r u c t u r e o f t h e w e b ) . I t m a y b e p o s s i b l e t o u s e u s a g e d a t a a s a s t a r t v e c t o r f o r

    P a g e R a n k , a n d t h e n i t e r a t e P a g e R a n k a f e w t i m e s . T h i s m i g h t a l l o w l l i n g i n h o l e s i n t h e u s a g e

    d a t a . I n a n y c a s e , t h e s e t y p e s o f c o m p a r i s o n s a r e a n i n t e r e s t i n g t o p i c f o r f u t u r e s t u d y .

    7 . 2 P a g e R a n k a s B a c k l i n k P r e d i c t o r

    O n e j u s t i c a t i o n f o r P a g e R a n k i s t h a t i t i s a p r e d i c t o r f o r b a c k l i n k s . I n C G M P 9 8 ] w e e x p l o r e t h e

    i s s u e o f h o w t o c r a w l t h e w e b e c i e n t l y , t r y i n g t o c r a w l b e t t e r d o c u m e n t s r s t . W e f o u n d o n t e s t s

    o f t h e S t a n f o r d w e b t h a t P a g e R a n k i s a b e t t e r p r e d i c t o r o f f u t u r e c i t a t i o n c o u n t s t h a n c i t a t i o n

    c o u n t s t h e m s e l v e s .

    T h e e x p e r i m e n t a s s u m e s t h a t t h e s y s t e m s t a r t s o u t w i t h o n l y a s i n g l e U R L a n d n o o t h e r

    i n f o r m a t i o n , a n d t h e g o a l i s t o t r y t o c r a w l t h e p a g e s i n a s c l o s e t o t h e o p t i m a l o r d e r a s p o s s i b l e .

    T h e o p t i m a l o r d e r i s t o c r a w l p a g e s i n e x a c t l y t h e o r d e r o f t h e i r r a n k a c c o r d i n g t o a n e v a l u a t i o n

    f u n c t i o n . F o r t h e p u r p o s e s h e r e , t h e e v a l u a t i o n f u n c t i o n i s s i m p l y t h e n u m b e r o f c i t a t i o n s , g i v e n

    c o m p l e t e i n f o r m a t i o n . T h e c a t c h i s t h a t a l l t h e i n f o r m a t i o n t o c a l c u l a t e t h e e v a l u a t i o n f u n c t i o n i s

    n o t a v a i l a b l e u n t i l a f t e r a l l t h e d o c u m e n t s h a v e b e e n c r a w l e d . I t t u r n s o u t u s i n g t h e i n c o m p l e t e

    d a t a , P a g e R a n k i s a m o r e e e c t i v e w a y t o o r d e r t h e c r a w l i n g t h a n t h e n u m b e r o f k n o w n c i t a t i o n s .

    I n o t h e r w o r d s , P a g e R a n k i s a b e t t e r p r e d i c t o r t h a n c i t a t i o n c o u n t i n g e v e n w h e n t h e m e a s u r e i s

    t h e n u m b e r o f c i t a t i o n s ! T h e e x p l a n a t i o n f o r t h i s s e e m s t o b e t h a t P a g e R a n k a v o i d s t h e l o c a l

    m a x i m a t h a t c i t a t i o n c o u n t i n g g e t s s t u c k i n . F o r e x a m p l e , c i t a t i o n c o u n t i n g t e n d s t o g e t s t u c k i n

    l o c a l c o l l e c t i o n s l i k e t h e S t a n f o r d C S w e b p a g e s , t a k i n g a l o n g t i m e t o b r a n c h o u t a n d n d h i g h l y

    c i t e d p a g e s i n o t h e r a r e a s . P a g e R a n k q u i c k l y n d s t h e S t a n f o r d h o m e p a g e i s i m p o r t a n t , a n d g i v e s

    p r e f e r e n c e t o i t s c h i l d r e n r e s u l t i n g i n a n e c i e n t , b r o a d s e a r c h .

    T h i s a b i l i t y o f P a g e R a n k t o p r e d i c t c i t a t i o n c o u n t s i s a p o w e r f u l j u s t i c a t i o n f o r u s i n g P a g e R -

    a n k . S i n c e i t i s v e r y d i c u l t t o m a p t h e c i t a t i o n s t r u c t u r e o f t h e w e b c o m p l e t e l y , P a g e R a n k m a y

    e v e n b e a b e t t e r c i t a t i o n c o u n t a p p r o x i m a t i o n t h a n c i t a t i o n c o u n t s t h e m s e l v e s .

    1 3

  • 8/8/2019 Page Rank Sub

    14/17

    F i g u r e 7 : P a g e R a n k P r o x y

    7 . 3 U s e r N a v i g a t i o n : T h e P a g e R a n k P r o x y

    W e h a v e d e v e l o p e d a w e b p r o x y a p p l i c a t i o n t h a t a n n o t a t e s e a c h l i n k t h a t a u s e r s e e s w i t h i t s

    P a g e R a n k . T h i s i s q u i t e u s e f u l , b e c a u s e u s e r s r e c e i v e s o m e i n f o r m a t i o n a b o u t t h e l i n k b e f o r e t h e y

    c l i c k o n i t . I n F i g u r e 7 i s a s c r e e n s h o t f r o m t h e p r o x y . T h e l e n g t h o f t h e r e d b a r s i s t h e l o g o f t h e

    U R L ' s P a g e R a n k . W e c a n s e e t h a t m a j o r o r g a n i z a t i o n s , l i k e S t a n f o r d U n i v e r s i t y , r e c e i v e a v e r y

    h i g h r a n k i n g f o l l o w e d b y r e s e a r c h g r o u p s , a n d t h e n p e o p l e , w i t h p r o f e s s o r s a t t h e h i g h e n d o f t h e

    p e o p l e s c a l e . A l s o n o t i c e A C M h a s a v e r y h i g h P a g e R a n k , b u t n o t a s h i g h a s S t a n f o r d U n i v e r s i t y .

    I n t e r e s t i n g l y , t h i s P a g e R a n k a n n o t a t e d v i e w o f t h e p a g e m a k e s a n i n c o r r e c t U R L f o r o n e o f t h e

    p r o f e s s o r s g l a r i n g l y o b v i o u s s i n c e t h e p r o f e s s o r h a s a e m b a r r a s s i n g l y l o w P a g e R a n k . C o n s e q u e n t l y

    t h i s t o o l s e e m s u s e f u l f o r a u t h o r i n g p a g e s a s w e l l a s n a v i g a t i o n . T h i s p r o x y i s v e r y h e l p f u l f o r

    l o o k i n g a t t h e r e s u l t s f r o m o t h e r s e a r c h e n g i n e s , a n d p a g e s w i t h l a r g e n u m b e r s o f l i n k s s u c h a s

    Y a h o o ' s l i s t i n g s . T h e p r o x y c a n h e l p u s e r s d e c i d e w h i c h l i n k s i n a l o n g l i s t i n g a r e m o r e l i k e l y t o

    b e i n t e r e s t i n g . O r , i f t h e u s e r h a s s o m e i d e a w h e r e t h e l i n k t h e y a r e l o o k i n g f o r s h o u l d f a l l i n t h e

    \ i m p o r t a n c e " s p e c t r u m , t h e y s h o u l d b e a b l e t o s c a n f o r i t m u c h m o r e q u i c k l y u s i n g t h e p r o x y .

    1 4

  • 8/8/2019 Page Rank Sub

    15/17

    7 . 4 O t h e r U s e s o f P a g e R a n k

    T h e o r i g i n a l g o a l o f P a g e R a n k w a s a w a y t o s o r t b a c k l i n k s s o i f t h e r e w e r e a l a r g e n u m b e r o f

    b a c k l i n k s f o r a d o c u m e n t , t h e \ b e s t " b a c k l i n k s c o u l d b e d i s p l a y e d r s t . W e h a v e i m p l e m e n t e d s u c h

    a s y s t e m . I t t u r n s o u t t h i s v i e w o f t h e b a c k l i n k s o r d e r e d b y P a g e R a n k c a n b e v e r y i n t e r e s t i n g w h e n

    t r y i n g t o u n d e r s t a n d y o u r c o m p e t i t i o n . F o r e x a m p l e , t h e p e o p l e w h o r u n a n e w s s i t e a l w a y s w a n t

    t o k e e p t r a c k o f a n y s i g n i c a n t b a c k l i n k s t h e c o m p e t i t i o n h a s m a n a g e d t o g e t . A l s o , P a g e R a n k c a n

    h e l p t h e u s e r d e c i d e i f a s i t e i s t r u s t w o r t h y o r n o t . F o r e x a m p l e , a u s e r m i g h t b e i n c l i n e d t o t r u s t

    i n f o r m a t i o n t h a t i s d i r e c t l y c i t e d f r o m t h e S t a n f o r d h o m e p a g e .

    8 C o n c l u s i o n

    I n t h i s p a p e r , w e h a v e t a k e n o n t h e a u d a c i o u s t a s k o f c o n d e n s i n g e v e r y p a g e o n t h e W o r l d W i d e

    W e b i n t o a s i n g l e n u m b e r , i t s P a g e R a n k . P a g e R a n k i s a g l o b a l r a n k i n g o f a l l w e b p a g e s , r e g a r d l e s s

    o f t h e i r c o n t e n t , b a s e d s o l e l y o n t h e i r l o c a t i o n i n t h e W e b ' s g r a p h s t r u c t u r e .

    U s i n g P a g e R a n k , w e a r e a b l e t o o r d e r s e a r c h r e s u l t s s o t h a t m o r e i m p o r t a n t a n d c e n t r a l W e b

    p a g e s a r e g i v e n p r e f e r e n c e . I n e x p e r i m e n t s , t h i s t u r n s o u t t o p r o v i d e h i g h e r q u a l i t y s e a r c h r e s u l t s t o

    u s e r s . T h i n t u i t i o n b e h i n d P a g e R a n k i s t h a t i t u s e s i n f o r m a t i o n w h i c h i s e x e r n a l t o t h e W e b p a g e s

    t h e m s e l v e s - t h e i r b a c k l i n k s , w h i c h p r o v i d e a k i n d o f p e e r r e v i e w . F u r t h e r m o r e , b a c k l i n k s f r o m

    \ i m p o r t a n t " p a g e s a r e m o r e s i g n i c a n t t h a n b a c k l i n k s f r o m a v e r a g e p a g e s . T h i s i s e n c o m p a s s e d i n

    t h e r e c u r s i v e d e n i t i o n o f P a g e R a n k ( S e c t i o n 2 . 4 ) .

    P a g e R a n k c o u l d b e u s e d t o s e p a r a t e o u t a s m a l l s e t o f c o m m o n l y u s e d d o c u m e n t s w h i c h c a n

    a n s w e r m o s t q u e r i e s . T h e f u l l d a t a b a s e o n l y n e e d s t o b e c o n s u l t e d w h e n t h e s m a l l d a t a b a s e i s n o t

    a d e q u a t e t o a n s w e r a q u e r y . F i n a l l y , P a g e R a n k m a y b e a g o o d w a y t o h e l p n d r e p r e s e n t a t i v e

    p a g e s t o d i s p l a y f o r a c l u s t e r c e n t e r .

    W e h a v e f o u n d a n u m b e r o f a p p l i c a t i o n s f o r P a g e R a n k i n a d d i t i o n t o s e a r c h w h i c h i n c l u d e t r a c

    e s t i m a t i o n , a n d u s e r n a v i g a t i o n . A l s o , w e c a n g e n e r a t e p e r s o n a l i z e d P a g e R a n k s w h i c h c a n c r e a t e

    a v i e w o f W e b f r o m a p a r t i c u l a r p e r s p e c t i v e .

    O v e r a l l , o u r e x p e r i m e n t s w i t h P a g e R a n k s u g g e s t t h a t t h e s t r u c t u r e o f t h e W e b g r a p h i s v e r y

    u s e f u l f o r a v a r i e t y o f i n f o r m a t i o n r e t r i e v a l t a s k s .

    R e f e r e n c e s

    B P ] S e r g e y B r i n a n d L a r r y P a g e . G o o g l e s e a r c h e n g i n e . h t t p : / / g o o g l e . s t a n f o r d . e d u .

    C G M P 9 8 ] J u n g h o o C h o , H e c t o r G a r c i a - M o l i n a , a n d L a w r e n c e P a g e . E c i e n t c r a w l i n g t h r o u g h

    u r l o r d e r i n g . I n T o A p p e a r : P r o c e e d i n g s o f t h e S e v e n t h I n t e r n a t i o n a l W e b C o n f e r e n c e

    ( W W W 9 8 ) , 1 9 9 8 .

    G a r 9 5 ] E u g e n e G a r e l d . N e w i n t e r n a t i o n a l p r o f e s s i o n a l s o c i e t y s i g n a l s t h e m a t u r i n g o f s c i e n t o -

    m e t r i c s a n d i n f o r m e t r i c s . T h e S c i e n t i s t , 9 ( 1 6 ) , A u g 1 9 9 5 . h t t p : / / w w w . t h e - s c i e n t i s t .

    l i b r a r y . u p e n n . e d u / y r 1 9 9 5 / a u g u s t / i s s i _ 9 5 0 8 2 1 . h t % m l .

    G o f 7 1 ] W i l l i a m G o m a n . A m a t h e m a t i c a l m e t h o d f o r a n a l y z i n g t h e g r o w t h o f a s c i e n t i c

    d i s c i p l i n e . J o u r n a l o f t h e A C M , 1 8 ( 2 ) : 1 7 3 { 1 8 5 , A p r i l 1 9 7 1 .

    K l e 9 8 ] J o n K l e i n b e r g . A u t h o r i t a t i v e s o u r c e s i n a h y p e r l i n k e d e n v i r o n m e n t . I n P r o c e e d i n g s o f

    t h e N i n e t h A n n u a l A C M - S I A M S y m p o s i u m o n D i s c r e t e A l g o r i t h m s . , 1 9 9 8 .

    1 5

  • 8/8/2019 Page Rank Sub

    16/17

    M a r 9 7 ] M a s s i m o M a r c h i o r i . T h e q u e s t f o r c o r r e c t i n f o r m a t i o n o n t h e w e b : H y p e r s e a r c h e n g i n e s .

    I n P r o c e e d i n g s o f t h e S i x t h I n t e r n a t i o n a l W W W C o n f e r e n c e , S a n t a C l a r a m U S A , A p r i l ,

    1 9 9 7 , 1 9 9 7 . h t t p : / / w w w 6 . n t t l a b s . c o m / H y p e r N e w s / g e t / P A P E R 2 2 2 . h t m l .

    M F 9 5 ] S o u g a t a M u k h e r j e a a n d J a m e s D . F o l e y . S h o w i n g t h e c o n t e x t o f n o d e s i n t h e w o r l d -

    w i d e w e b . I n P r o c e e d i n g s o f A C M C H I ' 9 5 C o n f e r e n c e o n H u m a n F a c t o r s i n C o m p u t i n g

    S y s t e m s , v o l u m e 2 o f S h o r t P a p e r s : W e b B r o w s i n g , p a g e s 3 2 6 { 3 2 7 , 1 9 9 5 .

    M F H 9 5 ] S o u g a t a M u k h e r j e a , J a m e s D . F o l e y , a n d S c o t t H u d s o n . V i s u a l i z i n g c o m p l e x h y p e r -

    m e d i a n e t w o r k s t h r o u g h m u l t i p l e h i e r a r c h i c a l v i e w s . I n P r o c e e d i n g s o f A C M C H I ' 9 5

    C o n f e r e n c e o n H u m a n F a c t o r s i n C o m p u t i n g S y s t e m s , v o l u m e 1 o f P a p e r s : C r e a t i n g

    V i s u a l i z a t i o n s , p a g e s 3 3 1 { 3 3 7 , 1 9 9 5 .

    M R 9 5 ] R . M o t w a n i a n d P . R a g h a v a n . R a n d o m i z e d A l g o r i t h m s . C a m b r i d g e U n i v e r s i t y P r e s s ,

    1 9 9 5 .

    N L A ] N L A N R . A d i s t r i b u t e d t e s t b e d f o r n a t i o n a l i n f o r m a t i o n p r o v i s i o n i n g . h t t p : / / i r c a c h e .

    n l a n r . n e t / C a c h e / .

    P B 9 8 ] L a w r e n c e P a g e a n d S e r g e y B r i n . T h e a n a t o m y o f a l a r g e - s c a l e h y p e r t e x t u a l w e b s e a r c h

    e n g i n e . I n T o A p p e a r : P r o c e e d i n g s o f t h e S e v e n t h I n t e r n a t i o n a l W e b C o n f e r e n c e ( W W W

    9 8 ) , 1 9 9 8 .

    P i t 9 7 ] J a m e s E . P i t k o w . C h a r a c t e r i z i n g W o r l d W i d e W e b E c o l o g i e s . P h D t h e s i s , G e o r g i a

    I n s t i t u e o f T e c h n o l o g y , J u n e 1 9 9 7 .

    P P R 9 6 ] P e t e r P i r o l l i , J a m e s P i t k o w , a n d R a m a n a R a o . S i l k f r o m a s o w ' s e a r : E x t r a c t i n g u s a b l e

    s t r u c t u r e f r o m t h e w e b . I n M i c h a e l J . T a u b e r , V i c t o r i a B e l l o t t i , R o b i n J e r i e s , J o c k D .

    M a c k i n l a y , a n d J a k o b N i e l s e n , e d i t o r s , P r o c e e d i n g s o f t h e C o n f e r e n c e o n H u m a n F a c t o r s

    i n C o m p u t i n g S y s t e m s : C o m m o n G r o u n d , p a g e s 1 1 8 { 1 2 5 , N e w Y o r k , 1 3 { 1 8 A p r i l 1 9 9 6 .

    A C M P r e s s .

    S a n 9 5 ] N e e r a j a S a n k a r a n . S p e c u l a t i o n i n t h e b i o m e d i c a l c o m m u n i t y a b o u n d s o v e r l i k e l y c a n d i -

    d a t e s f o r n o b e l . T h e S c i e n t i s t , 9 ( 1 9 ) , O c t 1 9 9 5 . h t t p : / / w w w . t h e - s c i e n t i s t . l i b r a r y .

    u p e n n . e d u / y r 1 9 9 5 / o c t / n o b e l _ 9 5 1 0 0 2 . h t m l % .

    S p e 9 7 ] E l l e n S p e r t u s . P a r a s i t e : M i n i n g s t r u c t u r a l i n f o r m a t i o n o n t h e w e b . I n P r o c e e d i n g s

    o f t h e S i x t h I n t e r n a t i o n a l W W W C o n f e r e n c e , S a n t a C l a r a m U S A , A p r i l , 1 9 9 7 , 1 9 9 7 .

    h t t p : / / w w w 6 . n t t l a b s . c o m / H y p e r N e w s / g e t / P A P E R 2 0 6 . h t m l .

    T i l ] H o p e N . T i l l m a n . E v a l u a t i n g q u a l i t y o n t h e n e t . h t t p : / / w w w . t i a c . n e t / u s e r s / h o p e /

    f i n d q u a l . h t m l .

    W V S

    +

    9 6 ] R o n W e i s s , B i e n v e n i d o V e l e z , M a r k A . S h e l d o n , C h a n a t h i p M a n p r e m p r e , P e t e r S z i -

    l a g y i , A n d r z e j D u d a , a n d D a v i d K . G i o r d . H y P u r s u i t : A h i e r a r c h i c a l n e t w o r k s e a r c h

    e n g i n e t h a t e x p l o i t s c o n t e n t - l i n k h y p e r t e x t c l u s t e r i n g . I n P r o c e e d i n g s o f t h e 7 t h A C M

    C o n f e r e n c e o n H y p e r t e x t , p a g e s 1 8 0 { 1 9 3 , N e w Y o r k , 1 6 { 2 0 M a r c h 1 9 9 6 . A C M P r e s s .

    1 6

  • 8/8/2019 Page Rank Sub

    17/17

    A p p e n d i x A

    T h i s A p p e n d i x c o n t a i n s s e v e r a l s a m p l e q u e r y r e s u l t s u s i n g G o o g l e . T h e r s t i s a q u e r y f o r \ D i g i t a l

    L i b r a r i e s " u s i n g a u n i f o r m E . T h e n e x t i s a q u e r y f o r \ M i t c h e l l " u s i n g E c o n s i s t i n g j u s t o f J o h n

    M c C a r t h y ' s h o m e p a g e .

    1 7