modeling basketball match scores through team specific strength factors

Upload: mateo-restrepo-mejia

Post on 14-Apr-2018

222 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/29/2019 Modeling basketball match scores through team specific strength factors.

    1/10

    M o d e l i n g b a s k e t b a l l m a t c h s c o r e s t h r o u g h

    t e a m - s p e c i c s t r e n g t h f a c t o r s

    M a t e o R e s t r e p o M e j a , N E A S R e g r e s s i o n A n a l y s i s C o u r s e ( S u m m e r 2 0 1 3 )

    A b s t r a c t

    W e d e v e l o p s e v e r a l s i m p l e r e g r e s s i o n m o d e l s o f b a s k e t b a l l m a t c h s c o r e s . T o

    e v a l u a t e t h e m o d e l s w e u s e t h e m t o t t h e s c o r e s o f t h e 1 4 0 b a s k e t b a l l g a m e s

    p l a y e d a m o n g t h e 1 5 t e a m s i n t h e B i g E a s t c o n f e r e n c e d u r i n g t h e 2 0 1 1 - 2 0 1 2

    N C A A b a s k e t b a l l s e a s o n . W e t e s t s e v e r a l e e c t s f o r s t a t i s t i c a l s i g n i c a n c e ,

    s u c h a s l o c a l v s . v i s i t o r , t h e e e c t o f t i m e w i t h i n t h e s e a s o n a n d t h e t i m e a n d

    t e a m i n t e r a c t i o n .

    K e y w o r d s : b a s k e t b a l l , l i n e a r r e g r e s s i o n , g a m e s c o r e

    1 . I n t r o d u c t i o n

    I n t h i s p a p e r , w e d e v e l o p s e v e r a l s i m p l e r e g r e s s i o n m o d e l s w i t h t h e a i m o f

    p r e d i c t i n g t h e s c o r e o f a b a s k e t b a l l m a t c h g i v e n o n l y t h e i d e n t i t i e s o f t h e t e a m s

    t h a t p l a y e d i t a n d t h e d a t e i t w a s p l a y e d . T h e b a s i c a s s u m p t i o n u n d e r l y i n g

    a l l m o d e l s i s t h a t a t e a m ' s s t r e n g t h a t a n y m o m e n t i n t i m e c a n b e s u m m a -

    r i z e d b y o n e o r t w o n u m b e r s a n d t h a t t h e n u m b e r o f p o i n t s s c o r e d b y t e a m

    a w h e n p l a y i n g a g a i n s t t e a m b w i l l b e g i v e n b y t h e d i e r e n c e b e t w e e n a a n d

    b s t r e n g t h s , p l u s a n i n t e r c e p t . T h e m e t h o d o l o g y i s s i m i l a r t o , a l t h o u g h p e r -

    h a p s m u c h s i m p l e r t h a n , t h a t e m p l o y e d b y U S A T o d a y ' s s p o r t s s t a t i s t i c i a n J e

    S a g a r i n ( a u t h o r ? ) [ S a g a r i n ] , i n t h a t t h e e x p e c t e d s c o r e d i e r e n c e o f a m a t c h

    d e p e n d s o n t h e t e a m s t h a t p l a y i t , o n l y t h r o u g h a s i n g l e n u m e r i c s u m m a r y

    ( w h a t S a g a r i n c a l l s a r a n k i n g . ) W e s h a l l s t a r t w i t h a s i m p l e m o d e l i n w h i c h

    t h e s t r e n g t h o f a t e a m i s s u m m a r i z e d i n a s i n g l e n u m b e r . W e s h a l l b u i l d o n

    t h i s m o d e l b y i n c o r p o r a t i n g a l o c a l - v s - v i s i t o r e e c t , t h a t i s e x p e c t e d t o b u m p

    a t e a m s s c o r e w h e n i t p l a y s a t h o m e . L a t e r w e w i l l e x p l o r e a b i g g e r m o d e l i n

    w h i c h e a c h t e a m i s d e s c r i b e d b y t w o n u m b e r s : a n a t t a c k s t r e n g t h a n d a d e f e n s e

    s t r e n g t h . F i n a l l y , w e w i l l e x p l o r e t h e p o s s i b l e e e c t t h a t t i m e a n d t i m e - t e a m

    i n t e r a c t i o n h a v e o n t h e s c o r e s . W e s h a l l v e r i f y t h a t t h e r e s i d u a l s p r o d u c e d b y

    o u r l i n e a r t s a r e i n f a c t n o r m a l l y d i s t r i b u t e d a n d p r e s e n t n o r e a l o u t l i e r s .

    E m a i l a d d r e s s : m a t e i n i @ g m a i l . c o m ( N E A S R e g r e s s i o n A n a l y s i s C o u r s e ( S u m m e r 2 0 1 3 ) )

    P r e p r i n t s u b m i t t e d t o E l s e v i e r S e p t e m b e r 2 3 , 2 0 1 3

  • 7/29/2019 Modeling basketball match scores through team specific strength factors.

    2/10

    2

    2 . M o d e l d e s c r i p t i o n s

    I n o r d e r t o p r e c i s e l y d e s c r i b e t h e m o d e l s , w e i n t r o d u c e a b i t o f n o t a t i o n a n d

    t e r m i n o l o g y . W e s h a l l f o c u s o n g a m e s p l a y e d a m o n g nT t e a m s b e l o n g i n g t o t h e

    s a m e c o n f e r e n c e . W e l e t g b e t h e n u m b e r o f g a m e s a n d i n d e x t h e g a m e s b y i .

    F o r o u r p u r p o s e s g a m e Gi w i l l b e d e s c r i b e d b y t h e t u p l e

    Gi = (l(i), v(i), Ti, Li, Vi),

    w h e r e :

    l(i) {1, . . . , nT} i s t h e i n d e x o f t h e t e a m p l a y i n g a s l o c a l i n g a m e Gi .

    v(i) {1, . . . , nT} i s t h e i n d e x o f t h e t e a m p l a y i n g a s v i s i t o r i n g a m e Gi.

    Ti i s t h e t i m e t h e g a m e w a s p l a y e d , m e a s u r e d a s a ( g e n e r a l l y f r a c t i o n a l ) n u m b e r o f m o n t h s s i n c e a n a r b i t r a r i l y c h o s e n t i m e o r i g i n .

    Li i s t h e n u m b e r o f p o i n t s s c o r e d b y t h e l o c a l t e a m , li.

    Vi i s t h e n u m b e r o f p o i n t s s c o r e d b y t h e v i s i t o r t e a m , vi.

    A l l o u r m o d e l s w i l l t r y t o p r e d i c t b o t h s c o r e s ,

    Li a n d Vi , f o r e a c h g a m e , f r o m

    t h e v a l u e s o f t h e i n d e p e n d e n t v a r i a b l e s li, vi a n d Ti. I n o r d e r t o d o t h i s , w e s e e

    e a c h g a m e a s t w o s e p a r a t e g a m e s :

    G a m e i, i n w h i c h t e a m l(i) ( a s a t t a c k e r ) s c o r e s p o i n t s Li a g a i n s t t e a m v(i) ( d e f e n d e r ) a n d

    a n o t h e r m i r r o r g a m e , w h i c h w e s h a l l i n d e x w i t h g + i i n w h i c h t e a m v(i) ( a s a t t a c k e r ) s c o r e s Vi p o i n t s a g a i n s t t e a m l(i) ( d e f e n d e r ) .

    T h u s t h e r e s p o n s e v a r i a b l e w i l l h a v e 2g v a l u e s

    Yi := Li ( 1 )

    Yg+i := Vi.

    T h e t o t a l n u m b e r o f d a t a p o i n t s t h a t w e w i l l c o n s i d e r i s t h u s

    n = 2 g

    I t s h a l l p r o v e c o n v e n i e n t t o e x t e n d t h e d e n i t i o n o f l(i) a n d v(i) t o t h e r a n g e {g + 1, g + 2, . . . , 2g} a s f o l l o w s :

    l(g + i) := v(i)

    v(g + i) := l(i), ( 2 )

    r e e c t i n g t h e f a c t t h a t f o r t h e m i r r o r g a m e s , g + 1, . . . , 2g , t h e r o l e s o f t h e t e a m s a r e r e v e r s e d . W i t h t h i s n o t a t i o n w e a r e r e a d y t o i n t r o d u c e t h e m o d e l s .

  • 7/29/2019 Modeling basketball match scores through team specific strength factors.

    3/10

    2 . 1 M o d e l 0 : a s i n g l e s t r e n g t h - f a c t o r p e r t e a m 3

    2 . 1 . M o d e l 0 : a s i n g l e s t r e n g t h - f a c t o r p e r t e a m

    T h e v e r y r s t m o d e l p o s i t s t h a t t e a m m h a s a p l a y i n g s t r e n g t h d e s c r i b e d

    b y a s i n g l e n u m b e r ,

    m a n d t h a t t h e n u m b e r o f p o i n t s s c o r e d b y l o c a l t e a m l

    p l a y i n g a g a i n s t v i s i t o r t e a m

    vw i l l b e

    L = + l v + , ( 3 )

    w h e r e i s a n i n t e r c e p t c o n s t a n t a n d i s a n o r m a l l y d i s t r i b u t e d e r r o r . T h i s

    s i m p l e m o d e l i m p l i e s a l s o t h a t t h e n u m b e r o f p o i n t s s c o r e d b y t h e v i s i t o r t e a m

    v w i l l b e

    V = + v l + , ( 4 )

    w h e r e a n o t h e r n o r m a l l y d i s t r i b u t e d e r r o r , i n d e p e n d e n t o f . T h e p o s s i b l e

    e e c t o f t i m e i s n e g l e c t e d b y t h i s m o d e l . T h i s w i l l b e a d d r e s s i n l a t e r m o d e l s .

    A s w r i t t e n i n e q u a t i o n s ( 3 ) a n d ( 4 ) m o d e l i s o f c o u r s e o v e r d e t e r m i n e d . T h i s

    w i l l b e a d d r e s s s h o r t l y .

    I n o r d e r t o p u t t h e m o d e l e q u a t i o n s ( 3 ) a n d ( 4 ) i n t h e s t a n d a r d f o r m u s e d

    f o r l i n e a r r e g r e s s i o n w e i n t r o d u c e nT 1 d u m m y r e g r e s s o r v a r i a b l e s Bm, m {1, . . . , nT 1} , d e n e d a s

    Bim :=

    1 i f l(i) = m & m < nT

    1 i f v(i) = m & m < nT

    0 o t h e r w i s e

    W e t a k e a d v a n t a g e o f t h e n o t a t i o n a l c o n v e n t i o n ( 2 ) t o m a k e t h e l a s t d e n i t i o n

    h o l d f o r i {1, . . . , 2g}.T h e m o d e l f o r m u l a i s t h u s

    Yi = +

    nT1m=1

    mBim + i, ( 5 )

    H e n c e , b y v i r t u e o f t h e d e n i t i o n ( 1 ) o f Yi f o r m i r r o r g a m e s , t h e f o r m u l a e f -

    f e c t i v e l y r e p l a c e s b o t h f o r m u l a s ( 3 ) a n d ( 4 ) . N o t i c e t h a t t h e o v e r - d e t e r m i n a t i o n

    p r e s e n t i n t h e f o r m e r f o r m u l a s i s t a k e n c a r e o f i n t h e l a t t e r b y u s i n g a s e t o f

    nT 1 d u m m y r e g r e s s o r s , w h i c h e e c t i v e l y m a k e s t h e l a s t t e a m , nT , t h e b a s e t e a m .

    2 . 2 . M o d e l 0 a : l o c a l v s . v i s i t o r e e c t

    T h i s m o d e l i s a s l i g h t e x t e n s i o n o f m o d e l 0 o f t h e p r e v i o u s s e c t i o n t h a t t r i e s

    t o c a p t u r e t h e l o c a l v s . v i s i t o r e e c t o n t h e s c o r e , i . e . i t i n c l u d e s a n e x t r a

    c o e c i e n t t h a t w i l l a d d t o t h e s c o r e o f a t e a m w h e n i t i s p l a y i n g a t h o m e .

    E q u a t i o n s ( 3 ) a n d ( 4 ) a r e m o d i e d t o

    L = + + l v +

    V = + v l +

    T o f o r m u l a t e t h i s i n m a t r i x f o r m , w e i n t r o d u c e a n e x t r a d u m m y r e g r e s s o r

  • 7/29/2019 Modeling basketball match scores through team specific strength factors.

    4/10

    2 . 3 M o d e l 1 : a t t a c k s t r e n g t h v s . d e f e n s e s t r e n g t h . 4

    Ci :=1 i f i g

    0 o t h e r w i s e

    a n d t h u s w e g e t

    Yi = + Ci +

    nT1m=1

    mBim + i ( 6 )

    2 . 3 . M o d e l 1 : a t t a c k s t r e n g t h v s . d e f e n s e s t r e n g t h .

    T h i s m o d e l e e c t i v e l y d o u b l e s t h e n u m b e r o f ( n o n - i n t e r c e p t ) c o e c i e n t s i n

    M o d e l 0 . I t m o d e l s t h e s t r e n g t h o f t e a m m b y m e a n s o f t w o s e p a r a t e n u m b e r s ;

    i t s a t t a c k s t r e n g t h m a n d i t s d e f e n s e s t r e n g t h m. T h e p r e d i c t e d s c o r e s f o r a

    g a m e b e t w e e n l a n d v w o u l d t h e n b e

    L = + l v +

    V = + v l + .

    S i n c e t h e r e a r e t w o s e p a r a t e s e t s o f c o e c i e n t s w e r e q u i r e t w o s e t s o f d u m m y

    v a r i a b l e s :

    Aim :=

    1 i f l(i) = m & m < nT

    0 o t h e r w i s e

    a n d

    Dim :=1 i f v(i) = m & m < nT

    0 o t h e r w i s e .

    T h e m o d e l f o r m u l a i s t h u s

    Yi = +

    nT1m=1

    mAim +

    nT1m=1

    mDim + i.

    N o t i c e t h a t t h i s m o d e l e e c t i v e l y s u b s u m e s M o d e l 0 , b y m a k i n g m = m =m. I n a l a t e r s e c t i o n w e s h a l l t e s t t h e h y p o t h e s i s t h a t m = m f o r a l l m.

    2 . 4 . M o d e l 1 a : M o d e l 1 + l o c a l - v s - v i s i t o r e e c t

    T h e t i t l e s a y s i t a l l , w e a d d t h e l o c a l v s . v i s i t o r e e c t t o M o d e l 1 i n t h e

    s a m e w a y t h a t w e o b t a i n e d M o d e l 0 a f r o m M o d e l 0 . T h e r e s u l t i n g m o d e l i s

    Yi = + Ci +

    nT1m=1

    mAim +

    nT1m=1

    mDim + i.

  • 7/29/2019 Modeling basketball match scores through team specific strength factors.

    5/10

    2 . 5 M o d e l 2 : M o d e l 1 a + g l o b a l e e c t o f t i m e 5

    T e a m I n d e x

    c i n c i n n a t i 1

    c o n n e c t i c u t 2

    d e p a u l 3

    g e o r g e t o w n 4

    l o u i s v i l l e 5

    m a r q u e t t e 6

    n o t r e - d a m e 7

    p i t t s b u r g h 8

    p r o v i d e n c e 9

    r u t g e r s 1 0

    s e t o n - h a l l 1 1

    s o u t h - a 1 2

    s t - j o h n s - n y 1 3

    s y r a c u s e 1 4

    v i l l a n o v a 1 5

    T a b l e 1 : T e a m s i n t h e B i g - E a s t c o n f e r e n c e a n d t h e i r i n d i c e s i n m o d e l s .

    2 . 5 . M o d e l 2 : M o d e l 1 a + g l o b a l e e c t o f t i m e

    W e e n h a n c e t h e p r e v i o u s m o d e l b y a n e x t r a t e r m t h a t a t t e m p t s t o c a p t u r e

    t h e e e c t t h a t t i m e i n t h e s e a s o n h a s o v e r t h e s c o r e . T h e m o d e l f o r m u l a i s

    Yi = + Ci +

    nT1m=1

    (mAim + mDim) + T + i,

    w h e r e T i s t h e t i m e i n m o n t h s m e a s u r e d f r o m a j u d i c i o u s l y c h o s e n o r i g i n .

    2 . 6 . M o d e l 2 a : M o d e l 1 a + t i m e - t e a m i n t e r a c t i o n s

    T h i s s h a l l b e o u r l a s t m o d e l . I t i s a n e n h a n c e m e n t o f m o d e l 1 a b y a l l o w i n g

    i n t e r a c t i o n s o f t h e t i m e f a c t o r w i t h t h e t e a m s t r e n g t h f a c t o r , a l l o w i n g f o r t h e

    p o s s i b i l i t y t h a t t h e a t t a c k / d e f e n s e s t r e n g t h o f a t e a m v a r i e s l i n e a r l y t h r o u g h o u t

    t h e s e a s o n :

    Yi = + Ci +

    nT1m=1

    (mAim + mDim) + T +

    nT1m=1

    AmAimT +

    DmDimT

    + i.

    3 . D a t a F i t s

    T o t e s t t h e m o d e l s d e v e l o p e d i n t h e p r e c e d i n g s e c t i o n , w e s h a l l t t h e m t o

    t h e s c o r e s o f 140 g a m e s p l a y e d a m o n g t h e 1 5 t e a m s b e l o n g i n g t o t h e B i g - E a s t c o n f e r e n c e d u r i n g t h e 2 0 1 2 s e a s o n ( r s t g a m e w a s p l a y e d o n 2 0 1 1 / 1 2 / 2 7 a n d

    l a s t g a m e o n 2 0 1 2 / 0 3 / 1 0 ) . I n t h e n o t a t i o n o f l a s t s e c t i o n , w e h a v e nT = 15 ,g = 140 a n d t h e t o t a l n u m b e r o f d a t a p o i n t s t o b e t i s n = 2 g = 280.

  • 7/29/2019 Modeling basketball match scores through team specific strength factors.

    6/10

    3 . 1 A n a l y s i s o f r e s i d u a l s 6

    M o d e l R2 R2 k n k 1 F- s t a t i s t i c p- v a l u e m o d . 0 0 . 0 9 7 2 1 0 . 0 4 9 5 2 1 4 2 6 5 2 . 0 3 8 0 . 0 1 5 5 6

    m o d . 0 a 0 . 1 2 0 7 0 . 0 7 0 6 9 1 5 2 6 4 2 . 4 1 5 0 . 0 0 2 6 5 3

    m o d . 1 0 . 4 1 6 0 . 3 5 0 8 2 8 2 5 1 6 . 3 8 4 0

    m o d . 1 a 0 . 4 3 9 4 0 . 3 7 4 4 2 9 2 5 0 6 . 7 5 7 0

    m o d . 2 * 0 . 4 4 4 9 0 . 3 7 8 1 3 0 2 4 9 6 . 6 5 3 0

    m o d . 2 a 0 . 5 1 1 2 0 . 3 8 2 9 5 8 2 2 1 3 . 9 8 4 6 . 5 1 7 e - 1 4

    T a b l e 2 : S u m m a r y o f m o d e l - w i d e s t a t i s t i c s f o r m o d e l s 0 t h r o u g h 2 a

    T a b l e 1 s h o w s a l i s t o f a l l 1 5 t e a m s i n t h e B i g - E a s t c o n f e r e n c e a n d t h e

    c o r r e s p o n d i n g i n d i c e s i n t o t h e r e g r e s s o r m a t r i c e s . A s e x p l a i n e d a b o v e , t o a v o i d

    o v e r - d e t e r m i n a t i o n t h e r e i s o n l y 1 4 c o l u m n s i n e a c h m a t r i x , a n d t e a m 15 ( V i l - l a n o v a ) p l a y s t h e r o l e o f t h e b a s e t e a m .

    T a b l e 2 s h o w s a s u m m a r y o f t h e m o d e l - w i d e t s t a t i s t i c s f o r e a c h o f t h e

    m o d e l s .

    W e s e e t h a t m o d e l s 1 , 1 a , 2 a n d 2 a y i e l d v e r y s i m i l a r v a l u e s o f a d j u s t e d

    R2 . I t i s c l e a r f r o m t h i s t a b l e t h a t a l l o w i n g e a c h t e a m t o b e d e s c r i b e d b y t w o

    s t r e n g t h n u m b e r s ( a t t a c k a n d d e f e n s e ) a s i n m o d e l s 1 x a n d 2 x , a s o p p o s e d t o a

    s i n g l e n u m b e r ( m o d e l s 0 x ) , p r o v i d e s f o r a v e r y s i g n i c a n t i m p r o v e m e n t i n t h e

    R2, n a m e l y a r o u n d 3 0 % . B y c o m p a r i n g m o d 0 a t o m o d 0 a n d m o d 1 a t o m o d 1 a

    w e s e e t h a t a l l o w i n g f o r a c o r r e c t i o n b a s e d o n w h e t h e r t h e s c o r i n g t e a m i s l o c a l

    o r v i s i t o r y i e l d s a m o d e s t i m p r o v e m e n t i n t h e t h e a d j u s t e d R2. I n t h e n e x t

    s e c t i o n w e s h a l l t e s t t h e s i g n i c a n c e o f t h i s i m p r o v e m e n t .

    F i n a l l y , w e o b s e r v e t h a t t h e r e i s o n l y a v e r y m i n o r i m p r o v e m e n t i n t h e R2

    ( 0.3%) o b t a i n e d b y i n c l u d i n g t h e i n t e r a c t i o n o f t i m e w i t h t h e t e a m s t r e n g t h f a c t o r s ( m o d e l 2 v s . m o d e l 2 a ) . T h i s m i n o r i m p r o v e m e n t c o m e s a t t h e e x p e n s e

    o f a l m o s t d o u b l i n g t h e n u m b e r o f c o e c i e n t s a n d m a k i n g t h e t o t a l n u m b e r o f

    c o e c i e n t s a s i z a b l e f r a c t i o n o f t h e t o t a l n u m b e r o f p o i n t s . I n v i e w o f t h i s , a n d

    i n t h e b e n e t o f p a r s i m o n y , w e s h a l l d e s i g n a t e m o d e l 2 a s o u r b e s t m o d e l . I f w e

    h a d a l a r g e r n u m b e r o f g a m e s , p l a y e d b y t h e s a m e t e a m s o v e r m a n y d i e r e n t

    s e a s o n s , w e w o u l d p r o b a b l y r e v i s i t t h i s i s s u e . I n a n y c a s e , w e s h a l l l o o k a t a n

    i n c r e m e n t a l

    Ft e s t c o m p a r i n g m o d e l s 2 a n d 2 a i n t h e n e x t s e c t i o n .

    T a b l e 3 s h o w s t h e r e s u l t s o f t t i n g t h e d a t a t o M o d e l 2 a . W e s e e t h a t m o s t

    c o e c i e n t s a r e s i g n i c a n t t o t h e 1 0 % l e v e l ( . ) a n d m a n y o f t h e m a r e s i g n i c a n t

    t o t h e 5% ( * ) a n d e v e n t o t h e 1% ( * * ) l e v e l . I n p a r t i c u l a r , t h e c o e c i e n t C( l o c a l v s . v i s i t o r e e c t ) i s s i g n i c a n t w i t h

    p = 0.0013. T h e c o e c i e n t f o r t h e ( g l o b a l ) t i m e e e c t i s b o r d e r l i n e 1 0 % s i g n i c a n t ( w i t h p = 0.1162) .

    3 . 1 . A n a l y s i s o f r e s i d u a l s

    F i g u r e s 1 a n d 2 s h o w a h i s t o g r a m a n d a q q - p l o t a g a i n s t n o r m a l q u a n t i l e s o f

    t h e r e s i d u a l s o f m o d e l 2 . T h e q q - p l o t s h o w s t h a t t h e a s s u m p t i o n o f n o r m a l i t y

    i s j u s t i e d .

    F i g u r e 3 s h o w s a p l o t o f s t u d e n t i z e d r e s i d u a l s ( a s o b t a i n e d f r o m f u n c t i o n

    s t u d r e s f r o m t h e M A S S p a c k a g e i n R ) v s . t h e t t e d v a l u e s f o r m o d e l 2 . T h e r e

  • 7/29/2019 Modeling basketball match scores through team specific strength factors.

    7/10

    3 . 1 A n a l y s i s o f r e s i d u a l s 7

    E s t i m a t e S t d . . E r r o r t - v a l u e p- v a l u e S i g n i c a n c e

    7 8 . 1 1 3 . 2 6 8 2 3 . 9 2 . 0 9 e - 6 6 * * *

    C 3 . 6 1 5 1 . 1 1 5 3 . 2 4 3 0 . 0 0 1 3 4 5 * *

    A 1 - 5 . 3 2 5 3 . 0 1 - 1 . 7 6 9 0 . 0 7 8 0 5 .

    A 2 - 5 . 1 4 6 3 . 0 4 6 - 1 . 6 9 0 . 0 9 2 3 7 .

    A 3 0 . 9 9 1 5 3 . 0 8 2 0 . 3 2 1 7 0 . 7 4 7 9

    A 4 - 7 . 7 1 9 3 . 0 3 3 - 2 . 5 4 5 0 . 0 1 1 5 3 *

    A 5 - 5 . 1 3 7 2 . 9 6 4 - 1 . 7 3 3 0 . 0 8 4 2 8 .

    A 6 3 . 9 6 6 3 . 0 8 9 1 . 2 8 4 0 . 2 0 0 3

    A 7 - 8 . 4 9 2 3 . 0 6 8 - 2 . 7 6 8 0 . 0 0 6 0 6 8 * *

    A 8 - 5 . 9 4 3 . 0 7 2 - 1 . 9 3 3 0 . 0 5 4 3 2 .

    A 9 - 3 . 6 9 9 3 . 0 7 4 - 1 . 2 0 3 0 . 2 3

    A 1 0 - 8 . 9 8 2 3 . 1 3 6 - 2 . 8 6 4 0 . 0 0 4 5 3 7 * *

    A 1 1 - 7 . 1 9 9 3 . 0 3 6 - 2 . 3 7 1 0 . 0 1 8 5 *

    A 1 2 - 1 4 . 0 3 3 . 0 6 3 - 4 . 5 8 7 . 3 6 5 e - 0 6 * * *

    A 1 3 - 5 . 9 3 9 3 . 0 7 9 - 1 . 9 2 9 0 . 0 5 4 8 5 .

    A 1 4 - 0 . 5 2 6 8 3 . 0 4 2 - 0 . 1 7 3 2 0 . 8 6 2 7

    D 1 1 1 . 0 1 3 . 0 1 3 . 6 5 9 0 . 0 0 0 3 0 9 3 * * *

    D 2 8 . 6 5 6 3 . 0 4 6 2 . 8 4 2 0 . 0 0 4 8 5 2 * *

    D 3 - 6 . 8 5 5 3 . 0 8 2 - 2 . 2 2 4 0 . 0 2 7 0 1 *

    D 4 1 4 . 8 9 3 . 0 3 3 4 . 9 1 1 1 . 6 4 2 e - 0 6 * * *

    D 5 1 1 . 6 1 2 . 9 6 4 3 . 9 1 7 0 . 0 0 0 1 1 6 * * *

    D 6 3 . 9 3 6 3 . 0 8 9 1 . 2 7 4 0 . 2 0 3 7

    D 7 1 2 . 5 3 3 . 0 6 8 4 . 0 8 3 6 . 0 0 1 e - 0 5 * * *

    D 8 6 . 1 1 1 3 . 0 7 2 1 . 9 8 9 0 . 0 4 7 8 1 *

    D 9 0 . 5 9 8 6 3 . 0 7 4 0 . 1 9 4 7 0 . 8 4 5 8

    D 1 0 7 . 9 5 9 3 . 1 3 6 2 . 5 3 8 0 . 0 1 1 7 5 *

    D 1 1 9 . 3 3 2 3 . 0 3 6 3 . 0 7 3 0 . 0 0 2 3 5 2 * *

    D 1 2 1 7 . 9 2 3 . 0 6 3 5 . 8 4 9 1 . 5 4 9 e - 0 8 * * *

    D 1 3 - 0 . 6 2 8 9 3 . 0 7 9 - 0 . 2 0 4 3 0 . 8 3 8 3

    D 1 4 1 2 . 1 5 3 . 0 4 2 3 . 9 9 4 8 . 5 4 7 e - 0 5 * * *

    T - 1 . 1 9 5 0 . 7 5 8 3 - 1 . 5 7 6 0 . 1 1 6 2

    T a b l e 3 : F i t t e d c o e c i e n t s f o r M o d e l 2

  • 7/29/2019 Modeling basketball match scores through team specific strength factors.

    8/10

    3 . 1 A n a l y s i s o f r e s i d u a l s 8

    Histogram of residuals(mod.2)

    residuals(mod.2)

    Frequency

    30 20 10 0 10 20

    0

    20

    40

    60

    F i g u r e 1 : H i s t o g r a m o f r e s i d u a l s f o r m o d . 2

    q

    q

    q

    q

    qq

    q

    qq

    q

    qq

    q

    q

    q

    qq

    q

    q

    q

    q

    q

    qq

    q

    q

    q

    q

    q

    q

    qq

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    qqq

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    qqq

    q

    q

    q

    qq

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    qq

    q

    q

    q

    q

    q

    q

    qq

    q

    q

    qq

    q

    q

    q

    q

    q

    qq

    q

    q

    q

    q

    q

    q

    qq

    qq

    q q

    qq

    q

    q

    q

    qq

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    qq

    q

    q

    qq

    q

    q

    q

    q

    q

    q

    qqq

    q

    q

    q

    q

    q

    q

    qqq

    q

    qq

    q

    q

    q

    qq

    qq

    q

    q

    qq

    q

    qq

    q

    q

    q

    qq

    q

    q q

    q

    q

    q

    q

    q

    q

    q

    q

    qq

    q

    q

    q

    q

    q

    qq

    qqq

    qq

    q

    q

    qqq

    q

    qq

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    qq

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    qq

    q

    q

    q

    q

    q

    q

    qq

    q

    q

    q

    q q

    q

    q

    q

    q

    q

    q

    q

    q

    3 2 1 0 1 2 3

    30

    20

    10

    0

    10

    20

    Normal QQ Plot

    Theoretical Quantiles

    SampleQuantiles

    F i g u r e 2 : q q - p l o t o f r e s i d u a l s a g a i n s t n o r m a l q u a n t i l e s

  • 7/29/2019 Modeling basketball match scores through team specific strength factors.

    9/10

    9

    q

    q

    q

    q

    qq

    q

    qq

    q

    qq

    q

    q

    q

    q q

    q

    q

    q

    q

    q

    qq

    q

    q

    q

    q

    q

    q

    qq

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q qq

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    qqq

    q

    q

    q

    qq

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    qq

    q

    q

    q

    q

    q

    q

    q

    q

    q

    qq

    q

    q

    q

    q

    q

    qq

    q

    q

    q

    q

    q

    q

    qq

    qq

    qq

    q q

    q

    q

    q

    qq

    q

    q

    q

    q

    qq

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q q

    q

    q

    q

    q

    q

    q

    q

    qq q

    q

    q

    q

    q

    q

    q

    qq

    q

    qq

    q

    q

    q

    qq

    qq

    q

    q

    qq

    q

    qq

    q

    q

    q

    qq

    q

    q q

    q

    q

    q

    q

    q

    q

    q

    q

    qq

    q

    q

    q

    q

    q

    qq

    q qq

    q

    q

    q

    qq q

    q

    qq

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    qq

    q

    q

    q

    q

    q

    q

    q

    q

    q

    q

    qq

    q

    q

    q

    q

    q

    q

    qq

    q

    q

    q

    q q

    q

    q

    q

    q

    q

    q

    q

    q

    50 60 70 80

    3

    2

    1

    0

    1

    2

    3

    mod2$fitted.values

    mod2.s

    tudres

    F i g u r e 3 : S t u d e n t i z e d r e s i d u a l s a g a i n s t t t e d v a l u e s

    +L o w e s s l i n e a n d

    [2,+2]r a n g e .

    a r e 1 5 s t u d e n t i z e d r e s i d u a l s w i t h v a l u e s o u t s i d e o f [2, 2] w h i c h i s i n l i n e w i t h e x p e c t a t i o n s .

    4 . H y p o t h e s i s t e s t s

    I n t h i s s e c t i o n w e s h a l l a p p l y i n c r e m e n t a l F- t e s t s t o a f e w h y p o t h e s e s , g i v e n

    f u r t h e r s u p p o r t t o s o m e o f t h e o b s e r v a t i o n s m a d e i n t h e l a s t s e c t i o n .

    T a b l e 4 s h o w s t h e r e g r e s s i o n s u m o f s q u a r e s a n d t h e c o r r e s p o n d i n g d e g r e e s

    o f f r e e d o m f o r t h e m o d e l s i n t r o d u c e d i n S e c t i o n 2 , p l u s a f e w o t h e r s t h a t w e

    w i l l n e e d t o c o m p u t e i n c r e m e n t a l

    F- r a t i o s .

    T a b l e 5 s h o w s t h e r e s u l t s o f a p p l y i n g t h e i n c r e m e n t a l F- t e s t t o 4 d i e r e n t

    h y p o t h e s i s . F o l l o w i n g F o x ' s p r e s c r i p t i o n , i n a l l c a s e s t h e

    RSSu s e d i n t h e d e -

    n o m i n a t o r o f t h e r a t i o w a s t h a t o f t h e f u l l m o d e l 2 a ( w i t h 280 59 1 = 220d e g r e e s o f f r e e d o m ) . A s w e h a d a n t i c i p a t e d , t h e r e i s s t r o n g s u p p o r t f o r t h e f a c t

    t h a t a t t a c k a n d d e f e n s e s t r e n g t h s a r e d i e r e n t , m = m , w h i c h e x p l a i n s b y m o d e l s 1 + a r e s o m u c h b e t t e r t h a n m o d e l s 0 x . T h e r e i s a l s o s t r o n g s u p p o r t f o r

    i n c l u d i n g t h e l o c a l / v i s i t o r e e c t . T h e g l o b a l t i m e e e c t i s b o r d e r l i n e i n s i g n i -

    c a n t a s w e h a d i n f e r r e d f r o m t h e t - s t a t i s t i c o f t h e C c o e c i e n t i n t h e p r e v i o u s

    s e c t i o n .

    F i n a l l y , w i t h a r a t h e r l a r g e p- v a l u e o f 0 . 3 7 8 , w e f a i l t o r e j e c t t h e h y p o t h e s i s

    t h a t i n t e r a c t i o n b e t w e e n t e a m a n d t i m e i s 0 , w h i c h f u r t h e r j u s t i e s t h e c h o i c e

    o f m o d e l 2 a s t h e b e s t m o d e l .

  • 7/29/2019 Modeling basketball match scores through team specific strength factors.

    10/10

    1 0

    t e r m s R e g r e s s i o n S S df

    m o d . 0 B 3 7 5 4 . 4 2 1 5

    m o d . 0 a C + B 4 6 5 9 . 8 4 1 6

    m o d . 1 A + D 1 6 0 6 4 . 2 2 9

    m o d . 1 a C + A + D 1 6 9 6 9 . 6 3 0

    m o d . 2 C + A + D + T 1 7 1 8 3 . 5 3 1

    m o d . 2 a C + A + D + T * A + T * D 1 9 7 4 1 . 1 5 9

    m o d . 0 B C C + B + T 5 1 2 5 . 0 1 1 7

    m o d . A D T A + D + T 1 6 2 7 8 . 1 3 0

    T a b l e 4 : A O V t a b l e f o r M o d e l s f r o m S e c t i o n 2 a n d a f e w o t h e r s

    H0 D e s c r i p t i o n M o d e l X M o d e l Y q i n c . F- r a t i o p- v a l u

    m = m s e p a r a t e a t t a c k / d e f e n s e s t r e n g t h s m o d . 0 B C m o d . 2 1 4 1 0 . 0 8C = 0 l o c a l / v i s i t o r e e c t m o d . A D T m o d . 2 1 1 0 . 6 0 . 0 0 1 3 0

    T = 0g l o b a l t i m e e e c t m o d . 1 a m o d . 2 1 2 . 5 0 4 0 . 1 1

    A = 0, D = 0 t e a m - t i m e i n t e r a c t i o n m o d . 2 m o d . 2 a 2 8 1 . 0 6 9 0 . 3 7

    T a b l e 5 : I n c r e m e n t a l

    F- r a t i o t e s t s f o r a f e w h y p o t h e s e s .

    A c k n o w l e d g m e n t s

    T h e a u t h o r w o u l d l i k e t o w a r m l y t h a n k h i s e x - c o l l e a g u e J a m e s X . F r o h n h o f e r

    f o r p r o v i d i n g a l l o f t h e r a w d a t a u s e d f o r t h i s p r o j e c t . T h i s d a t a i n c l u d i n g m a t c h

    s c o r e s a n d d a t e s , t e a m - c o n f e r e n c e m a p p i n g a n d m u c h m o r e .

    R e f e r e n c e s

    [ S a g a r i n ] U S A T o d a y . J e S a g a r i n c o m p u t e r r a t i n g s , a t U S A T o d a y

    h t t p : / / u s a t o d a y 3 0 . u s a t o d a y . c o m / s p o r t s / s a g a r i n . h t m

    http://usatoday30.usatoday.com/sports/sagarin.htm