rfree and the rfree ratio

Upload: rakesh1521

Post on 03-Apr-2018

222 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/28/2019 Rfree and the Rfree Ratio

    1/11

    547Acta Crys t . (1998) . D54, 547-557

    R f re e a n d t h e R fr ee R a t i o . I . D e r i v a t i o n o f E x p e c t e d V a l u e s o f C r o s s - V a l i d a t io n R e s i d u a l sU s e d i n M a c r o m o l ec u l a r L e a s t- S q u a r e s R e f i n e m e n t

    IAN J. TICKLE, ROMA N A . LASKOWSKI AND DAVID S. M o ss *Departmen t of Crystallography, Birkbe ck Col lege, Malet Street , Lo nd on W C1E 7HX, England.E-mail: [email protected]

    (Received 21 July 1 997; accepted 16 O ctober 1997)

    AbstractThe la s t f ive yea rs have seen a la rge inc rease in the useo f c ros s va l i da t i on i n t he r e f i ne me n t o f ma c romol e c u l a rs t ruc tures us ing X-ray da ta . In th i s t echnique a te s t se t ofr e f l e c t i ons i s s e t a s i de f rom t he work i ng s e t a nd t hep rog re s s o f t he r e f i ne me n t i s mon i t o re d by t heca lcula t ion of a f ree R fac tor which i s based only onthe exc luded re f lec t ions . This paper g ives e s t ima tes fort he r a t i o o f t he f r e e R fa c t o r t o t he R fa c t o r c a l c u l a t e df r o m t h e w o r k i n g s e t f o r b o t h u n r e s t r a i n e d a n dre s t r a i ne d r e f i ne me n t . I t i s a s sume d t ha t bo t h t heX- ra y a nd r e s t r a i n t obse rva t i ons ha ve be e n we i gh t e dc o r re c t l y a nd t ha t t he re i s no c o r re l a t i on o f e r ro r sbe t we e n t he t e s t a nd work i ng s e t s . I t i s a l so shown t ha tt he l e a s t - squa re s we i gh t s t ha t m i n i mi z e t he va r i a nc e s o ft he r e f i ne d pa ra me t e r s , a l so a pp rox i ma t e l y mi n i mi z e t hef re e R fa c t o r . The e s t i ma t e d f r e e R - fa c t o r r a t i o s a rec ompa re d wi t h t hose r e po r t e d fo r s t ruc t u re s i n t heP r o t e i n D a t a B a n k .

    1. IntroductionO n e o f th e p r o b l e m s i n m a c r o m o l e c u l a r c r y s t a ll o g r a p h yis t ha t t he c ry s t a l l og ra phe r c a n no t a l wa ys be su re t ha t a na ppa re n t l y fu l l y r e f i ne d s t ruc t u re i s f r e e f rom l a rges y s t em a t i c er r or s . T h e a g r e e m e n t b e t w e e n t h e m o d e l o ft he mo l e c u l a r s t ruc t u re a nd t he X- ra y d i f f r a c t i on da t af rom wh i c h i t ha s be e n de r i ve d i s me a su re d by t hec rys ta l lographic R fac tor , but i t i s we l l known tha ts t ruc t u re s wi t h a c c e p t a b l e va l ue s o f t h i s pa ra me t e r c a nhave s igni f icant e r rors (Br~ind6n & Jones , 1990; Kley-wegt & Jones , 1995a) . The R fac tor i s suscept ib le toma n i pu l a t i on by l ea v i ng ou t we a k da t a o r by ove r fi t ti ngt he da t a wi t h t oo ma ny pa ra me t e r s a nd so i s no t acomple te ly re l iable guide to accuracy. In smal l -moleculec rys t a ll og ra phy , wh e re t he nu mb e r o f X- ra y i n t e ns i t yo b s e r v a ti o n s u s u a l ly e x c e e d s t h e n u m b e r o f p a r a m e t e r si n t he m ode l by a t l e a s t a n o rde r o f ma gn i t ude , t he Rfa c t o r i s a more su re gu i de t o bo t h a c c u ra c y a nd p re c i -sion.In 1992 B r t i nge r i n t roduc e d t he i de a o f a n R f r e e(Brt inger , 1992, 1993) , based on the s tandard s ta t i s t i ca lmode l l i ng t e c h n i que o f j a c k -kn i fi ng o r c ros s -va l i da t o ry

    re s i dua l s (Mc C ul l a gh & Ne l de r , 1983) . The Rfree is thesa me a s t he c onve n t i ona l R fa c t o r , bu t ba se d on a t e s ts e t c ons i s ti ng o f a sma l l pe rc e n t a ge (u sua l l y ~ 5 -1 0% ) o fre f l e c t i ons e xc l ude d f rom a s t ruc t u re r e f i ne me n t . There ma i n i ng r e f l e c t i ons i nc l ude d i n t he r e f i ne me n t a reknown a s t he work i ng s e t . The R f r e e va lue , unl ike the Rfa c t o r , c a nno t be d r i ve n down by r e f i n i ng a f a l s e mode lbe c a use t he r e f l e c ti ons on w h i c h i t i s ba se d a re e xc l ude dfrom th is process . R f r e e i s on l y e xpe c t e d t o de c re a sedu r i ng t he c ou r se o f a suc c e s s fu l r e f i ne me n t . C onse -quent ly , a h igh va lue of th i s s ta t i s t i c and a concomi tantl ow va l ue o f R ma y i nd i c a t e a n i na c c u ra t e mode l . Thep roc e dure a s sume s t ha t t he r e f l e c t i ons r e move d fo r t hec ros s -va l i da t i on t e s t ha ve be e n r a ndoml y s e l e c t e d a ndha ve e r ro r s unc o r re l a t e d wi t h t hose t ha t r e ma i n i n t hese t u se d i n t he r e f i ne me n t . Th i s a s sumpt i on ma y bepa r t l y i nva l i da t e d by t he p re se nc e o f non -c rys t a l -l og ra ph i c symme t ry . Ide a l l y , t he r e f i ne me n t shou l d ber e p e a t e d s e v e r al t im e s , r e m o v i n g n o n - o v e r l a p p i n g s e tsof re f lec t ions each t ime .

    T h e R f r e e i s h i gh l y c o r re l a t e d wi t h t he pha se a c c u ra c yof the a tom ic mode l (Brf inger , 1992, 1993) and cande t e c t va r i ous t ype s o f e r ro r s i n t he s t ruc t u re i nc l ud i ngpha se e r ro r s a n d pa r t i a l m i s t r a c i ng o f t he s t ruc t u re . I tha s a l so be e n use d i n e va l ua t i ng d i f f e re n t r e f i ne me n tp ro t oc o l s , suc h a s t he op t i m i z a t i on o f t he we i gh t s u se ddur i ng r e f i ne m e n t . I t i s pa r t i c u l a r l y u se fu l i n p re ve n t i ngt he ove r f i t t i ng o f da t a (Kl e ywe g t & B r f i nge r , 1996) .

    Kl e ywe g t & Jone s (1995a ,b ) ha ve shown t ha t wi t hl ow- re so l u t i on da t a i t is pos s i b l e t o c om pl e t e l y mi s t r a c ea s t ruc t u re , de l i be ra t e l y t r a c i ng i t ba c kwa rds t h roughthe dens i ty , and s t i l l achieve an acceptable R fac tor . TheRfree, on the o th e r ha nd, could n ot be du ped so easi ly ,a nd r e m a i ne d a t a h i gh va lue , c lo se to t ha t e x pe c t e d fo r ara ndom se t o f s c a t t e re r s , t h roughou t t he r e f i ne me n t .

    Th e use o f Rfree i s thus a va luable guide to the p roces so f r e f i ne me n t , pa r t i c u l a r l y fo r l ow- re so l u t i on da t a , a ndi t s u se a nd pub l i c a t i on a re wi de l y e nc oura ge d . A re c e n tre v i e w (Kl e ywe g t & B r t i nge r , 1996) i nd i c a t e d t ha t t heu s e o f th e m e a s u r e i s b ec o m i n g m o r e w i d e s p r e a d w i th i tbe i ng r e po r t e d i n 44% o f a r t i c l e s de sc r i b i ng ma c ro -mol e c u l a r X- ra y s t ruc t u re s .

    H ow eve r , the use fuln ess of Rfree i s l imi ted b y the fac tt ha t wha t i s a n ' a c c e p t a b l e ' va l ue i s o f t e n no t e v i de n t . 1 9 98 I n t e r n a t i o n a l U n i o n o f C r y s t a l l o g r a p h yP r i n t e d i n G r e a t B r i t a i n - a l l r i g h ts r e s e r v e d

    Acta Crys ta llographica Sect ion DISSN 0907-4449 1998

  • 7/28/2019 Rfree and the Rfree Ratio

    2/11

    5 48 T H E S T A T IS T IC S O F C R O S S - V A L I D A T I O N R E S I D U A L S

    A s u p e r s c r i p t T d e n o t e s a m a t r i x t r a n s p o s e .S ca l a r sfmnPrwia imi " ~ [ f o b s [ / - G [ f c a l c [ iDO i n cD freeO r e s ttelGNaR = ~ _ , l l f o b s l i - - a l f c a l c l i l

    Ifobsli

    e G - - [ ~ - " w i ( I f b s l i- - a l fc a l c l i )2 1 l / e ~ w i lf o b s l ~R inc .& R GincR free d~ R G fre e

    Table 1 . D e f i n it io n s o f s y m b o l s

    T h e n u m b e r o f s t r u c t u r e a m p l i t u d e o b s e r v a t i o n s i n c l u d e d i n t h e re f i n e m e n t ( t h e w o r k i n g s e t )T h e n u m b e r o f p a r a m e t e r s b e i n g r e f in e dT h e n u m b e r o f o b s e r v a t i o n s , i n c l u d i n g a n y r e s t r a i n t s , i n t h e r e f i n e m e n tT h e n u m b e r o f o b s e r v a t i o n s e x c l u d e d f r o m r e f i n e m e n t ( t h e t e s t s e t )T h e n u m b e r o f r e s t r a i n t s i n c l u d e d i n t h e r e f i n e m e n t ( r = n - f )T h e w e i g h t o f th e i t h o b s e r v a t i o nT h e s t a n d a r d d e v i a t i o n o f t h e i t h o b s e r v a t i o nA n X - r a y r e s i du a lT h e w e i g h t e d r e f i n e m e n t r e s i d u a lT h e c o n t r i b u t i o n t o D f r o m t h e w o r k i n g s e t o f f r e f l e c t io n sD b a s e d o n a t e s t s e t o f p e x c l u d e d r e f l e c t i o n sT h e c o n t r i b u t i o n t o D f r o m t h e r r e s t r a i n t s ( D r e s t = D - - D i n c )T h e s t r u c t u r e a m p l i t u d eT h e l e a s t - s q u a r e s X - r a y s c a l e f a c t o rT h e n u m b e r o f a t o m s b e i n g r e f i n e dT h e s t a n d a r d R f a c t o r

    T h e g e n e r a l i z e d R f a c t o rR f a c t o r s b a s e d o n a l l r e fl e c t i o n s in t h e w o r k i n g s e tR f ac to r s based on a t e s t se t o f p ex c lude d r e f l ec t i ons

    C o l u m n m a t r i c e sa ib ifgiAf~ee = g - ~

    T h e i t h r o w o f AT h e i t h r o w o f BT h e n o b s e r v a t i o n s e m p l o y e d i n t h e r e f i n e m e n t ( s t r u c t u r e a m p l i t u d e s a n d r e s t r a i n t s )T h e l e a s t - s q u a r e s e s t i m a t e o f f c a l c u l a t e d a t t h e c o n v e r g e n c e o f t h e r e f i n e m e n tT h e p e x c l u d e d o b s e r v a t i o n sT h e l e a s t - s q u a r e s e s t i m a t e o f g c a l c u l a t e d f r o m i a t t h e c o n v e r g e n c e o f t h e r e f i n e m e n tT h e l e a s t - s q u a r e s e s t i m a t e o f t h e r n p a r a m e t e r sT h e l e a s t - s q u a r e s r e s i d u a l a s s o c i a t e d w i t h t h e e x c l u d e d o b s e r v a t i o n s

    R e c t a n g u l a r m a t r ic e sABD freeI~lSWW free

    T h e l e a s t - s q u a r e s d e s i g n m a t r i x o f d e r iv a t i v e s o f o r d e r n x mT h e p x m m a t r i x a n a l o g o u s t o A b u t in v o l v i n g t h e e x c l u d e d o b s e r v a t i o n s

    = (AfreeAfree))he p x p va r i an ce - co var i an ce m a t r i x o f t he exc lu ded r e s idua l s ( Dfr ee TT h e m x m n o r m a l m a t r i x g iv e n b y A r W AT h e p x n m a t r i x g iv e n b y B H - a A T WT h e n x n s y m m e t r i c w e i g h t m a t r i x a n d W - 1 is th e V C M ( v a r i a n c e - c o v a r i a n c e m a t r i x ) o f t h e i n c l u d e d

    o b s e r v a t i o n s . T h i s m a t r i x r e f l e c t s t h e r a n d o m e x p e r i m e n t a l a n d m o d e l e r r o r sThe p x p sym m et r i c w e igh t m a t r i x o f g and Wff~ae i s t he V CM of t he exc lud ed ob se r va t i ons

    O n e w o u l d e x p e ct Rfree t o a lw a y s b e h i g h e r t h a n R e v e n T h e n e e d f o r m o r e u n d e r s t a n d i n g o f t h e b e h a v i o u r ofwhe n t he re a re no sys t e ma t i c e r ro r s i n t he mode l R f r ee w a s h i g h li g h te d b y D o d s o n et al . (1996). In spi te ofs t ruc t u re, bu t is no t c le a r how muc h h i ghe r i f shou l d be . t he e n t hus i a sm fo r i t s u se , a c t ua l a pp l i c a t i ons o f R f r e eA t p r e s e n t w e m e r e l y h a v e a n u m b e r o f r u le s o f th u m b(Kleywegt & Brt inger , 1996) .

    C ru i c ksha nk ha s e s t i ma t e d t ha t t he e xpe c t e d va l ue o ft he f r e e R fa c t o r (EF R F ) i s g i ve n by

    E F R F - - [ N o b s / (N o b s - N p a r ) ] l / 2 R ,w h e r e N o b s i s t he numbe r o f obse rva t i ons , N p a r is thenumbe r o f pa ra me t e r s , a nd R i s t he c onve n t i ona l Rf a c to r ( D o d s o n et al . , 1996). Bacchi et al . (1996) use thisexpress ion in an extens ion of the se l f -va l ida t ionHami l ton te s t to a ssess the s igni f icance of any obse rveddrop i n R f r e e dur i ng r e f i ne me n t .

    h a v e r e m a i n e d s o m e w h a t s u b j e c t i v e w i t h o u t a n u n d e r -s tanding of i t s s ta t i s t i ca l bas i s . For example , i f non-c rys t a l l og ra ph i c symme t ry (NC S ) c ons t r a i n t s a rere l a xe d du r i ng a s t ruc t u re r e f i ne me n t , how muc h shou l dR f r e e r i se du r i ng subse que n t r e f i ne m e n t i f t he r e s t r a i ne dm o d e l i s c o r r e c t ? W i t h o u t u n d e r s t a n d i n g h o w R f r e eva r i e s as a func t i on o f t he num be r o f r e s t r a i n t s a nd / o rnum be r o f pa ra me t e r s i t is on l y pos s i b l e to ma ke r a t h e rsub j e c t ive j udge m e n t s .Th i s pa pe r be g i ns t o a nswe r t he se que s t i ons byde r i v i ng t he e xpe c t e d va l ue o f the f r e e r e s i dua l f romwhi c h e s t i ma t e s o f bo t h R f r e e a nd t he r a t i o o f R f r e e to Rare ca lcula ted .

  • 7/28/2019 Rfree and the Rfree Ratio

    3/11

    I . J. T I C K L E , R . A . L A S K O W S K I A N D D . S . M O S S 5 492. Theory

    2.1. E r r o r a s s u m p t i o n sT h e e x p e c t e d o r e s t i ma t e d v a l u e s o f re s i d u a l s a n d R

    f a c t o r s w i l l b e d e r i v e d o n t h e a s s u mp t i o n t h a t t h ew e i g h t s u s e d i n th e s t r u c t u r e r e f i n e m e n t c o r r e c t l y r e f l e ctt h e e r r o r s w h i c h i n c l u d e n o t o n l y e x p e r i me n t a l e r r o r s i nme a s u r i n g X - r a y i n t e n s it i e s b u t a l s o e r r o r s i n t h e f u n c -t i o n a l f o r m o f t h e s t r u c t u r e - f a c t o r m o d e l w h i c h p r o d u c er a n d o m a n d u n c o r r e l a t e d p e r t u r b a t i o n i n t h e r e s i d u a l s .T h e s e mo d e l e r r o r s , w h i c h ma y a r i s e f r o m c o mp l i c a t e da t o m i c d i so r d e r , a r e a n i m p o r t a n t s o u r c e o f r a n d o me r r o r i n p r o t e i n s t r u c t u r e s a n d a r e t h e r e a s o n w h y Rf a c t o r s o f r e f i n e d ma c r o m o l e c u l a r s t r u c t u r e s a r e u s u a l l yh i g h e r t h a n t h e i r s ma l l - mo l e c u l e c o u n t e r p a r t s . I t i sa s s u me d i n t h e d e r i v a t i o n o f t h e s t a t i s t i c s i n t h i s p a p e rt h a t t h e s e r a n d o m e r r o r s h a v e b e e n c o r r e c t ly a c c o u n t e df o r i n t h e w e i g h t i n g o f t h e X - r a y d a t a a n d o f a n yr e s t r a i n t s i n t h e r e f i n e me n t p r o c e s s .

    So me mo d e l e r r o r s , s u c h a s t h e a b s e n c e o f a b u l ks o l v e n t c o r r e c t i o n , l e a d t o c o r r e l a t e d mo d e l e r r o r s i nr e c i p r o c a l s p a c e . I n t h e t h e o r y t o b e p r e s e n t e d i n t h i sp a p e r , s u c h c o r r e l a t i o n c o u l d b e a c c o m m o d a t e d i fr e f i n e me n t t o o k p l a c e w i t h a w e i g h t ma t r i x w i t h o f f -d i a g o n a l t e r ms b u t i n p r a c t i c e c o mp u t a t i o n a l d i f f i c u l -t i e s p r e c l u d e t h e u s e o f s u c h ma t r i c e s i n ma c r o -mo l e c u l a r r e f i n e me n t . A l l e x p r e s s i o n s d e r i v e d i n t h i sp a p e r t h a t u s e a d i a g o n a l w e i g h t ma t r i x a s s u me t h a tc o r r e l a t e d e r r o r s a r e a b s e n t . Mo d e l e r r o r s s u c h a smi s s i n g o r mi s p l a c e d a t o ms a r e s i mi l a r l y a s s u me d t ob e a b s e n t . O n t h e o t h e r h a n d , n o a s s u mp t i o n s a r em a d e a b o u t t h e c o m p l e t e n e s s o r o t h e r w i s e o f t h eref l ec t ion da ta se t .

    I n o r d e r t h a t t h e mo d e l e r r o r s i n t h e f r e e r e f l e c t i o n sa r e u n c o r r e l a t e d w i t h t h o s e r e f l e c t i o n s u s e d i n r e f i n e -me n t , t h e r e f l e c t i o n s i n o n e s e t mu s t n o t b e r e l a t e d t ot h o s e i n t h e o t h e r s e t b y c r y s t a l l o g r a p h i c a n d n o n -c r y s t a l l o g r a p h i c s y mme t r y . N o r e f l e c t i o n i n t h e f r e e s e tm u s t b e r e l a t e d t o o n e i n t h e m a i n s e t b y p s e u d o s y m -me t r y . Ca r e i s n e e d e d w h e n s e l e c t i n g r e f l e c t i o n s f r o md a t a s e t s w h e r e B i j v o e t p a i r s h a v e b e e n k e p t s e p a r a t e .A n o t h e r c a s e a r i s e s w h e n t h e r e a r e d o m a i n s o r m o l e -c u l e s i n t h e a s y mme t r i c u n i t r e l a t e d b y a n o n - c r y s t a l -lograph ic ax i s which i s a long a ra t iona l d i rec t ion in thecrys ta l l a t t i ce (e.g. t h e p s e u d o - d y a d s i n r h o m b o h e d r a linsul in) .2.2. D e f in i t i o n s

    Fo r c o n v e n i e n c e t h e d e f i n i t i o n s o f s y mb o l s c o mmo n l yu s e d i n t h is p a p e r a n d i t s a p p e n d i c e s a r e g i v e n i n T a b l e 1 .2.3. T h e e x p e c t e d v a lu e o f t h e f r e e r e s id u a l

    T h e a l g e b r a f o r t h e d e r i v a t i o n o f t h e e x p e c t e d v a l u eo f t h e f r e e r e s id u a l i s p r e s e n t e d i n A p p e n d i x A . T h e r e i ti s f ir s t s h o w n t h a t t h e s e c o n d m o m e n t ma t r i x o f re s i d u a l sc o r r e s p o n d i n g t o a t e s t s e t o f o b s e r v a t i o n s e x c l u d e d

    f r o m l e a s t - s q u a r e s r e f i n e me n t i s e q u a l t o t h e s u m o f t h ev a r i a n c e - - c o v a r i a n c e ma t r i x ( V C M) o f t h e o mi t t e do b s e r v a t i o n s a n d t h e V C M o f t h e c o r r e s p o n d i n g q u a n -t i t i e s c a l c u l a t e d f r o m t h e p a r a me t e r e s t i ma t e s a t t h ec o n v e r g e n c e o f a re f i n e m e n t . T h e e x p e c t e d v a l u e o f t h es u m o f s q u a r e d r e s i d u a l s a s s o c i a t e d w i t h t h e e x c l u d e do b s e r v a t i o n s i s t h e n o b t a i n e d b y t a k i n g ma t r i x t r a c e s .

    T h e t h e o r y t h e n d r a w s o n r e s u l t s f r o m a n e a r l i e rp a p e r ( T i c k l e et al. , 1 9 9 8 ) w h e r e i t i s s h o w n t h a t w h e nt h e w e i g h t i n g i s o n a n a b s o l u t e s c a le , th e e x p e c t e d v a l u eo f t h e s u m o f a s u b s e t o f s w e i g h t e d r e s i d u a l s a t t h ec o n v e r g e n c e o f a l e a s t - s q u a r e s r e f i n e me n t i s ,

    (~i=1 i m 2 ) - - S - - i= 1w i a T n - l a i ' (1 )w h e r e t h e a n g l e d b r a c k e t s d e n o t e s t a t i s t i c a l e x p e c t a -t ion .

    W h e n t h e a b o v e s u m m a t i o n i s o v e r a ll n o b s e r v a t i o n s( r e f l e c ti o n s a n d r e s t r a i n t s) ,

    a n d h e n c ew i a ~ H - l a i = m , (2 )i= 1

    ( i = l W i i ) - - n mIn A p p e n d i x A e q u a t i o n ( 2 1 ) s h o w s t h a t t h e e x p e c t e d

    v a l u e o f t h e r e s i d u a l a s s o c i a t e d w i t h p e x c l u d e d o b s e r -va t ions in the t es t se t , i s g iven by ,

    ( O f r e e ) - - ( w i ( I F b s l i -p= p + ~ w i b T H - l b i .i= l( 3 )

    I t s h o u l d b e n o t e d t h a t t h e d e r i v a t i o n o f t h is e q u a t i o nd o e s n o t a s s u m e t h a t t h e t e s t s e t h a s b e e n r a n d o m l ys e l e c t e d f r o m r e c i p r o c a l s p a c e .

    W e n o w c o n s i d e r t h e f s t r u c t u r e - a m p l i t u d e o b s e r v a -t ions i n c lu d e d i n t h e r e f i n e me n t ( t h e w o r k i n g s e t ) . F r o m 'e q u a t i o n ( 1 ) t h e e x p e c t e d v a l u e o f t h e r e s i d u a l a ss o -c i a t e d w i t h t h e s e o b s e r v a t i o n s a t c o n v e r g e n c e i s g i v e nb y

    (D i n c ) - ( i = ~w i ( l F o b s l i -G l F c a , c l ) 2f- - f - ~ w i a T H - l a i .i= 1

    ( 4 )

    T h e s i mi l a r i t i e s b e t w e e n e q u a t i o n s ( 3 ) a n d ( 4 ) w i l l b en o t e d . I n t h e l i n e a r a p p r o x i ma t i o n , b o t h e x p r e s s i o n s f o rt h e e x p e c t e d v a l u e a r e i n d e p e n d e n t o f t h e o b s e r v a t i o n s( s t r u c t u r e a mp l i t u d e s a n d r e s t r a i n t s ) .

    U s i n g t h e s e r e s u l t s i t is p o s si b l e t o o b t a i n e s t i ma t e s o ft h e r a t i o o f Rf re e t o R f o r m o d e l s w i t h o n l y r a n d o m

  • 7/28/2019 Rfree and the Rfree Ratio

    4/11

    5 50 T H E S T A T IS T IC S O F C R O S S - V A L I D A T I O N R E S I D U A L Su n c o r r e l a t e d e r r or s . T hi s R f r e e ra t io i s es t imated f i r s t fo ru n r e s t r a i n e d r e f i n e m e n t a n d t h e n f o r r e f i n e m e n t s w i t hg e o m e t r i c a l r e s t r a i n t s . T h e s e R f r e e r a t i o s a r e t h e s t a r t i n gp o i n t f o r u n d e r s t a n d i n g R f r e e r a t i o s wh e re s y s t e m a t i ce r r o r s a r e p r e s e n t .2.4. Ra nd om exc lusion o f observat ions in unrestrainedre f inement

    T h e c a l c u l a t i o n o f t h e e x p e c t e d v a l u e s o f t h e r e s i d u a l su s i n g e q u a t i o n s (3 ) a n d (4 ) i s a c o m p u t a t i o n a l l y i n t e n -s i v e t a s k i n m a c r o m o l e c u l a r r e f i n e m e n t , i n v o l v i n g t h ei n v e r s i o n o f t h e n o r m a l m a t r i x H . I n g e n e r a l w e n e e ds t a t i s t i c s wh i c h a r e m o re r e a d i l y a v a i l a b l e d u r i n g t h er e f i n e m e n t p r o c e s s .

    W e f ir s t c o n s i d e r t h e c a s e o f u n re s t r a i n e d r e f i n e m e n t .In t h is c a s e f = n a n d f ro m e q u a t i o n s (2 ) a n d (4 ) ,

    a n d ,

    fY~ w ia f H - la i - - m , (5 )i= 1

    ( O i n c ) - - f - - m . ( 6 )E q u a t i o n (3 ) g i v e s t h e e x p e c t e d v a l u e o f t h e f r e e re s i -d u a l b a s e d o n a n y g i v e n s u b s e t o f p o b s e rv a t i o n s . I no rd e r t o d e r i v e s i m p l e r e x p re s s i o n s , we m u s t n o wa s s u m e t h a t t h e t e s t r e f l e c t i o n s h a v e b e e n r a n d o m l yc h o s e n f ro m re c i p ro c a l s p a c e . I n th i s c a se wh e n p i s l a rg ew e a s s u m e t h a t t h e s u m s o f t h e q u a d r a t i c f o r m s a r ea p p r o x i m a t e l y p r o p o r t i o n a l t o t h e n u m b e r o f o b s e r v a -t i o n s i n v o l v e d . T h u s ,

    p fY~. wibri U - lb i ~" (P / f ) E wia rH - lai (7 )i=1 i=1He n c e , f ro m e q u a t i o n s (3 ) , ( 5 ) a n d (7 ) ,

    ( O f r e e ) ~ ' (p / f )O e "t" m) . ( 8 )F r o m e q u a t i o n s ( 6) a n d ( 8) t h e e s t i m a t e d r a t i o o f t h er e s i du a l s f o r th e c a s e o f r a n d o m u n c o r r e l a t e d e r r o r s i s

    O f r e e p f f - ~ m )--~ (9)D i n c f O e - - m ) "U n l i k e e q u a t i o n s ( 3 ) a n d ( 4 ) , t h e a b o v e e q u a t i o n i si n d e p e n d e n t o f t h e s c a l e o f t h e we i g h t s.2.5. The expec ted value of RGfre in unrestrainedre f inement

    T h e e x p e c t e d v a l u e s o f t h e r e s i d u a ls d e r i v e d i n t h ep r e v i o u s s e c t i o n m a y b e u s e d t o g iv e e s t i m a t e d v a l u e s o ft h e g e n e r a l i z e d R f a c t o r , R e , d e f i n e d b y

    R a a _ E w i ( J F o b s l i - G l F ~ a l c [ i ) 2F~ w , IFou~l/~

    2W e d e f i n e R G f r e e a s R 2 b a s e d o n p e x c l u d e d r e f l e c ti o n s .

    I f t h e r e a r e o n l y r a n d o m a n d u n c o r r e l a t e d e r r o r s t h e n2t h e n u m e r a t o r o f R G f r e e m a y b e a p p ro x i m a t e d b y (Df re e )a n d u s i n g e q u a t i o n (8 ) we c a n wr i t e

    2 p ( f + m ) (1 0)g G f r e e ' ~ pf E w i[ f obs[~i= 12W e d e f i n e Rai.c a s R 2 b a s e d o n a l l f i n c l u d e d r e f l e c t i o n s

    a n d i f t h e we i g h t s h a v e b e e n s c a l e d s o t h a t t h e r e s i d u a li n t h e n u m e r a t o r i s e q u a l t o i t s e x p e c t e d v a l u e t h e n

    2 f - m (11)R G i n c - fY~ wilFobs[2i= 1

    2.6. The rat io of R G f r e e t o R G in unrestrained re f inementF ro m e q u a t i o n s (9 ) , ( 1 0 ) a n d (1 1 ) we h a v e

    2 f D f r e e f + mG f r ee , ~2 - - - - "R Ginc P D i n c f -- m

    T h u s , we m a y w r i t e t h e r a t i o o f t h e g e n e ra l i z e d R f a c t o r sf o r t h e c a se o f r a n d o m u n c o r r e l a t e d e r r o r s a s

    e G f r e e , . ,~ ~ - ' ~ m ) 1/2R G i n c - - _ _ . (12)

    T h e s e r e s u lt s g i v e th e e x p e c t e d r a t i o o f t h e g e n e r a l i z e dR f a c t o r o f t h e t e s t s e t to t h a t o f t h e w o rk i n g s e t a t t h ec o n v e r g e n c e o f a n u n r e s t r a i n e d r e f i n e m e n t i n t h e c a s ew h e r e t h e r e a r e o n ly r a n d o m u n c o r r e l a t e d e r r o r s w h i c ha r e c o r r e c t ly r ef l e c t e d i n t h e w e i g h t s e m p l o y e d . T h er e s u lt s d e p e n d o n l y o n th e n u m b e r o f r e f l ec t i o ns a n d t h en u m b e r o f p a r a m e t e r s.2.7. Re#me and the RGfre ratio in restrained refinement

    In a r e s t r a i n e d r e f i n e m e n t , s u c h a s i s t y p i c a l i nm a c r o m o l e c u l a r c r y s t a l l o g r a p h y , t h e r a t i o s d e r i v e d i nt h e p r e v i o u s t wo s e c t i o n s wo u l d o n l y b e a p p l i c a b l e i fR c fr ee we r e c a l c u l a t e d f ro m a r a n d o m s e l e c t i o n o f re s i -d u a l s i n c l u d i n g b o t h s t r u c t u r e - a m p l i t u d e o b s e r v a t i o n sa n d r e s t r a i n t s . S i n c e R f a c t o r s a r e t r a d i t i o n a l l y o n l yb a s e d o n s t ru c t u re a m p l i t u d e s , t h e e s t i m a t i o n o f R c fr e er a t i o s f o r r e s t r a i n e d r e f i n e m e n t r e q u i r e s f u r t h e ranalysis .

    T h e n u m b e r o f o b s e r v a t i o n s t h is t i m e i s n a n d f o ft h e s e a r e s t ru c t u re a m p l i t u d e s , t h e b a l a n c e c o n s i s t i n g o fr g e o m e t r i c a l , t h e r m a l o r o t h e r r e s t r a i n t s w h i c h m a k e ac o n t r i b u t i o n D r e s t t o t h e m i n i m i z e d r e s i d u a l a t c o n v e r -g e n c e . F r o m e q u a t i o n ( 1 ) w e h a v e

    ( D r e s t } - - r - k w i a T H - l a i , (13)i= 1w h e r e t h e s u m m a t i o n is t a k e n o v e r t h e r e s t r a i n t o b s e r-

  • 7/28/2019 Rfree and the Rfree Ratio

    5/11

  • 7/28/2019 Rfree and the Rfree Ratio

    6/11

  • 7/28/2019 Rfree and the Rfree Ratio

    7/11

  • 7/28/2019 Rfree and the Rfree Ratio

    8/11

    5 54 T H E S T A T IS T I CS O F C R O S S - V A L I D A T I O N R E S I D U A L Sr e a r r a n g i n g t h e t e r ms i n e q u a t i o n ( 1 6 ) w e a r r i v e a t

    w h e r e z - - ax ,z -- (y2 _ 1)/(y2 + 1).F ig . 2 shows a p lo t o f z aga ins t x where the po in t s a reco lour coded as in Fig . 1 . The co loured s t ra igh t l ines inFig . 2 a re l eas t , squares l ines f i t t ed to the da ta po in t s int h e p a r t i c u l a r r e s o l u t i o n r a n g e r e p r e s e n t e d b y p o i n t so f t h e s a m e c o l o u r . Fo r e x a mp l e , t h e p i n k t r i a n g u l a rp o i n t s r e p r e s e n t d a t a b e t w e e n 3 a n d 4 A r e s o l u t i o n a n dthe p ink l ine i s the l eas t - squares l ine th rough the p inkt r i a n g u l a r p o i n t s . T h e p e c k e d b l a c k l i n e s e ma n a t i n gf rom the o r ig in in Fig . 2 a re p lo t s o f z - a x f o r t h e s a mevalues o f a as shown in Fig . 1

    W e r e q u e s t e d i n f o r m a t i o n f r o m s o m e o f th e a u t h o r swhose s t ruc tu res were ou t l i e rs in Fig . 2 . I t becamea p p a r e n t t h a t v e r y u n u s u a l Rf re e r a t io s a r e n o r ma l l y n o tt h e r e s u l t o f c a r e f u l r e f i n e m e n t p r o t o c o ls . T h e c o l o u r e dl i n e s w e r e , t h e r e f o r e , p l o t t e d i g n o r i n g t h e p o i n t s i n t h ed a r k e r r e g i o n s o u t s i d e t h e s e c t o r b o u n d e d b y t h e b l a c kl ines o f s lopes 0 .5 and 10 . The cho ice o f these s lopes asc u t o f f s w a s s o me w h a t a r b i t r a r y b u t t h e r e mo v a l o f t h e s eo u t l i e r s c a u s e d t h e c o l o u r e d l i n e s t o p a s s n e a r e r t o t h eorigin.

    The p lo t s o f z = a x r e p r e s e n t r e f i n e me n t r e g i me s w i t hd i f f er e n t n u m b e r s o f p a r a m e t e r s p e r a t o m . T h e g r a d i-e n t s o f t h e l in e s ( a ) i n c r e a s e w i t h t h e n u mb e r o f p a r a -me t e r s p e r a t o m. I n th e a b s e n c e o f r e l e v a n t i n f o r m a t i o ni n t h e D a t a Ba n k , i t w a s a s s u me d t h a t i n r e s t r a i n e dref inements , r = 2 . 5 N a a n d Drest = I"/5. T h e s e e s t i ma t e si g n o r e t e mp e r a t u r e - f a c t o r r e s t r a in t s ( i f a n y ) b e c a u s e o u rs u r v e y o f t h e l a t t e r r e v e a l e d w i d e l y d i f f e r e n t r e s t r a i n tp r o t o c o l s. U s i n g t h e s e v a l u es , f o r r e s t r a i n e d r e f i n e me n t s

    a = ( m / N a ) - 2 .I t c a n b e s e e n t h a t t h e z = 2 x li n e ( i so t r o p i c t e m p e r a t u r ef a c t o r s ) p a s s e s t h r o u g h t h e c o n s t e l l a t i o n s o f o r a n g ec r o s s e s a n d p i n k t r i a n g u l a r p o i n t s , r e p r e s e n t i n g s t r u c -tu res b e tw een 2 .5 and 1 .5 A reso lu t ion and i s c lose to thegre en pec ked l ine (2 .5 -2 .0 * da ta) . S im i lar ly the z = xl i n e ( o v e r a l l t e mp e r a t u r e f a c t o r ) ! i e s c l o s e t o t h e p i n kl ine which i s f i t t ed to the 4 -3 A da ta . E ve n in thea b s e n c e o f d e ta i ls o f r e s t r a i n t p r o c e d u r e s , t h e z = a xl in e s c a n b e s e e n t o p a s s t h r o u g h a r e a s o f t h e p l o t w h e r et h e p a r t i c u l a r r e f i n e me n t r e g i me i s mo s t r e l e v a n t . T h elarge sp r ead o f va lues a bou t the s t ra igh t l ines is un l ike lyto be so le ly a s t a t i s t i ca l e f fec t and may wel l say some-t h i n g a b o u t t h e q u a l i t y o f t h e r e f i n e me n t s .

    Co m par i son o f the l ines z = 2x and z = 4x , which d i f fe ro n l y i n r e s p e c t o f r e s t r ai n t s, s h o w s h o w r e s t r a i n t s l o w e rth e Rfree r a ti o . N o n - c r y s t a l l o g r a p h i c s y m me t r y ( N CS, s e eI n t r o d u c t i o n ) mi g h t g i v e r i s e t o l o w e r t h a n p r e d i c t e dRfree r a t i o s . H o w e v e r , a c h e c k o n s t r u c t u r e s i n o u r p l o t sw h i c h e x h i b i t N CS d i d n o t r e v e a l a n y o b v i o u s s y s t e ma t i ceffects .

    4 . C o n c l u s i o n sV a l u e s o f Rfree are af fec ted by a l l t ypes o f e r ro r in themo d e l a n d t h e d a t a . T h e Rfree ra t io , however , i s inde-p e n d e n t o f r a n d o m e r r o r s a n d p r o v i d e s a st a ti s ti c w h i c hc a n b e c o mp a r e d w i t h i t s t h e o r e t i c a l l y e s t i ma t e d v a l u ea n d u s e d t o d e t e c t s y s t e ma t i c mo d e l o r w e i g h t i n g e r r o r sa t th e c o n v e r g e n c e o f l e a s t - s q u a r e s r e f i n e me n t .H o w e v e r , a c h i e v e me n t o f a t h e o r e t i c a l v a l u e o f t h e r a t i oi s n o t b y i t s e lf p r o o f o f t h e c o r r e c t n e s s o f th e m o d e l o r o ft h e q u a l i t y o f t h e r e f i n e me n t . N e v e r t h e l e s s is w o u l d s t il lb e h e l p f u l if r e f i n e m e n t p r o g r a m s p r i n t e d o u t t h ec a l c u l a t e d a n d e s t i m a t e d v a l u e o f t h e Rfree ra t io us ingt h e e x p r e s s i o n s s h o w n i n T a b le 2 . T h i s w o u l d e n c o u r a g ea b e t t e r u n d e r s t a n d i n g o f Rfree t han ex i s t s a t p resen t .Ca l c u l a t i o n o f th e o b s e r v e d a n d t h e o r e t i c a l v a l u e s o ft h e s e r a t i o s h a s a l r e a d y b e e n i mp l e me n t e d i n t h er e f i n e m e n t p r o g r a m R E S T R A I N ( D r i e s s e n e t a l . , 1989).

    A t l o w r e s o l u t i o n t h e n u m b e r o f d a t a e x c l u d e d f o rc r o s s v a l i d a t i o n ma y b e s ma l l a n d i n t h e s e c i r c u ms t a n c e sthe p rec i s ion o f f ree res idual s i s impor tan t . Th i s wi l l bethe sub jec t o f par t I I o f th i s work .

    A P P E N D I X AA 1 . S t a t is t i ca l p r o p e r t i e s o f f r e e r e s i d u a ls . D e r i v a t i o n o ft h e e x p e c t e d v a l u e o f t h e f r e e r e s i d u a l

    H e r e w e d e r i v e t h e s t a ti s ti c a l e x p e c t a t i o n o f t h e f r e er e s i d u a l ( D f re e ), a t t h e c o n v e r g e n c e o f a l e a s t - s q u a r e sr e f i n e me n t . T h e n o r m a l e q u a t i o n s o f l e a s t - s q u a r e sr e f i n e m e n t a t c o n v e r g e n c e c a n b e w r i t t e n

    0 - - ( A r W A ) - 1 A T W ( f - f )= H - 1 A T W ( f - f ).

    I f t h e e r r o r s i n th e o b s e r v a t i o n s a n d t h e m o d e l a r e n o tt o o l a r g e t h e n a t r u n c a t e d T a y l o r e x p a n s i o n ma y b ew r i t te n a b o u t t h e e x p e c t e d v a l u e s o f t h e p a r a m e t e rv e c t o r ( x ) a n d t h e o b s e r v a t i o n v e c t o r ( f ) .

    i - (x ) - - H - a A r W ( f - ( f} ).T h e s t r u c t u r e a mp l i t u d e s a n d t a r g e t d i s t a n c e s c o r r e -s p o n d i n g t o t h e e x c l u d e d o b s e r v a t i o n s i n a t e s t s e t c a nb e e x p r e s s e d i n t e r m s o f t h e p a r a m e t e r e s t im a t e s b y t h et r u n c a t e d T a y l o r e x p a n s i o n ,

    - ( g ) - - n ( i - ( 1 ) )= n o - 1 A r W ( f - ( f ) )= S ( f - ( f )) . ( 1 7 )

    T h u s , t h e c o l u m n o f r e s id u a l s o f t h e e x c l u d e d o b s e r v a -t ions is given byA f~ ee - g - i

    = g - ( g ) - S ( f - ( f ) ).A s s u m i n g t h a t t h e e r r o r s i n f a n d g a r e u n c o r r e l a t e d , t h e

  • 7/28/2019 Rfree and the Rfree Ratio

    9/11

    I . J. T I C K L E , R . A . L A S K O W S K I A N D D . S . M O S S 5 55V C M o f t h e r e s i d u a ls a s s o c i a t e d w i t h t h e e x c l u d e dTo b s e r v a t i o n s Ofree -- (AfreeAfree) is given by

    Dfre e __ ( ( g _ ( g ) ) ( g _ < g ) ) T )+ ( s ( f - < r> ) ( f -

    -I S T~ --- W f r e e -3 - S W - 1 . ( 1 8 )

    Thus, Ofree i s e q u a l t o t h e s u m o f t h e V CM o f t h ee x c l u d e d o b s e r v a t i o n s a n d t h e V C M o f t h e c o r r e -s p o n d i n g q u a n t i t i e s c a l c u l a t e d f r o m t h e r e f i n e dp a r a me t e r s . F r o m e q u a t i o n ( 1 8 ) i t f o l l o w s t h a t ,

    DfreeWfree -- Ip -t- sw-lsTWfree, (19)wh ere Ip i s a un i t ma t r ix o f o rder p . Us ing the fac t tha t

    H - - A r W A ,a n d n o t i n g t h a t t h e t r a c e o f a p r o d u c t o f ma t r i c e s i si n v a r i a n t u n d e r a c yc l ic p e r m u t a t i o n o f t h e o r d e r o fma t r i x mu l t i p l i c a t i o n , w e t a k e t h e t r a c e o f b o t h s i d e s o fequat ion (19) to g ivetr(OfreeWfree ) - - p + tr (SW-1STWfree)

    = p + t r (B H - 1 A r W A H - a BrWfree )= p -q- t r (W freeB n-lB T) . (20)

    er ro rs wi l l l ead to t es t - se t res idual s wi th l a rgerv a r i a n c e - c o v a r i a n c e m a t r i c e s .

    A P P E N D I X BB 1 . T h e r a t i o o f R f r e e t o R i n u n r e s t r a i n e d r e f i n e m e n tT h e d e r i v a t i o n s i n t h e b o d y o f t hi s p a p e r h a v e b e e ng iven in t e rms o f the genera l i zed R fac to r . In th i sa p p e n d i x w e d e r i v e t h e e x p e c t e d v a l u e s o f r e s i d u a l se x p r e s s e d a s t h e s u m o f u n w e i g h t e d a b s o l u t e d i f f e r-e n c e s. H e n c e , w e o b t a i n a n e s t i m a t e o f t h e Rfree ra t ioe x p r e s s e d i n t e r ms o f t h e s t a n d a r d R f a c t o r w h i c h i sd e f i n e d a s

    R -- 2 I IF ob sli- GlF~alclilIFobsli

    T h e v a r i a n c e o f a n i n c l u d e d r e s i d u a lI IFobs l / - GIFcalcl i l a t t h e c o n v e r g e n c e o f a r e f i n e me n t(see A p p e n d i x B i n T ick le e t a L , 1998) can be wr i t t enas

    I f t h e p e x c l u d e d o b s e r v a t i o n s a r e s t r u c t u r e a m p l i t u d e sa n d w e a s s u me t h a t t h e w e i g h t ma t r i x i s d i a g o n a l , t h e ne q u a t i o n ( 2 0 ) c a n b e w r i t t e n a s

    (Of ree) - - ( i=~lWi( l fobs l i - - a l f ca lc l i ) 2 >P= p + ~ w i b T H - lb i (21)i=1

    w h e r e t h e a n g l e b r a c k e t s d e n o t e s t a t i s t i c a l e x p e c t a t i o n ,(Ofree) i s t h e e x p e c t e d v a l u e o f t h e r e s i d u a l a s s o c i a t e dw i t h t h e g i ve n p e x c l u d e d o b s e r v a t i o n s a n d h i i s the i thr o w o f B . T h e e x p e c t e d v a l u e o f a s i n g l e w e i g h t e de x c l u d e d r e s i d u a l i n t h e s u mma t i o n i s o b t a i n e d b yt a k i n g a s i n g l e d i a g o n a l t e r m f r o m e q u a t i o n ( 1 9 ) w h i c hgives

    - - o ' ~ - a ~ H - l a , .

    T o m a k e f u r t h e r p r o g r e s s w e n e e d t o a s s u m e ad i s t r ibu t ion fo r e ach res idua l IFobs l - -GlFcalc l i. I f an o r ma l d i s t r i b u t i o n i s a s s u me d , w e c a n w r i t e

    (]lFobsl i - G l F c a l c l i ) - - ( 2 / T r ) ( ( l F o b s l i - - G l F c a l c li )2 } 1 / 2 ,( 2 2 )

    a n d h e n c e ,

    < > iL [ I fobs l i - a l f c a l c l i l - - ( 2 / / r r ) E ( 4 -- Itl/TH-111i)i = 1 i = 1

    T h e s q u a r e r o o t i n t h e a b o v e s u m m a t i o n m a y b ee x p a n d e d b i n o mi a l l y t o t h e f i r s t o r d e r g i v i n g

    G a l c / I )f(2 /70 ~ o-/(1 - wi a T i n - l a i / 2 ) .i=1

    W e n o w a s s u me t h a t a i i s t h e s a me f o r a l l o b s e r v a t i o n s

  • 7/28/2019 Rfree and the Rfree Ratio

    10/11

    5 56 T H E S T A TI S TI C S O F C R O S S - V A L I D A T I O N R E S I D U A L Ss o t h a t w e c a n w r i t e P " -- L H - 1 A r W , ( 27 )

    f_ ( 2 ~ / ~ r ) ~ ( 1 - w a 2 I - I - ~ a i / 2 ) .i= 1Using equat ion (5 ) to s impl i fy the r igh t -hand s ide , wecan wr i t e

    < ~ ] ]fO b si i = 1 - - a I f c a l c I i 1 > " " 2 0 " ( f --3 ./.m/2) (23)

    By a n a l o g o u s r e a s o n i n g t h e s u m o v e r t h e p e x c l u d e dr e f l e c t i o n s c a n b e a p p r o x i ma t e d a s

    -~[ [Fo bs] i- G l ~ 2crp (f + m / 2 )i = 1 Y r f (24)

    W e h a v e n o w d e r i v e d a p p r o x i m a t i o n s f o r t h e n u m e r a -to rs o f Rinc a n d Rfree . T h e i r d e n o mi n a t o r s a r e , o na v e r a g e , p r o p o r t i o n a l t o t h e n u m b e r o f r e f l ec t i o n s in t h er e s p e c t i v e s u mma t i o n s . H e n c e , d i v i d in g e q u a t i o n ( 2 4) b ye q u a t i o n ( 2 3 ) a n d mu l t i p l y i n g b y f /p w e h a v e

    R f r e e , ~ f + m /2Rin c f - m / 2

    A P P E N D I X CC1. Min imum var ianc e we igh t s m in im i z e t he e xpe c t e dvalue o f Rfree : ,~Fi r s t w e s h o w t h a t t h e l e a s t - s q u a r e s r e f i n e me n t u s i n g

    a w e i g h t ma t r i x W w h i c h i s t h e i n v e r s e o f t h e V CM o ft h e o b s e r v a t i o n s , m i n i mi z e s t h e V CM's o f b o t h t h er e f i n e d p a r a m e t e r s ~ a n d t h e f r e e r e s i d u a ls g - ~ .Con s ider a funct ion t which is a funct ion o f the re f inedleas t - squares parameters which i s l inear to wi th in a f i r s t -o r d e r T a y lo r a p p r o x i m a t i o n ,

    ~ t - L ~ X .N o w c o n s i d e r t w o c o l u mn ma t r i c e s f i a n d ~ , d e f i n e db e l ow , w h i c h a r e b o t h u n b i a s e d e s t i ma t e s o f t.

    f i - ( fi ) - - P ( f ( f ) ) ( 2 5 )

    - (~) - - Q ( f - ( f ) ) , (26)w h e r e ,

    Q - I J - I; ~ A r U . ( 2 8 )U i s a n y w e i g h t ma t r i x a n d H u - A r U A . F r o me q u a t i o n s ( 2 7) a n d ( 2 8) a n d f r o m t h e d e f i n it i o n s o f Ha n d H u ,

    P A - - Q A . ( 29 )W e w i s h t o s h o w t h a t t h e V C M o f f i i s s ma l l e r t h a n

    tha t o f ~. Bec ause f i and e a re unb ia sed es t imators ,( f i ) - - (~) and thus the VCM of ~ can be expressed as

    = ( ( a - < a > + ~ a ) ( a - < a > + ~ - a ) ~ )- ( ( a - < a > ) ( a - < a > ) ~ ) + ( ( ~ - a ) ( ~ - a ) ~ )

    + ( ( a - < a > ) ( ~ a ) ~ ) + ( ( ~ - a ) ( a - < a > ) ~ ) . (30)T h e l a s t t w o t e r ms o f t h e a b o v e e q u a t i o n a r e t h et r a n s p o s e o f e a c h o t h e r a n d a r e e a c h z e r o ma t r i c e s a ss h o w n b y t h e f o l l o w i n g a n a l y s i s w h i c h u s e s e q u a t i o n s(25), (26), (27) and (29).

    ( ( . ~_ f i) (f i _ ( f i) ) r) = ( ( Q _ p ) ( f _ ( f ) ) ( f _ ( f ) ) r p r )= ( Q - P ) W - 1 W A H -1 L r= ( Q - p ) A H - a L r= 0 .

    H e n c e f r o m e q u a t i o n ( 3 0 ) ,( ( ~ - < ~ > ) ( ~ - < ~ > ) ~ ) = / ( a - < a / ) ( a - < a > ) ~ )

    + ( ( ~ - a ) ( ~ - a ) ~ ) .Since the VCM's a re pos i t ive def in i t e

    Thus , the VCM of f i which i s ca lcu la ted wi th W i s l es st h a n t h e V CM o f f i w h i c h i s c a l c u l a t e d w i t h a n o t h e rweigh t ma t r ix U. Mak ing the su bs t i tu t ion f i = :~ andse t t ing L to a un i t mat r ix , th i s ana lys i s shows tha t byu s i ng t h e w e i g h t m a t r i x W , w e mi n i mi z e t h e v a r i a n c e o f~, . Subs t i tu t ing f i = ~and L = B, the same analys i s showst h a t W a ls o mi n i mi z e s th e V C M o f ~ . F r o m e q u a t i o n ( 1 8)t h e V CM o f t h e r e s i d u a l s a s s o c i a t e d w i t h t h e e x c l u d e do b s e r v a t i o n s O f r e e i s the sum of the co nst ant ma trix Wfr-e~eand the V C M of ~. Hen ce , Dfree and i t s t race a re a l somi n i mi z e d b y c h o o s i n g W a s t h e w e i g h t ma t r i x . T h et r a c e o f O f r e e i s t h e e x p e c t e d v a l ue o f t h e u n w e i g h t e ds u m o f s q u a r e d r e s i d u a l s ,

    b s l i - alfcalcli) 2 ,"=

    w h e r e t h e s u m ma t i o n i s t a k e n o v e r t h e p r e f l e c t i o n s in

  • 7/28/2019 Rfree and the Rfree Ratio

    11/11

    I . J. T I C K L E , R . A . L A S K O W S K I A N D D . S. M O S S 5 57t h e t e s t s e t. B y u s i n g ~ t h e n o r m a l a p p r o x i m a t i o n i ne q u a t i o n ( 2 2) w e c a n s a y t h a t t h e s u m o f a b s o l u t ed i f f e r e n c e s

    a n d h e n c e R f ree a r e a p p r o x i m a t e l y m i n i m i z e d b yc h o o s i n g W a s t h e l e a s t - s q u a r e s w e i g h t m a t r i x .T h e a u t h o r s w o u l d l i k e to t h a n k P r o f e s s o r D . W . J.

    C r u i c k s h a n k F R S f o r h i s h e l p f u l c o m m e n t s o n t h i sp a p e r .

    R e f e r e n c e sBacchi, A., Lamzin, V. S. & Wilson, K. S. (1996). Acta Crys t .D52, 641-646.

    Ber nstein , E C., Koetzle, T. E, Williams, G. J. B., Me yer, E. E Jr,Brice, M. D., Rodgers, J. R., Kennard, O., Shimanouchi, T. &Tasumi, M. (1977). J. MoL Biol . 112, 535-542.Br~ind6n, C.-I. & Jones, T. A. (1990). N a t u r e ( L o n d o n ) , 343,687-689.Briinger, A. T. (1992). N a t u r e ( L o n d o n ) , 355, 472-475.Brtinger, A. T. (1993). Acta Crys t . D49, 24-36Dodson, E., Kleywegt, G. J. & Wilson, K. (1996). Acta Crys t .D52, 228-234.Driessen, H., Haneef, M. I. J., Harris, G. W., Howlin, B., Khan,G. & Moss, D. S. (1989). J . AppL Crys t . 22, 510-516.Kleywegt, G. J. & Brtinger, A. T. (1996). Structure, 4, 897-904.Kleywegt, G. J. & Jones, T. A. (1995a). Structure, 3, 535-540.Kleywegt, G. J. & Jones, T. A. (1995b). Brail le for pu gil is ts . InM a k i n g t he M o s t o f Y o u r M o d e l , edited by W. N. Hunter, J .M. Thorn ton & S. Bailey, pp. 11-24. Warrington: Dare sburyLaboratory.McCullagh, P. & Nelder, J. A. (1983). General i sed L inearM o d e l s , pp. 209-221. London: Chapman & Hall .Tickle, I. J., Laskowski, R. A. & Moss, D. S. (1998). Acta Cryst .D54, 243-252.