réalisation sur ordinateur d'un screening de structures moléculaires de substances...

7
Eur. J. Med. Chem. 23 (1988) 275-281 0 Elsevier, Paris 275 Article original Realisation sur ordinateur d’un screening de structures molkulaires de substances potentiellement anxiolytiques B l’aide de la technique d’autocorr6lation Gilles MOREAU, Pierre BROTO, Michel FORTIN et Corinne TURPIN Centres de Recherches Roussel Uclaf, BP 9, F-93230 RomainvilIe, France (Rep le II aoiit 1987, accept6 le 15 fkvrier 1988) R&urn6 - Nous montrons dans cet article que le descripteur d’autocorrelation topologique est particulibrement inte- ressant pour detecter de nouvelles molecules pharmacologiquement actives. Pour cela, nous avons d’abord Ctudie les relations entre la structure et l’affinite d’environ 3000 molecules pour le recepteur des benzodiazepines (RBZ). Une analyse en com- posantes principales suivie d’une analyse discriminante nous ont permis de classer correctement ces molecules a 85%. Nous avons ensuite automatise les divers traitements mathematiques de maniere a pouvoir Ctablir rapidement les predictions d’affinite de molecules nouvelles, sans refaire aucune analyse. Ce tri automatique, applique a une population de 30 000 mole- cules, a permis de selectionner 25 molecules originales presentant une affinite pour le recepteur RBZ, comprise entre 0.1 et 18 o/o de celle de la molecule de reference, le diazepam. Summary - Computer-conducted screening of molecular structures of potentially anxiolytic substances using au auto- correlation technique. In this article, we show that the autocorrelation descriptor is particularly well-adapted for the detection of new molecules which should possess some pharmacological activities. For this purpose, we first studied the relationships between the structures of almost 3000 molecules and their ajj%ities for the benzodiazepine receptor. Principal component analysis followed by discriminant analysis enabled us to classify 8.5% of these molecules correctly. Secondly, we automated the whole mathematical treatment in order to be able to quickly predict the af$nity of new molecules, without having to do other analyses. This automatic procedure has been applied to a population of 30 000 molecules, resulting in the selection of 25 original molecules which possess an af3nity for the receptor between 0.1 and 18% of that of diazepam, the rejerence molecule. autocorrelation descriptor / principal component analysis / discriminant analysis / QSAR / drug design / prediction of activity / benzcdiazepine receptor Introduction Cet article a pour but de montrer qu’il est possible de realiser grace a la methode d’autocorrelation [l] un screening automatique de molecules potentiellement actives. Le screening pharmacologique (ou biologique) est uti- lise dans l’industrie pharmaceutique pour detecter les diverses activites que presentent les molecules ; il consiste a soumettre des Cchantillons de substances provenant des laboratoires de chimie B une batterie de tests realis% in vitro ou in vivo. Un aspect particulier de ce screening est le screening sur recepteurs. 11 s’agit dans ce cas de mesurer in vitro l’affinite d’une substance pour le recepteur biologique d’un ligand endogene ou non. Ce screening permet d’optrer un premier tri: les molecules ayant une affinite significative pour un recepteur ont une chance d’avoir une action phar- macologique dans le domaine d’activid impliquant ce recepteur. Ce type de screening presente l’avantage d’etre mode- lisable plus facilement qu’un screening constitue de tests in vivo: il n’est pas utile d’envisager des phtnomenes autres que la fixation et difficiles a apprehender (metabolisation, acheminement de la substance jusqu’au recepteur, etc.). De ce fait, une molecule qui posdde de l’affinite pour un rtcepteur ne possede pas forcement une activite in vivo. Le screening automatique decrit dans cet article est le parallele du screening reel sur le rtcepteur des benzo- diazepines (RBZ) [2]: 1) Au lieu d’etre realis dans un laboratoire de pharmacologic, il est rnodelise sur un cal- culateur; 2) Chaque molecule, au lieu d’etre representee par un Cchantillon de sa substance, est representee par son vecteur autocorrelation topologique. Cette technique d’autocorrelation a CtC d&rite dam la litterature [l]. Rappelons simplement qu’elle consiste a rep&enter une molecule sous la forme d’un ensemble de proprietts atomiques distribuees sur le graphe de celle-ci. Nous avons utilise dans le cadre de cette etude, les pro- prietts classiques de la methode: volume de Van der Waals, Clectronegativite, contributions atomiques au logarithme 6

Upload: gilles-moreau

Post on 21-Jun-2016

213 views

Category:

Documents


0 download

TRANSCRIPT

Eur. J. Med. Chem. 23 (1988) 275-281 0 Elsevier, Paris 275

Article original

Realisation sur ordinateur d’un screening de structures molkulaires de substances potentiellement anxiolytiques B l’aide de la technique d’autocorr6lation Gilles MOREAU, Pierre BROTO, Michel FORTIN et Corinne TURPIN

Centres de Recherches Roussel Uclaf, BP 9, F-93230 RomainvilIe, France

(Rep le II aoiit 1987, accept6 le 15 fkvrier 1988)

R&urn6 - Nous montrons dans cet article que le descripteur d’autocorrelation topologique est particulibrement inte- ressant pour detecter de nouvelles molecules pharmacologiquement actives. Pour cela, nous avons d’abord Ctudie les relations entre la structure et l’affinite d’environ 3000 molecules pour le recepteur des benzodiazepines (RBZ). Une analyse en com- posantes principales suivie d’une analyse discriminante nous ont permis de classer correctement ces molecules a 85%. Nous avons ensuite automatise les divers traitements mathematiques de maniere a pouvoir Ctablir rapidement les predictions d’affinite de molecules nouvelles, sans refaire aucune analyse. Ce tri automatique, applique a une population de 30 000 mole- cules, a permis de selectionner 25 molecules originales presentant une affinite pour le recepteur RBZ, comprise entre 0.1 et 18 o/o de celle de la molecule de reference, le diazepam.

Summary - Computer-conducted screening of molecular structures of potentially anxiolytic substances using au auto- correlation technique. In this article, we show that the autocorrelation descriptor is particularly well-adapted for the detection of new molecules which should possess some pharmacological activities. For this purpose, we first studied the relationships between the structures of almost 3000 molecules and their ajj%ities for the benzodiazepine receptor. Principal component analysis followed by discriminant analysis enabled us to classify 8.5% of these molecules correctly. Secondly, we automated the whole mathematical treatment in order to be able to quickly predict the af$nity of new molecules, without having to do other analyses. This automatic procedure has been applied to a population of 30 000 molecules, resulting in the selection of 25 original molecules which possess an af3nity for the receptor between 0.1 and 18% of that of diazepam, the rejerence molecule.

autocorrelation descriptor / principal component analysis / discriminant analysis / QSAR / drug design / prediction of activity / benzcdiazepine receptor

Introduction

Cet article a pour but de montrer qu’il est possible de realiser grace a la methode d’autocorrelation [l] un screening automatique de molecules potentiellement actives.

Le screening pharmacologique (ou biologique) est uti- lise dans l’industrie pharmaceutique pour detecter les diverses activites que presentent les molecules ; il consiste a soumettre des Cchantillons de substances provenant des laboratoires de chimie B une batterie de tests realis% in vitro ou in vivo.

Un aspect particulier de ce screening est le screening sur recepteurs. 11 s’agit dans ce cas de mesurer in vitro l’affinite d’une substance pour le recepteur biologique d’un ligand endogene ou non. Ce screening permet d’optrer un premier tri: les molecules ayant une affinite significative pour un recepteur ont une chance d’avoir une action phar- macologique dans le domaine d’activid impliquant ce recepteur.

Ce type de screening presente l’avantage d’etre mode-

lisable plus facilement qu’un screening constitue de tests in vivo: il n’est pas utile d’envisager des phtnomenes autres que la fixation et difficiles a apprehender (metabolisation, acheminement de la substance jusqu’au recepteur, etc.). De ce fait, une molecule qui posdde de l’affinite pour un rtcepteur ne possede pas forcement une activite in vivo.

Le screening automatique decrit dans cet article est le parallele du screening reel sur le rtcepteur des benzo- diazepines (RBZ) [2]: 1) Au lieu d’etre realis dans un laboratoire de pharmacologic, il est rnodelise sur un cal- culateur; 2) Chaque molecule, au lieu d’etre representee par un Cchantillon de sa substance, est representee par son vecteur autocorrelation topologique.

Cette technique d’autocorrelation a CtC d&rite dam la litterature [l]. Rappelons simplement qu’elle consiste a rep&enter une molecule sous la forme d’un ensemble de proprietts atomiques distribuees sur le graphe de celle-ci. Nous avons utilise dans le cadre de cette etude, les pro- prietts classiques de la methode: volume de Van der Waals, Clectronegativite, contributions atomiques au logarithme

6

276

de partage octanol-eau [3], donneur ou non de liaison hydro&ne, accepteur ou non de liaison hydrog&ne, h&-o- atome ou non, connectivitk et fonctionnalitk x.

La premi6re phase de ce screening consiste B sklectionner un tchantillon de moltcules dont I’affinitC pour RBZ a CtC mesurke et & calculer leurs vecteurs autocorrklation. On cherche ensuite g skparer dans l’espace de ces vecteurs, les points A reprksentatifs des structures posstdant une bonne affinid, des points I reprisentatifs des structures n’en posskdant pas ou peu. Cette premibre phase peut btre appelte phase d’apprentissage; on y Ctablit le modble du screening automatique sous la forme de fonctions de discrimination.

La deuxibme phase consiste d p&dire l’affinitk de nou- velles molkules en n’utilisant que leurs formules dkvelop- pies et les fonctions prkctdentes.

La phase d’apprentissage

Collecte des don&es

Nous avons rassemblk les don&es relatives g environ 3000 molkcules, formules dCveloppCes et affinitk pour RBZ. La plupart de ces mokules ont CtC testkes dans notre Centre de Recherches; d’autres rksultats proviennent de la littkrature.

Afin de rendre les diverses mesures d’affinitC homogbnes entre elles, nous les avons converties en affinitk relative par rapport B une molkule de rCf&ence, le diazkpam. La formule dCveloppCe de cette molkule est don&e sur la Fig. 1; son affinitk relative est de 100%.

c\H’ 0 N

Cl Jx-- 3 -N

0 3 Fig. 1. Le diazepam, prod& de rkfkrence dans les mesures d’affinitt! pour le rkcepteur des benzodiazkpines.

Choix d’un seuil d’afJinit6

L’Ctape suivante consiste B Cvaluer un seuil d’affinitC per- mettant de rkpartir ces molkcules en deux groupes. En accord avec des pharmacologues, ce seuil a &C fixC B 1 ‘A et a conduit B la classification suivante: 1) groupe des molkules actives (groupe A): 166 moltcules prCsentant une affinitk relative suptrieure d 1 ‘A; 2) groupe des mok- cules inactives (groupe I): 2 830 molkules prtsentant une affinitk relative infkieure & 1%. Notons que la plu- part des structures inactives proviennent de ndtre fichier interne car la litterature ne dCcrit en g&&al, que les molC- cules actives.

Sklection des molkules du jeu d’apprentissage

Ce nombre de 2996 molkules est inutilement grand. D’une part, les, variations effect&es g l’inttrieur d’une

meme sCrie chimique n’apportent que peu d’information sur le plan global. D’autre part, la disproportion des effec- tifs des groupes A et I n’est pas favorable B l’ttablissement d’un modgle: si 95 % des molkules sont inactives, on a tout lieu de retenir un modgle du type cctoute molkule est inactive )>.

Nous avons done CtC amen& a rtduire le jeu d’appren- tissage. Dans le but de perdre le moins d’information possible, nous avons optrC comme suit: 1) Les 2996 vec- teurs autocorrklation ont et6 gCnCrCs, ce qui a conduit B une reprksentation des molkules sous la forme d’un nuage de points & 88 dimensions. 2) Une analyse en composantes principales [4] de ce nuage a permis ensuite d’en rkduire la dimension. Les 10 premiers facteurs contenant 82% de l’information totale, il est raisonnable de limiter la des- cription de chaque molCcule g ses composantes sur les 10 premiers facteurs. Le f@teur Fl contient k lui seul 47 % de l’information (variake) ; le facteur F2, 15 %. 3) Le nuage de points, (2996 molkules, 10 variables), a CtC analysk B l’aide d’un programme de classification ascen- dante hitrarchique CAH [4]. En utilisant la distance eucli- dienne et en sectionnant l’arbre de classification g un niveau intermtdiaire, le wage a ttC divisC en 400 classes. Ce grand nombre de classes a CtC choisi en fonction du nombre final de molkules que I’on dCsirait conserver. D’autres mkthodes, celle de Diday par exemple [4], peuvent tout aussi bien Ctre utilisCes puisque notre but n’est pas de trouver une structure naturelle sous-jacente du nuage, mais simplement de le segmenter. Si nous utilisons cou- ramment la mkthode CAH ou encore la mkthode de perco- lation de TrCmoli&res [5], c’est parce que nous avons pu apprkier la validit& des rCsultats auxquels elles conduisent: des molkules de formules dkveloppkes voisines sont bien regroupkes dans la m&me classe.

Ensuite, pour chaque classe: 1) nous avons conserv6 toutes les mokules actives, (affinitk relative supkrikure B 1 ‘A) ; 2) nous avons gardk un nombre de molkcules inac- tives au plus tgal au nombre de molkcules actives. Si dans la classe, ces molkules Ctaient les plus nombreuses, nous les. avons choisies au hasard; 3) dans le cas oti la classe n’ttait peuplke que de molkcules inactives, nous n’en avons choisi au hasard qu’une seule; les mokules d’une n&me classe &ant t&s voisines dans l’espace, n’importe quelle molkcule de la classe peut ?tre considkrke comme reprksentative.

Le rksultat de cette selection est un ensemble de 609 molkules, (166 actives et 443 inactives), qui peuplent la totalit du nuage d’origine. Les structures des moltkules actives se repartissent en 5 familles, comme l’illustre la Fig. 2. Les moltcules inactives ont, au contraire, des struc- tures t&s diverses.

Analyse en composantes principales du nuage de 609 mokkdes

A partir des vecteurs autocorrClation d’origine, nous avons refait une ACP sur le nuage des mokules s6lectionnCes prtddemment. Nous n’avons retenu que les 40 premiers facteurs (sur 88 possibles), conservant ainsi 99% de l’in- formation totale. Cette reduction de dimension du nuage permet d’tliminer les corrklations existant entre certaines

I R2

Rl

TRlAZOLOPYRlDAZlNES

92

IMIDAZO [1,2-a] PYRIMIDINES

I R3

. R4

BENZODIAZEPINES

OH 0

/R’

R2

HYDROXYQU~NOLEINES QUINOLEINES CYCLISEES ET DIV.

Fig. 2. Les principales families chimiques auxquelles appartiennent les mokcules actives.

277

propriCtCs (exemple : de liaison H ou pas).

hCtCroatome ou pas et accepteur

La Fig. 3 reprksente la projection sur le plan factoriel PI-F2 du nuage rCduit des moltcules. Ce plan contient 61% de l’information totale; cette projection constitue done une bonne image du nuage. Le facteur Fl contenant 49 % de l’information, le nuage rCduit semble reflCter correctement le nuage d’origine.

Les molkules actives sont toutes regroupkes dans la partie supkieure du nuage; la zone qui les contient, dCli- mitCe sur la Fig. 3 par un pointill&, est appelbe ((zone active D. Ce regroupement est inGressant car il constitue un dtbut de discrimination.

Interpre’tation des axes factoriels

11 est souvent difficile de donner une interpritation des axes factoriels. Cependanc dans le cas prhent, le facteur Fl est un facteur de taille: ii stpare les petites molkules des plus grosses. Les facteurs F2 et F4 reflktent des propriCtCs structurales diffkrenciant les 5 groupes de molkules actives: c’est le plan F2-8’4 qui montre la meilleure skparation de ces groupes, voir Fig. 4.

Analyses discriminantes

Le paragraphe ci-dessous a pour but de dkrire comment on peut affecter une molkcule & la classe A ou B la classe I

Fl

Fig. 3. Plan factoriel Fl-F2 issu de l’analyse en composantes principales du nuage de 609 mokules.

278

F4

l

*

*e

0% q %

*

. = 2. l 2.’ . **

- . ‘4% l = *

0. l o .I8 * :- ** i* * **

* l * **

E

t

0 o* * (

0 n

+ q * Q”*

D

* o 00 F2

**,m 0

o q

l Triazolopyridazines

It Benzodiazhpines

#r lmidazo [1,2-a] pyrimidines

0 Hydroxyquinokines

o Quinokines cyclis6es

* Zopiclone

X Carboline

Fig. 4. Plan factoriel F2-F4 issu de l’analyse en composantes prin- cipales du nuage de 609 mol&ules.

en utilisant sa description dans le syst&me des 40 facteurs d&finis prCcCdemment.

Une analyse discriminante [6] rCalisCe sur l’ensemble des 609 molkules conduit h une classification correcte pour 85% des molkcules actives et 75% des molkules inactives. Ces pourcentages correspondent B l’introduction de 11 facteurs dans la fonction discriminante; ces 11 fac- teurs, introduits pas k pas dans l’analyse, sent ceux pour lesquels le rapport covariance interclasse/covariance totale est maximum.

Cette phase consiste B exploiter les ksultats prCcCdents. Pour chaque molkule dont on ne connait que la formule dkveloppie, on calcule le vecteur autocorrklation et l’on positionne le point reprksentatif dans le nuage des 609 molkules. Si ce point est B l’extkrieur de la zone active, la molkcule est d&lake inactive. Sinon, on applique B ses coordonntes la fonction discriminante; la moltcule est dCclarCe active ou inactive si son. point reprksentatif peut &tre rattachk saris ambiguitk B l’un des deux groupes. Da&$ le cas oti ce point se situe & Cgale distance (a 5 % p&s) des ‘barycentres des deux groupes, on ne propose aucune prkdiction. De mkne, si son point reprksentatif est trop CloignC des barycentres (distance supkrieure g 3 fois la distance entre barycentres), la molkcule n’est pas classke.

De faGon g augmenter les dissimilaritts intergroupes, nous avons redkfini des classes plus difftk-encikes: 1) classe active: affinitk relative supkrieure ou Cgale & 5 % ; 110 molC- cules; 2) classe inactive: affinitC relative infkrieure ou Cgale g 0.01%; 345 molkules.

Mise en Deuvre du screening

Une nouvelle analyse discriminante faite sur ces 455 molkules donne 87 ‘A de classification correcte sur les actives et 82%, sur les inactives. L’amtlioration des scores de classification met bien en evidence la difficult6 d’affecter des molkules d’activite intermidiaire B une classe plutat qu’a l’autre.

Nous avons utilisk les programmes de 1’ADDAD [4] pour l’analyse en composantes principales et pour la classifi- cation hikrarchique; pour l’analyse discriminante, nous avons utilist le programme dCcrit dans l’ouvrage de Romeder 161.

Ces programmes ne sont pas interactifs; nous les avons modifiks sur les points suivants: 1) Standardisation des

La Fig. 5 est une illustration graphique de cette dernikre discrimination. L’axe discriminant PO, horizontal, est une combinaison lirkaire des facteurs principaux de I’ACP (I’axe vertical. orthogonal g FO. est choisi de manike B

*Note : Dans le cas de cette analyse, 110 molkules actives sont bien classkes h 85 %, 175 molkcules inactives sont bien class&es B. 75% et 170 molecules inactives sont bien classees ?I 100 %. On obtient done des pourcentages de 85 et 87% pour les classes active et inactive.

bien ttaler le nuage). 11 apparait clairement dans la partie droite du nuage, que des moltcules actives et inactives sent mClangCes ; dans leur grande majorit&, elles se situent dans la zone active dkfinie sur la Fig. 3. Au contraire, la partie gauche du nuage ne contient que des molkules inactives. La Fig. 5 n’apporte done pas d’information supplCmentaire par rapport B la Fig. 3 puisqu’elle n’est qu’une expression diffkrente du m&me phCnom&ne: la stparation de la zone active du reste du nuage.

Pour amCliorer les rksultats de la classification relative aux molkcules de la zone active, nous avons CcartC les molkules n’en faisant pas partie car celles-ci sent d&j& classkes par 1’ACP. Nous avons effectut une analyse dis- criminante locale sur la zone active (110 actives et 175 inactives). Les pourcentages de classification correcte sent de 85% pour les molkules actives et de 75% pour les inactives, avec environ 10 variables introduites dans la fonction discriminante, voir Fig. 6. Ces pourcentages sent moins bons que ceux obtenus prtckdemment; mais, compte-tenu que les moltcules situ&es en dehors de la zone active sent B coup stir inactives, done classkes correctement & 100x, on peut considtrer que cette analyse discrimi- nante est meilleure * et plus contrainte que la prCcCdente. C’est cette dernibre analyse qui nous sert B 6tablir des prkdictions.

Phase de prkdiction

279

Fig. 5. Analyse discriminante du nuage rkduit (455 molecules). Active: affinitC > 5%; inactive: affiniti: < 0.01%.

85

65

:: .A A . . L n A

. . . . . . . . . . . . . .A

: . : t’ . ‘: . . : . :

. . :: . . . . . :. . :. . . I-

. ..‘. . . . . . . . I ‘+ d . . . . . . . . . i . . . .:. . . . . . .A. .

. .:‘... :::A: . . . .o.‘, /, FO . .

. . .

. . . . .

- .

. . .’ .

. . * . . . . .

. . ‘.i : . . . :

,a . .

. .

:. . : .

. . . : . .

. . .

4 % bien class&es y ACTIVES

lb 20 30 nb de facteurs

* actives , affinit6 3 5 % 0 inactives , affinit6 go.01 %

Fig. 6. Analyse discriminante de la cczone active)> (285 molhles).

formats des fichiers utilises pour stocker les donnees ou les resultats, (fichiers d’entree et de sortie des programmes). Ceci permet, par exemple, de realiser l’analyse discri- minante (AD) d’un nuage de molecules apres ACP: les molecules sont alors d&rites par leurs composantes sur les axes factoriels issus de I’ACP. 2) Utilisation de pro- grammes interactifs pour gCnCrer les fichiers d’entree. 3) Utilisation d’un programme interactif pour exploiter graphiquement les rtsultats de I’ACP ou de 1’AD. L’objec- tif principal de ce programme est de visualiser n’importe quelle carte factorielle (F&Q) choisie par l’utilisateur sans refaire les calculs: les facteurs sont calcules et stock& une seule fois. 4) Stockage des transformations rtalisees sur les molecules afin de pouvoir positionner rapidement dans les nuages toute nouvelle molecule: a) pour l’ACP, stockage des donnees definissant le centrage-reduction prtcedant I’ACP; stockage de la matrice de transformation des anciennes coordonnees en coordonnees sur les axes factoriels; b) pour l’AD, stockage de la fonction discri- minante.

Enfin, nous avons ecrit le programme TRIMOL qui tvite de reproduire les analyses chaque fois que l’on veut soumettre a prediction des molecules nouvelles. Ce pro-

280

gramme realise le screening automatique comme suit: 1) lecture du code topologique d’une molecule; decodage pour retrouver l’ensemble des informations contenues dans la formule developpee; 2) calcul du vecteur auto- correlation; 3) prediction de l’activitt a partir des resultats de 1’ACP et de 1’AD; 4) affichage du resultat; sur option, affichage seulement si la molecule est declaree active; 5) traitement de la molecule suivante.

L’ensemble de ces programmes est install6 sur VAX 11-750. Cependant, nous avons eu ponctuellement recours a un IBM 3083 pour realiser la classification hierarchique des 2996 molecules (26 min CPU sur IBM, estimees a 30 h CPU sur un VAX 11-750).

RCsultats

Jusqu’a present, nous avons soumis au programme TRIMOL en plusieurs fois, 30 000 molecules provenant de notre fichier [7]. Environ 5 % d’entre elles ont et6 declarees actives par le programme. Parmi les molecules propodes, on a recherche celles dont un tchantillon en bon &at de conser- vation etait encore present dans notre collection. Ces Cchan- tillons ont ensuite &tC envoyes au Departement de Phar- macologie pour y Ctre reellement testes sur le recepteur RBZ.

Le programme TRIMOL a done stlectionne 1500 molecules dont 750 ont ttC testtes sur le recepteur RBZ. Finalement, 25 produits ont montrt une affinitt variant entre 0.1 et 18 %. Les structures de quelques-uns de ces produits sont donnees dans la Fig. 7. Un produit (7h) a une affinite de 10 ‘A : il est apparent& aux benzodiazepines et n’avait pas CtC test& auparavant. Deux structures derides de la methaqualone ont CtC predites actives par le pro- gramme: en fait, elles n’ont pas d’affinite pour RBZ mais, curieusement, augmentent la fixation du marqueur pour son recepteur lorsqu’elles sont mises en competition avec lui, faisant passer cette fixation de 100 a 177 % (molecule 7j) et 158 % (molecule 7k).

Le nombre de molecules reellement actives (25) compare au nombre de molecules proposees par le programme (750) peut paraitre faible puisqu’il represente environ 3%. En fait, ce pourcentage doit ttre compare a la proba- bilite de trouver des molecules ayant une affinite pour RBZ parmi une collection de molecules synthetisees pour d’autres activites pharmacologiques. 11 est t&s difficile d’evaluer cette probabilitt, neanmoins les pharmacologues la situent entre 0.1 et 1%.

Conclusion

Nous esperons avoir montre que le systeme d’autocorrb lation Ctait bien adapt6 a un screening extensif: cette tech- nique est aisement informatisable, elle se p&e bien aux analyses de don&es. Enfin les calculs ne sont pas lourds car les analyses factorielles ne sont faites que dans la phase d’apprentissage.

En plus du fait qu’elle diminue le nombre de molecules

ARL = 1.4%

i

ARL = 9%

w” ..,.I.:,

i

Cl

OH

k

Fig. 7. Structures et affinitks relatives de 12 molkules dkclarkes actives par le pr@gramme TRIMOL.

de nouvelles tCtes de series: mCme si les molecules dttecttes precedemment n’ont qu’une faible activite en compa- raison de celle du diazepam, leurs structures sont suffi- samment interessantes (parce que differentes de celle du diazepam) pour susciter un travail de pharmacomodulation. Cette etude montre aussi tout l’inttr8t que prtsente uric collection de produits chimiques dans la recherche de molt-

a tester, cette methode a l’avantage de pouvoir detecter cules originales.

281

RCfirences

Broto P., Moreau G. & Vandycke C. (1984) Eur. J. Med. Chem. 19, 61-70, 79-84 Braestruv C. & Nielsen M. (1983) in : Handbook of Psvchouharma- cology (iversen, ed.), Vol. 17, Plenum Press, New York, pp. 285 Broto P.. Moreau G. & Vandvcke C. (1984) Eur. J. Med. Chem. 19, 71-78

. ,

Programmes d’Analyses de Donnees de I’ADDAD, ADDAD, Universite P.-et-M.-Curie, 4, pl. Jussieu, 75005 Paris, France ACP:AMCOMP - Anaiyse en composantes principales nor- m&es. Analyse en composantes principales sur les correlations avec edition de 7 facteurs au plus et Bventuellement stockage des

facteurs des lignes et/au des colonnes (sans limitation du nombre de facteurs). CAH:CAH2CO - Classification ascendante hierarchique. Ce programme construit une CAH selon Ie critere de maximisation du moment cent& d’ordre 2. Les don&es peuvent &tre: un tableau de coordonnees euclidiennes, un tableau de correspondance, un tableau quelconque que le programme transformera en donnees centrees reduites. NUEDYN - Determination de partitions par les nukes dyna- miques. Ce programme est directement inspire des travaux de E. Diday. Tremolieres R. (1979) Pattern Recognition 11, 255-262 Romeder J. M. (1973) dam: M6thode.s et Programmes d’dnalyse Discriminante Dunod, Paris, pp. 37-57 Moreau G. (1980) Now. J. Chim. 1, 17