cambridge structural database csd
DESCRIPTION
Cambridge Structural Database CSD. Slimane Dahaoui. [email protected]. LCM3B (UMR UHP -CNRS 7036) Faculté des Sciences et Techniques BP 239, Boulevard des Aiguillettes 54506 Vandoeuvre-lès-Nancy CEDEX. Ecole Cristallographie 10 - 15 septembre 2006. - PowerPoint PPT PresentationTRANSCRIPT
Cambridge Structural Database
CSD Slimane Dahaoui
Ecole Cristallographie 10 - 15 septembre 2006
LCM3B (UMR UHP -CNRS 7036)Faculté des Sciences et TechniquesBP 239, Boulevard des Aiguillettes
54506 Vandoeuvre-lès-Nancy CEDEX
Brève Présentation de la CSD
Informations contenues dans la CSD
Logiciels d'interrogation de la base CSD
ConQuest
Procédure de recherche
Programme d’analyse: Mercury
Autres Logiciels de visualisation
Exemple : recherche + visualisation
Exemples : recherche + analyse
Cambridge Crystallographic Data Centre CCDC: crée en 1965 par le Dr Olga Kennard du Department of Organic, Inorganic and Theoretical Chemistry of the University
of Cambridge (UK Research Councils) Compilation de structures organiques et organo-métalliques
HistoriqueHistorique
01/01/89 la CCDC institution non lucrative indépendante Commission internationale de spécialistes
CCDC institution reconnue par la loi Anglaise (Registered Charity Number 800579) Enseignement, formation par la recherche, PhD
Mission: Création de la Cambridge Structural Database Conception de nouveaux produits scientifiques (logiciels) Diffusion de ces produits à l’échelle internationale Financement de la Recherche Scientifique Recherche fondamentale et Applications industrielles
Dr David Hartley (1997-2002) Dr Frank Allen Directeur de la CCDC depuis le 1er Octobre 2002
+ Directeur Scientifique de la CCDC
Développement Robin TaylorAdministation & Finances Steve SalisburyAssistance technique Owen JohnsonRecherche Sam MotherwellAssistante Scientifique & Marketing John W. Liebeschuetz
Distribution de la CSDPays Académique IndustrielAustralie 23 -Belgique 8 2Canada 30 -Chine 6 -France 53 7Allemagne 63 14Inde 12 -Israël 20 -Italie 37 5Japon 94 24Mexique 13 -Hollande 4 1Pologne 40 -Russie 62 -Espagne 46 1UK 41 17USA 267 51… … …… … …63 980 124
Evolution de la CSD350 000 structures
350000 composés analysés par Rayons-X et /ou neutrons
Logiciels d'interrogation de la base CSD
ConQuestnouvelle interface pour la CSD
VISTAanalyses statistiques
Mercuryvisualisation de structures
Rplutovisualisation de structures
et graphiques
DBUsebase de publications
IsoStarbase d’interactions intermoléculaires
DASHDiffraction sur poudre
Mogulvisualisation et statistiques
Inist web site : http://www.inist.frDistribution + Utilisation Online
CCDC web site : http://www.ccdc.cam.ac.uk
• The Cambridge Structural Database, Version 5.27, 2005/2006 • Version 5 CSD System Software (ConQuest, Mercury, Vista and Mogul) pour UNIX• ConQuest 1.8 pour UNIX & Windows (95/98/Me/2000/NT 4.x )• ConQuest 1.8 pour Silicon Graphics IRIX, Sun Solaris, IBM AIX 4.3, Linux
Chemical Database Service
http://cds.dl.ac.uk/
CristallographieChimie OrganiqueSpectroscopieChimie-PhysiqueLogicielsLiens
ConQuest
Recherche de structures chimiques contenues dans la CSD Recherche par géométrie (forme, liaisons, angles, torsion,…)Recherche par liaisons intermoléculaires (contacts)Recherche par auteur, composé, ...
Molécule / fragment
garder / exclure ??
Sauvegarde
Sauvegarde
Sauvegarder le résultat de la rechercherecherche1.cqs
ouvrir la recherche1.cqs
Types de fichiers à sauvegarder
Formats utilisés fréquemment
Format CIF: Crystallographic Information File
data_chapm _chemical_formula_sum 'C22 H27 Cl O10'
loop_ _symmetry_equiv_pos_as_xyz 'x, y, z' '-x+1/2, -y, z+1/2' '-x, y+1/2, -z+1/2' 'x+1/2, -y+1/2, -z' _cell_length_a 10.8814(4) _cell_length_b 11.7790(4) _cell_length_c 19.0447(8) _cell_angle_alpha 90.00 _cell_angle_beta 90.00 _cell_angle_gamma 90.00 _cell_volume 2441.00(16)
loop_ _atom_site_label _atom_site_type_symbol _atom_site_fract_x _atom_site_fract_y _atom_site_fract_z _atom_site_U_iso_or_equiv _atom_site_adp_type _atom_site_occupancy _atom_site_symmetry_multiplicity _atom_site_calc_flag _atom_site_refinement_flags
Cl1 Cl 0.7638(2) 0.3347(2) 0.83277(14) 0.1348(11) Uani 1 1 d . . . O7 O 0.8123(3) -0.1396(3) 0.67267(16) 0.0491(9) Uani 1 1 d . . . O6 O 1.0272(4) -0.3566(3) 0.82461(18) 0.0607(10) Uani 1 1 d . . . O2 O 0.6954(3) 0.0461(3) 0.62964(19) 0.0570(10) Uani 1 1 d . . . O5 O 0.8902(5) -0.2155(3) 0.8104(2) 0.0785(14) Uani 1 1 d . . . O4 O 0.7249(4) -0.2741(3) 0.5512(2) 0.0677(12) Uani 1 1 d . . . C17 C 0.9024(5) -0.2275(4) 0.6846(3) 0.0514(13) Uani 1 1 d . . . H17 H 0.9838 -0.1927 0.6894 0.062 Uiso 1 1 calc . . .
Coordonnéesfractionnaires
Format PDB: Original PDB Format
CRYST1 10.881 11.779 19.045 90.00 90.00 90.00SCALE1 0.091900 0.000000 0.000000 0.000000SCALE2 0.000000 0.084897 0.000000 0.000000SCALE3 0.000000 0.000000 0.052508 0.000000ATOM 1 CL1 0 8.311 3.943 15.860 1.000 10.64ATOM 2 O7 0 8.839 -1.645 12.811 1.000 3.88ATOM 3 O6 0 11.178 -4.201 15.704 1.000 4.79ATOM 4 O2 0 7.567 0.543 11.991 1.000 4.50ATOM 5 O5 0 9.687 -2.538 15.433 1.000 6.20ATOM 6 O4 0 7.888 -3.229 10.498 1.000 5.35ATOM 7 C17 0 9.820 -2.680 13.038 1.000 4.06ATOM 8 H17 0 10.705 -2.270 13.130 1.000 4.87
Coordonnées orthogonales
Format SHELX: Simulated SHELX.res File (.ins)
TITL chap in P2(1)2(1)2(1)CELL 0.71073 10.8814 11.7790 19.0447 90.000 90.000 90.000ZERR 4.00 0.0004 0.0004 0.0008 0.000 0.000 0.000LATT -1SYMM 0.5-X, -Y, 0.5+ZSYMM -X, 0.5+Y, 0.5-ZSYMM 0.5+X, 0.5-Y, -ZSFAC C H O CLUNIT 88 108 40 4
CL1 4 0.763820 0.334719 0.832770 11.00000 0.11832 O7 3 0.812289 -0.139644 0.672671 11.00000 0.05766 O6 3 1.027233 -0.356649 0.824605 11.00000 0.07399 O2 3 0.695421 0.046089 0.629644 11.00000 0.06006 O5 3 0.890204 -0.215452 0.810376 11.00000 0.12728 O4 3 0.724869 -0.274135 0.551237 11.00000 0.07804 C17 1 0.902449 -0.227503 0.684608 11.00000 0.05965 H17 2 0.983824 -0.192717 0.689435 11.00000 -1.20000
HKLF 4END
Coordonnéesfractionnaires
Visualisation 3D de chaque structure
Mercury
Visualisation et Manipulation de structures à 3D Projection suivant une direction Localisation et affichage des liaisons hydrogènes Empilement atomique Mesures géométriques :
Distances Angles Plans moyens
Successeur du Programme PLUTO
!! Problème de visualisation 3D pour la CSD et Mercury !!
http://www.ccdc.cam.ac.uk/prods/mercury/index.html
Installer le programme Mercury sur votre PC (plus rapide)
Autres Logiciels de visualisation
Ortep-III pour Windows (32-bit executable) + Interface POV-Ray Windows (95/98/NT/ME/2000/XP) - Version 1.075 (10 juillet 2002)
http://www.chem.gla.ac.uk/~louis/software/ortep3/index.html
Formats : SHELX (.res / .ins), GX, CIF, SPF, CRYSTALS, CSSR-XR, CSD-FDAT,
GSAS, Sybyl MOL, XYZ, PDB, Rietica-(LHPM) et Fullprof.
http://www.cryst.chem.uu.nl/platon/
PLATONWindows (95 /98 /ME /NT /2000 /XP) & Unix
Formats : SHELX (.res / .ins), CIF
http://www.chem.gla.ac.uk/~louis/software/struplo/index.html
STRUPLOWindows (95 /98 /ME /NT /2000 /XP)
Formats : SHELX (.res / .ins), GX, CIF, SPF, CRYSTALS, CSSR-XR, CSD-FDAT,
GSAS, Sybyl MOL, XYZ, PDB, Rietica-(LHPM) et Fullprof.
SCHAKALWindows (95 /98 /ME /NT /2000 /XP), Unix, Linux
Formats : SHELX (.res / .ins), CSD, ICSD, PDB, et CIF
http://www.krist.uni-freiburg.de/ki/Mitarbeiter/Keller/index.html
http://www.umass.edu/microbio/rasmol/
RasMolWindows (95 /98 /ME /NT /2000 /XP), Unix, Linux
Format : PDB
http://www.chem.gla.ac.uk/~louis/software/wingx/index.html
WinGXWindows (95 /98 /ME /NT /2000 /XP), Unix, Linux
CAMERON ORTEP RasMoL POV-Ray
+ autres programmes d’analyse/affinements de structuresSHELX, SIR, ABSORB, ...
WebLab Viewer / ViewerProWindows (95 /98 /ME /NT /2000 /XP)
Formats : MSV, PDB, MOL, CAR, CSD, MOL2, MSF, MSI, CPD, CHM, CIF, XYZ, SKC, GRD, WVC
http://www.accelrys.com/weblab/viewer/activex.html
http://pymol.sourceforge.net/
PyMolWindows (95 /98 /ME /NT /2000 /XP), MaC, Linux
Format : PDB
Sites Web intéressants
http://www.ccp14.ac.uk/mirror/mirror.htm
http://www.iucr.org/sincris-top/logiciel/
http://www.chem.gla.ac.uk/~louis/software/
http://www.accelrys.com/about/msi.html
http://www.iumsc.indiana.edu/graphics/graphics.html
http://cds.dl.ac.uk/
http://www.lcm3b.uhp-nancy.fr/
IsoStarbase d’interactions intermoléculaires / drug design
Données expérimentales et théoriques à partir de Cambridge Structural Database (CSD)
Brookhaven Protein Data Bank (PDB)
Calculs d’orbitales moléculaires
distribution des groupements O-H autour d’une liaison peptide
distribution d’atomes C, H, N, O et S
autour de la molécule « uracil »
DBUsebase de publications scientifiquesutilisants les produits de la CSD
VISTAAnalyses Statistiques
Exemple 1
1- Recherche dans la CSDà sauvegarder distance: Fe-Xdéfinir plan moyen des 4 atomes Nsauvegarder la distance (plan-Fe)
2- VISTAHistogramme de Fe-X
3- idem pour Fe en coordination 6
Porphyrine
Fe
X
Fe: coordination 5X: atome quelconque
Exemple 2: Interactions intermoléculaires
1- Recherche dans la CSDdistances O…H et O…Nangles O…H-N et C-O…H
2- VISTAHistogramme : O…H et O…NO…H en fonction de O…H-N (scattergram)
N coordination 3liaisons intermoléculaires < 2.1 Å
O
C
C
C
HC
N
C
S─S 2.0472(4) Å
C─S─S─C 75.18(5) °
S─S 2.039(2) Å
C─S─S─C 75.5 (2.5) °
CSD 166 structures
C─S─S─C 0°
S─S Liaison longue (répulsion)
Angle entre le plan contenant paires libres du S et le vecteur S…S
Angle entre le plan passant par S, S et Cet la projection du vecteur S…S sur le plan contenant les paires libres de S
Hybridation sp3 = 0° et = ± 120°
CSD notre étude
= 37° et = ± 160°
= 35° et = -163°
> 0 et < 0 S…S contact < rayon de van der Walls+ S…S // S─S
Étude statistique réalisée sur la liaison N ─ H···π
H
N
Hcen
CNHN
H
NHCen
Normale NCen
HPLAN
C
χ
H
Normale au plan
CN
CNH2
Critères de recherche: C cyclique NHCen supérieur à 130° Hcen allant de 2.45 Å à 2.9 Å HPLAN allant de 2.45 Å à 3.2 Å
35 entrées obtenues dans la « Cambridge Crystallographic Data Bank », version 1.5 mise à jour en Novembre 2002
NH2NH2
Benzidine
Résultats de l’étude statistique réalisée sur la liaison N ─ H···π
H
N
Hcen
HN
Normale NCen
HPLANχ
La benzidine comporte les distances les plus courtes. C’est donc dans ce composé que les liaisons hydrogène faibles sont les plus « fortes ».
Les interactions du type N ─ H···π ont tendance à placer à la verticale du cycle les atomes H, donc à minimiser la distance H – accepteur.
Dans la grande majorité des cas, les atomes d’azote des groupes amines sont de forme pyramidale : Ceci est du au fait que la force du donneur dépend de son hybridation,plus l’hybridation est élevée, plus l’atome est un donneur faible et donc plus les distances le séparant de l’atome accepteur sont grandes.
Merci