embl heidelberg annotation und klassifikation nuklearer domänen tobias doerks
TRANSCRIPT
EMBL Heidelberg
Annotation und Klassifikation nuklearer Domänen
Tobias Doerks
EMBL Heidelberg
Systematische Annotation bekannter nuklearer Domänen . und Implementation in die Domänendatenbank Smart
Identifikation und funktionelle Analyse . unbekannter (nuklearer) Domänen
Annotation und Klassifikation nuklearer Domänen (1)
Semi-automatische Analyse aller nuklearen Proteine
EMBL Heidelberg
Eine Domäne ist eine evolutiv konservierte
strukturelle und funktionelle Einheit
PMS1_HUMAN
UBF1_HUMAN
WHSC1
Annotation und Klassifikation nuklearer Domänen (2)
Definition – Domäne:
eine sich unabhängig faltende Region eines Proteins
ein abgrenzbar homologer Bereich in Proteinen mit
unterschiedlicher modularer Architektur
EMBL Heidelberg
Annotation und Klassifikation nuklearer Domänen (3)
Definition – nuklear:
80% nuklear in SwissProt
Literatur
EMBL Heidelberg
Systematische Annotation bekannter nuklearer Domänen und Implementation in die
Domänendatenbank Smart (1)
Erstellung von Alignments
Generierung von HiddenMarkovModels
Systematische Annotation und
Implementation (2)
118 (164) nukleare Domänen in mehr als 50000* Proteinen
(J. Schultz, R. R. Copley, T. Doerks,
C. P. Ponting, P. Bork Nucleic Acids Res 2000
Jan 1;28(1):231-234)
(I.Letunic, L. Goodstadt, N.J. Dickens, T.Doerks,
J. Schultz, R.Mott, F. Ciccarelli, R:R: Copley
C.P. Ponting, P. Bork Nucleic Acids Res 2002
Jan 1; 30(1):1-3
* Aktualisiterter Stand Januar 2003* Aktualisiterter Stand Januar 2003
EMBL Heidelberg
- Gesamthäufigkeit
- Evolution
- Verteilung in unter- schiedlichen Spezies
Systematische Annotation und
Implementation (3)
EMBL Heidelberg
- 3D-Struktur
- Literatur
Systematische Annotation und
Implementation (4)
- Krankheitsrelevanz
EMBL Heidelberg
L27, eine neue Hetero-Dimer-bildende Domäne in . den Rezeptor-Targeting-Proteinen Lin-2 and Lin-7
Identifikation und funktionelle Analyse unbekannter (nuklearer) Domänen (1)
EMBL Heidelberg
L27, eine neue
Hetero-Dimer-bildende Domäne in .
den Rezeptor-Targeting-Proteinen
Lin-2 and Lin-7
(Doerks T, Bork P, Kamberov E, Makarova O, Muecke S, Margolis B Trends Biochem Sci 2000 Jul;25(7):317-318)
-Heterotrimerkomplex aus Guanylatkinase Lin-2, Lin-7 und Lin-10
-Transport des Wachstumsfaktor Let-23 zur basolateralen MembranLet-23 zur basolateralen Membran von Epithelzellenvon Epithelzellen
Lin2-like proteinsLin2-like proteins
Lin7-like proteinsLin7-like proteins
other proteinsother proteins
EMBL Heidelberg
L27, eine neue Hetero-Dimer-bildende Domäne in . den Rezeptor-Targeting-Proteinen Lin-2 and Lin-7
Identifikation und funktionelle Analyse unbekannter (nuklearer) Domänen (2)
GRAM, eine neue Domäne in Glucosyltransferasen, ..Myotubularinen und anderen Membran-assoziierten Proteinen
(Doerks T, Strauss M, Brendel M, Bork P Trends Biochem Sci 2000 Oct;25(10):483-5)
GRAM, eine neue Domäne
in Glucosyltransferasen,
Myotubularinen und anderen
Membran-assoziierten
Proteinen
EMBL Heidelberg
EMBL Heidelberg
L27, eine neue Hetero-Dimer-bildende Domäne in . den Rezeptor-Targeting-Proteinen Lin-2 and Lin-7
Identifikation und funktionelle Analyse unbekannter (nuklearer) Domänen (3)
GRAM, eine neue Domäne in Glucosyltransferasen, ..Myotubularinen und anderen Membran-assoziierten Proteinen DDT, eine neue DNA-bindende Domäne in unterschiedlichen ..Transkriptionsfaktoren, Chromosom-assoziierten und ..anderen nuklearen Proteinen
(Doerks T, Copley R, Bork P 2001
Trends Biochem Sci 26, 145-146)
DDT, eine neue
DNA-bindende Domäne in
unterschiedlichen
Transkriptionsfaktoren,
Chromosom-assoziierten
und anderen nuklearen
Proteinen
EMBL Heidelberg
EMBL Heidelberg
L27, eine neue Hetero-Dimer-bildende Domäne in . den Rezeptor-Targeting-Proteinen Lin-2 and Lin-7
Identifikation und funktionelle Analyse unbekannter (nuklearer) Domänen (4)
GRAM, eine neue Domäne in Glucosyltransferasen, ..Myotubularinen und anderen Membran-assoziierten Proteinen DDT, eine neue DNA-bindende Domäne in unterschiedlichen ..Transkriptionsfaktoren, Chromosom-assoziierten und ..anderen nuklearen Proteinen
BSD, eine neue putativ DNA-bindende Domäne in . Transkriptionsfaktoren, Synapsen-assoziierten ..und anderen hypothetischen Proteinen
EMBL Heidelberg
BTF2-like transcription factorsYeast, Arabidopsis, C. elegans, Drosophila and human
Arabidopsis, C. elegans, Drosophila and human
Proteins with homology to Synapse-associated proteins of Drosophila
Arabidopsis,
BTB-domain-containing proteins Arabidopsis,
Dos2-like proteins in Yeast, Arabidopsis, C. elegans and human and other hypothetical proteins Paramecium and Leishmania
BSD
BSD
BSD
BSD
BSD
BSD
BSD, eine neue putativ
DNA-bindende Domäne in
Transkriptionsfaktoren,
Synapsen-assoziierten
und anderen
hypothetischen Proteinen
(Doerks T, Huber S, Buchner E, Bork P
2002 Trends Biochem Sci 27, 168-170)
Automatisches Homologie-basiertes Gruppieren aller
unbekannten Regionen nuklearer Proteine
Ergebnis ohne iterative
PSI-BLAST-Suchen :
aus ~15000 Sequenzen
~ 4000 cluster
~ 150 in unterschiedlichem
Domänen-Kontext
~ 8 neue Domänen
Ergebnis mit iterativen
PSI-BLAST-Suchen :
aus ~15000 Sequenzen
~10000 cluster
~ 400 in unterschiedlichem
Domänen-Kontext
~ 20 neue Domänen
Semi-automatische Analyse aller nuklearen Proteine (1)
EMBL Heidelberg
Semi-automatische Analyse aller nuklearen Proteine (2)
Klassifizierung 28 neuer Domänen
15 neue Domänen in verschiedenen Proteinfamilien in . unterschiedlichen Spezies und molekularem Kontext
3 spezies-spezifische Domänen
7 neue Subfamilien
3 N- oder C- terminale Domänen-spezifische Extensionen
28 neue Domänen in mehr als 1800 Proteinen*
EMBL Heidelberg
Semi-automatische Analyse aller nuklearen Proteine (3)
Funktionsvorhersagen für 20 von 28 Domänen (1400* Proteine)
4 Domänen mit enzymatischer Funktion 4 Protein/Protein-Interaktionsdomänen 8 RNA/DNA-Bindungsdomänen 4 Metallionen-Bindungsdomänen
5 Domänen mit möglicher Krankheitsrelevanz
10 Domänen sind nukleusspezifisch lokalisiert
18 Domänen sind im Nukleus oder Cytosol lokalisiert
(Doerks T*, Copley R R*, Schultz J, Ponting C P, Bork P Genome Res 2002 Jan;12(1):47-57) *die Autoren sind gleichberechtigt beteiligt an der Publikation
EMBL Heidelberg
Weitere Projekte und Kollaborationen
Analyse von Steroid-Hormonrezeptoren als Teil des
Humangenomprojektes (International Human Genome Sequence Consortium 2001 Nature 15, 860-921)
Kollaboration mit E. Izauralde Gruppe (Genexpression EMBL)(Stutz F, Bachi A, Doerks T, Braun I C, Seraphin B, Wilm M, Bork P, Izauralde E 2000 RNA 6, 638-650)
(Suyama M, Doerks T, Braun I C, Izauralde E, Bork P 2000 EMBO Reports 1, 53-58)
Re-Annotation des Mycoplasma pneumoniae Genoms(Dandekar T, Huynen M, Regula J T, Ueberle B, Zimmermann C U, Andrade M A, Doerks T, Sanchez-Pulido L, Snel B, Suyama M, Yuan Y P, Herrmann R, Bork P 2000 Nucleic Acids Res 28, 3278-3288))
Analyse von Spir (Actin organizer)(Kerkhoff E, Simpson J C, Leberfinger C B, Otto I M, Doerks T, Bork P, Rapp U R, Raabe T, Pepperkok 2001 Curr Biol 11 (24), 1963-8)
Kollaboration mit M. Vingron, theorethische Bioinformatik DKFZ(Nicodeme P, Doerks T, Vingron M 2002 Bioinformatics 18, 161-171)
EMBL Heidelberg
Zusammenfassung
Systematische Annotation von 108 nuklearen Domänen . und Implementation in die Domänendatenbank Smart
Identifikation und funktionelle Analyse von 4 ..unbekannten Domänen (2 signalling, 2 nuklear)
Semi-automatische Analyse aller nuklearen Proteine und . Identifikation von 28 neuen Domänen in 1800* Proteinen
EMBL Heidelberg
Danksagung
Gutachter der schriftlichen Arbeit und die Prüfer
Mitglieder der Bioinformatik-Arbeitsgruppe von Peer Bork
Peer Bork
Anna Starzinski-Powitz
EMBL Heidelberg
EMBL Heidelberg
EMBL Heidelberg
EMBL Heidelberg
MAGUKMAGUK
Cask_b mm 405 ACask_b mm 405 AVVQQRARAKKEEVVLLEEEEIISCYPE[1]NDSCYPE[1]NDAAKEKELLKRIKRILLTQ PHTQ PHFFMAMALLLLQQTTHHDDVVVVAHEVYSDEALR O70589 AHEVYSDEALR O70589
P55T/PALS2_b mm 56 NP55T/PALS2_b mm 56 NLLEELVLVNNEEIILLEDEDIITPLIS[2]ENTPLIS[2]ENVVAEAELLVGIVGILLKE PHKE PHFFQSQSLLLLEEAAHHDDIVIVASKCYDSPPSS AAD45009ASKCYDSPPSS AAD45009
Camguk_b dm 405 ACamguk_b dm 405 AVVGGRCRCRRDDVVLLEQEQLLSSTSG[7]YASSTSG[7]YAKKEEEELLMRLMRLLLAA PHAA PHMMQAQALLLLHSHSHHDDVVVVARDVYGEEALR Q24210ARDVYGEEALR Q24210
Dlg3_b hs 68 ADlg3_b hs 68 AVVAALALAEEDDVVMMEEEELLQAASV[1]SDEREQAASV[1]SDERELLLQLLQLLLST PHST PHLLRARAVLVLMMVVHHDDTVTVAQKNFDPVLPP Q13368AQKNFDPVLPP Q13368
Dlg2_b hs 91 NDlg2_b hs 91 NLLEELVLVQQEEIILLRDRDLLAQLAE[2]STAQLAE[2]STAAAEAELLAHIAHILLQE PHQE PHFFQSQSLLLLEETTHHDDSSVVASKTYETPPPS Q14168ASKTYETPPPS Q14168
LIN2_b ce 421 TSTLIN2_b ce 421 TSTLRLRKKEETTLLNQNQIIDGLLG[2]PEDGLLG[2]PEAALELELLRQLRQLLLNS PHNS PHLLASASCVCVQQALALDDVVVVVCEIRDPKNEA P54936VCEIRDPKNEA P54936
PALS1_b hs 186 VQDPALS1_b hs 186 VQDLVLVQQEEVQTVVQTVLLKPVHQ KEGQEKPVHQ KEGQELLTALTALLLNA PHNA PHIIQAQALLLLLLAAHHDDKVKVAEQEMQLEPIT AF199008AEQEMQLEPIT AF199008
HSZZ27178 hs 15 AHSZZ27178 hs 15 AAAAALALADDDDLLAAEEEELLQNKPL[1]SEQNKPL[1]SEIIRERELLLKLLKLLLSK PNSK PNVVKAKALLLLSSVVHHDDTTXAQKNYDPVLPP AA322046XAQKNYDPVLPP AA322046
Cask_a mm 346 ACask_a mm 346 AVVSQSQVVLLDDSSLLEEEEIIHALTD[3]KDHALTD[3]KDLLDFDFLLHSVHSVFFQD QHQD QHLLHTHTLLLLDDLYLYDDKIKINTKSSPQIRNP O70589NTKSSPQIRNP O70589
LIN-7LIN-7
LIN-7 ce 120 DLIN-7 ce 120 DVVQQRIRILLEELLMMEHEHVVQKTGE[3]AKQKTGE[3]AKLLASASLLQQVQQVLLQS EFQS EFFFGAGAVRVREEVYVYEETVTVYESIDADTTPE CAA22459 YESIDADTTPE CAA22459
LIN-7-BA rn 15 DLIN-7-BA rn 15 DVVAARARAIIEELLLLEKEKLLQESGE[3]HKQESGE[3]HKLLQSQSLLKKVKKVLLQS EFCTAQS EFCTAIRIREEVYVYQQYMYMHETITVNGCPE Q9Z251HETITVNGCPE Q9Z251
hypLIN7 sm 1 hypLIN7 sm 1 .............RCPE[3]SK .............RCPE[3]SKLLAAAALLQRIQRILLQS DFCDMQS DFCDMIRIREEVYVYEEHIHIYTTVDINGSEE O17458YTTVDINGSEE O17458
HPTHPT
rdea dd 26 Erdea dd 26 EKKEEFTFTFFEELLLLDSDSYYISSVE EHISSVE EHLLPEPELLLNSLNSFFEA [1]DLEA [1]DLKKGAGAVLVLHSHSHHDDIKIKGSSSYIGCEAV O77083GSSSYIGCEAV O77083
EVGS_ECOLI ec 1098 DEVGS_ECOLI ec 1098 DLLQQLMLMQQEEIILLMTMTFFQHETH KDQHETH KDLLPAPAAAFQAFQALLEA [1]DNEA [1]DNRRTFTFHHQCQCIIHHRRIHIHGAANILNLQKL P30855GAANILNLQKL P30855
ATHP3 at 38 NPDATHP3 at 38 NPDFVFVSQVSQVVVTLTLFFFQDSD RIFQDSD RILLNDNDLLSLSSLSLLDQ [3]DFDQ [3]DFKKKVDPHKVDPHVVHHQQLKLKGSSSSIGAQRV Q9ZNV9GSSSSIGAQRV Q9ZNV9
Consensus (80%) .hthh.-.hpph.t..t....ph..L.t.hpp......ht.hhthaphhttt...s....Consensus (80%) .hthh.-.hpph.t..t....ph..L.t.hpp......ht.hhthaphhttt...s....
Sec.struc.pred.(2lin) ..hHHHHHHHHHH.......HHHHHHHHHHh.....HHHHHHHHHHHHHhhhh.......Sec.struc.pred.(2lin) ..hHHHHHHHHHH.......HHHHHHHHHHh.....HHHHHHHHHHHHHhhhh.......
Sec.struc.pred.(7lin) .HHHHHHHHHHHHH......HHHHHHHHHHHH....HHHHHHHHHHHh............Sec.struc.pred.(7lin) .HHHHHHHHHHHHH......HHHHHHHHHHHH....HHHHHHHHHHHh............
Sec.struc.(1a0b) ..HHHHHHHHHHHHHHH...HHHHHHHHHHHH.....HHHHHHHHHHHHHHHHHH.....Sec.struc.(1a0b) ..HHHHHHHHHHHHHHH...HHHHHHHHHHHH.....HHHHHHHHHHHHHHHHHH.....
L27
EMBL Heidelberg
FIP1 at 138 KVFIP1 at 138 KVFFKQTKQTFFD----D----CCLPDLPDEEKKLLLLKT------KT------YYAACCYYLLSTS--------------AGPSTS--------------AGPVVLLGGVVMMYYLLSSTHTHKLAKLAFFSSSSDNPLSYKE--GEQTLWSYYKDNPLSYKE--GEQTLWSYYKVVVVLLPPAANQNQLLKAKAVVNPST Q9SE96NPST Q9SE96
T31B5_20 at 143 SLT31B5_20 at 143 SLFFRQIRQIFFG----TEPNG----TEPNEETTLKLKKT------KT------FFAACCYYLLSTT--------------TGPSTT--------------TGPVVAAGGTTVVYYLLSSNANARVARVAFFCCSSDDRRPLYFTAP-SGQESWSYYRPLYFTAP-SGQESWSYYRVVVVVVPPLLANANVVATATVVNPVV CAB86627NPVV CAB86627
ARP hv 229 KLARP hv 229 KLYYKQTKQTFFG----SGPDG----SGPDEEHHVKVKKT------KT------FFAACCYYLLSTA--------------TGPSTA--------------TGPVVAAGGTTLLYYLLTTNTNNTNVAVAFFCCSSDDRRPLSFAAP-SGQTAWSYYKPLSFAAP-SGQTAWSYYKVVMMIIPPLLAKAKLLAAAAVVEPVT Q9ZTW0EPVT Q9ZTW0
UGT51B1a pp 196 EKUGT51B1a pp 196 EKLLKTTKTTFFD----D----LLSDDSDDDDEEFVFVND------ND------YYPPCCWWLLLH---------------ELH---------------EVVFFLLQQGGHHIIYYIITTSRSRYLLYLLYYFFAFAFLLPKRDS--------------------------- Q9Y751aPKRDS--------------------------- Q9Y751a
UGT51C1 ca 296 DKUGT51C1 ca 296 DKLLQRVQRVFFD----D----LLSDESDEDDTTFCFCGN------GN------YYSSAAWWLLIK---------------DIK---------------DVVLLLLQQGGHHVVYYLLTTKDKDALLALLYYFFAFAFLLPKRFS--------------------------- Q9Y752aPKRFS--------------------------- Q9Y752a
L9470.23a sc 187 AKL9470.23a sc 187 AKLLRQRRQRFFC----C----LLDEQDEQEEPPFLFLND------ND------FFPPAAWWLLLK---------------DLK---------------DVVLLVVQQGGHHIIFFIITTTKTKHFLHFLFFFFAYAYLLPKNPR--------------------------- Q06321aPKNPR--------------------------- Q06321a
UGT52 dd 207 IKUGT52 dd 207 IKIIKNKKNKLLG----G----LLPADPADEEVVLILITW------TW------FFNNCCTNFKG--------------AQLTNFKG--------------AQLKKYYGGFFLLYYIISSNNNNNNICICFFRRSSKKFFGFQKR----- ------TGFQKR----- ------TIIVVIIPPLLSQSQVVIEIEIIKKYS Q9XYD4KKYS Q9XYD4
YHO0_YEAST sc 548 AEYHO0_YEAST sc 548 AEFFHAIHAIFFKDS-GKDS-GVVSPNSPNEERRLILILD------LD------HHSSCCAALLSR---------------DSR---------------DIILLLLQQGGRRMMYYIISSDQDQHIHIGGFFYYSSNNIILGWVS------------TLGWVS------------TVVFFIIPPFFKTKTIIVQVQIIEKRA P38800EKRA P38800
D9798.13 sc 647 SED9798.13 sc 647 SEFFHTLHTLFFKDC-DKDC-DIINPNNPNEEKKLILIVD------VD------HHSSCCAALLSR---------------DSR---------------DIILLLLQQGGRRMMYYIISSDADAHIHIGGFFFFSSNNIILGWVS------------TLGWVS------------TVVFFIIPPFFKEKEIIVQVQIIEKKT Q06681EKKT Q06681
KIAA0767 hs 440 GNKIAA0767 hs 440 GNFFHEIHEIFFN----N----LLTENTENEERPRPLLAVCENG--AVCENG--WWRRCCCCLLINRDRKMPT--------DINRDRKMPT--------DYYIIRRNNGGVVLLYYVVTTENENYLCYLCFFEESSSSKKSGSSKR-----------NSGSSKR-----------NKKVVIIKKLLVDVDIITDTDIIQKYK Q9Y4B9QKYK Q9Y4B9
VRP hs 42 EFVRP hs 42 EFFFRAFRAFFFR----R----LLPRKPRKEEKKLHLHAV------AV------VVDDCCSSLLWTPFS------------RWTPFS------------RCCHTAHTAGGRRMMFFAASSDSDSYICYICFFAASSRREDGCC-------------KEDGCC-------------KIIIILLPPLLREREVVVSVSIIEKME O95759EKME O95759
KIAA0676a hs 154 LKKIAA0676a hs 154 LKMMRKQRKQFFG----G----MMPEGPEGEEKKLVLVNY------NY------YYSSCCSSYYWKG--------------RWKG--------------RVVPPRRQQGGWWLLYYLLTTVNVNHLCHLCFFYYSSFFLLLGKEV------------SLGKEV------------SLLVVVVQQWWVDVDIITRTRLLEKNA O75163 EKNA O75163
KIAA0676b hs 300 ECKIAA0676b hs 300 ECYYRATRATFFR----R----LLPRDPRDEERRLLDGH------TSDGH------TSCCTTLLWTPFN------------KWTPFN------------KLLHHIIPPGGQQMMFFIISSNNNNYICYICFFAASSKEEDAC-------------HKEEDAC-------------HLLIIIIPPLLREREVVTITIVVEKAD O75163 EKAD O75163
Y45F10A.6a ce 166 EKY45F10A.6a ce 166 EKFFHKSHKSFFS----S----IIPPDPPDEEKKLVLVNY------NY------YYKKCCCCLLWKG--------------KWKG--------------KVVPPAAQQGGDDLLFFLLSSVNVNFLCFLCFFHHAFAFMMMGNET------------KMGNET------------KIIKKLLKKWWTDTDIIVRVRLLERVS O62462 ERVS O62462
Y45F10A.6b ce 321 DAY45F10A.6b ce 321 DAFFRCQRCQFFN----N----LLPLTPLTEEKKLLDGD------TQDGD------TQCCRRLLFTPYD------------RFTPYD------------RRRHHVVPPGGKKLLFFVVSSANANFVCFVCFFAASSRTERLV-------------SRTERLV-------------SIIVVVVPPLLIEIEVVTSTSIIEECS O62462 EECS O62462
CG7324a dm 136 SKCG7324a dm 136 SKFFRQIRQIFFK----K----MMPEEPEEEERRLVLVIS------IS------YYSSAATTYYVKN--------------KVKN--------------KIIPPRRQQGGQQLLYYIISSLNLNHVCHVCFFYYSSYYMMLGQEI------------KLGQEI------------KRRIIIIRRFFAEAELLEDEDIISRNA Q9VP46 SRNA Q9VP46
CG7324b dm 282 EECG7324b dm 282 EEFFRIYRIYFFR----R----LLPQSPQSEEIIIIDGK------DGK------IIKKAANNIIWTPYS------------KWTPYS------------KRRFNSFNSGGFFIIYYLLSSPNPNFFCFFCFFRRSSDDVVKDLV-------------SKDLV-------------SVVVVIIPPMMKTKTIIKSKSVVEKKD Q9VP46 EKKD Q9VP46
MIC1_YEAST sc 29 EKMIC1_YEAST sc 29 EKFFRLKRLKYYK----K----LLPANPANEENNILILEDTNAEVSEDTNAEVSFFATSATSIIKDGKGHSDRVNNKGRKTAKDGKGHSDRVNNKGRKTAYYVVYYSSGGRRLLFFLLTTPHPHFLVFLVFFRRDADAFFDHSSC------------VDHSSC------------VLLIILLNNIISTSTIIKRKRVVERSP P53258ERSP P53258
C1259.11C sp 20 LDPASFC1259.11C sp 20 LDPASFFFR----R----IINKQNKQEEEEIIIIAS------TVAS------TVCCEEIIGWE--------------YSKSFGWE--------------YSKSFGGNNAAYYIICTSCTSFLCFLCFFHHSSDDFKT--------------RDDFKT--------------RFFTTFFPPLLAAAAVVRKRKLLEREN O94711 EREN O94711
** **** **
MTM1_HUMAN hs 29 RDMTM1_HUMAN hs 29 RDLLTEATEAVVP----P----RRLPGLPGEETTLILITD--KEVITD--KEVIYYIICCPPFFNG-----------------PNG-----------------PIIKKGGRRVVYYIITTNYNYRLYLRRLYLRSS--LLETDSSL-----------IETDSSL-----------ILLDDVVPPLLGVGVIISRSRIIEKMG Q13496EKMG Q13496
MTMR1 hs 90 AQMTMR1 hs 90 AQMM-EE-EEAAP----P----LLFPGFPGEESSIKIKAI-VKDVMAI-VKDVMYYIICCPPFFMG-----------------AMG-----------------AVVSSGGTTLLTTVVTTDFDFKLYKLYFFKKN-N-VVERDPHF-----------IERDPHF-----------ILLDDVVPPLLGVGVIISRSRVVEKIG AJ224979EKIG AJ224979
SBF_DM dm 922 PKSBF_DM dm 922 PKIIQTPQTPCC----------LLLPGLPGEEDDLVLVTD-----HTD-----HLLRRCCFFLLMPDGREDE------TQCLMPDGREDE------TQCLIIPPAAEEGGAALLFFLLTTNYNYRVIRVIFFKKGSPCDPLFCEQ-------VIVGSPCDPLFCEQ-------VIVRRTTFFPPIIASASLLLKEKKIS AE003693LKEKKIS AE003693
SBF1 hs 656 PKSBF1 hs 656 PKLLLRPLRPRRL----L----LLPGEPGEEECCVLVLDG------DG------LLRRVVYYLLLPDGREEGAGGSAGGPALLPDGREEGAGGSAGGPALLLPPAAEEGGAAVVFFLLTTTYTYRVIRVIFFTGMPTDPLVGEQ-------VVVTGMPTDPLVGEQ-------VVVRRSSFFPPVVAAAALLTKEKRIS AAC39675TKEKRIS AAC39675
SBF_CE ce 788 GNSBF_CE ce 788 GNFF-DP-DPVV----------LLAHGAHGEEFFLILISD-----PSD-----PIIDDCCYYLLLTSIEESE-MSLNRLENLLTSIEESE-MSLNRLENLLLPPAADDGGSSLLFFLLTTNYNYRVIRVIFFKKGKSVDINATNG-------TIVQTGKSVDINATNG-------TIVQTIIPPLLYSYSMMESESFFKKLT AAC67405KKLT AAC67405
Consensus 80% ..hpp.a.....h...-phh.p......a.s.h.p...............ph.h.G.haho..hhsFhu.h..................h.h.h.ph..hp...Consensus 80% ..hpp.a.....h...-phh.p......a.s.h.p...............ph.h.G.haho..hhsFhu.h..................h.h.h.ph..hp...
Sec.struct.pred. ...ee.............ee........eEEEEe....................eEEEEEE.eEEEEEe.............hhhhhhhhhhhhhhhhhhh... Sec.struct.pred. ...ee.............ee........eEEEEe....................eEEEEEE.eEEEEEe.............hhhhhhhhhhhhhhhhhhh...
GRAM
EMBL Heidelberg
BPTF hs 102 NEHBPTF hs 102 NEHIIMNMNVIVIAAIYIYEEVLVLRNRNFFGTGTVVLLR-R-LLSPSPFFR------R------FFEDEDFFCAACAALLVSQ-EQCTLVSQ-EQCTLMMAAEEMHVVMHVVLLLLKKAVAVLREEDT Q9UIG2LREEDT Q9UIG2
CG17135 dm 189 NTHCG17135 dm 189 NTHVVLRLRALALSSIYIYEEVLVLRRRRFFRHRHMVMVR-R-LLSPSPFFR------R------FFEDEDLLCAACAALLACE-EQSALACE-EQSALLLTTEEVHIMVHIMLLLLKKAIAILREEDA Q9W0T0LREEDA Q9W0T0
F26H11 ce 253 TASF26H11 ce 253 TASIIMDMDAVAVEEIYIYEEILILRSRSYYHRHRTTLLR-R-IITPTPFFT------T------FFEDEDFFCAACAALLISH-NNSCIISH-NNSCIMMAAEEVHMAVHMALLLLRNRNCCLKSDDE O45409LKSDDE O45409
BAZ1A hs 573 PEIBAZ1A hs 573 PEIFFGDGDALALMMVLVLEEFFLLNANAFFGEGELFLFD-D-LLQDEFPDG-VTQDEFPDG-VTLLEEVVLLEEAEEALLVGN-DSEGPVGN-DSEGPLLCCEELLFFFLLFFFLLTTAIAIFQAIAE Q9UIG1FQAIAE Q9UIG1
BAZ1B hs 605 NTLBAZ1B hs 605 NTLFFGDGDVAVAMMVVVVEEFFLLSCSCYYSGSGLLLL----LLPDPDAAQYP--ITQYP--ITAAVSVSLLMEAMEALLSADKGGFLYSADKGGFLYLLNRNRVLVIVLVILLLLQTQTLLLQDEIA Q9UIG0LQDEIA Q9UIG0
ACF1 dm 347 EHLACF1 dm 347 EHLLLGDGDAFAFMMMRMREEFFMMHTHTYYTGTGLLLLSGSGIIEVEVFFRQN--LSRQN--LSFFYYEEMMTRATRALLTAR-EIAGPTAR-EIAGPLLSSDDILLVILLVLLLLGTGTVVFDLQKE Q9Y0W1FDLQKE Q9Y0W1
ZK783 ce 525 SQGZK783 ce 525 SQGFFADADALALMMVHVHEEFFVVQNQNFFGHGHVVLLG-G-IIDLEIA---PKDLEIA---PKLLEESSLLCAGCAGLLDGDANHAEQTLQDGDANHAEQTLQLLTTRRQQLLLLRRLALALEFPGM Q23590LEFPGM Q23590
H20J04 ce 473 NAEH20J04 ce 473 NAEFFEDEDYLYLFFIFIFQQFFFFNSNSFFKQKQLLLLP-P-LLKEKEIIRGSDEVQRGSDEVQFFSSDDIIIIAIIAIIKCNDPQNSSKCNDPQNSSFFAADDLLRVLLRVLLLLSSIRIRTDIADE AAF39888TDIADE AAF39888
F3M18 at 658 DETF3M18 at 658 DETVVGNGNLLLLMMVWVWRRFFLLISISFFSDSDVVLLD-D-LLWPWPFFT------T------LLDEDEFFIQAIQAFFHDY-DSR-LHDY-DSR-LLLGGEEIHVIHVTTLLLLRSRSIIIRDVED Q9SGP0IRDVED Q9SGP0
MLN1 at 515 DENMLN1 at 515 DENVVANANLLLLMMVWVWRRFFLLITITFFADADVVLLG-G-LLWPWPFFT------T------LLDEDEFFAQAAQAFFHDY-DPR-LHDY-DPR-LMMGGEEIHIVIHIVLLLLKTKTIIIKDIEG BAB10985IKDIEG BAB10985
MOI20 at 193 EEAMOI20 at 193 EEAVVAHAHLLLLSSVYVYGGFFLLRSRSFFSFQSFQLLY-Y-IICPCPFFE------E------LLNNDDFFVGAVGALLYFS-GPNSLYFS-GPNSLLLDADAVHVAVHVALLLLRRALALKGHLER BAA98208KGHLER BAA98208
MAH20 at 298 MDCMAH20 at 298 MDCVVGDGDLLLLMMVWVWDDFFCCTSTSFFGRQGRQLLH-H-LLWRWRFFS------S------LLEDEDFFENAENAVVCHKESNLVLCHKESNLVLIIMMEEVHAVHASSLLFFRRFLFLINERGD BAB10012INERGD BAB10012
Ypl216 sc 376 QFPTERYpl216 sc 376 QFPTERLLLLVVVYVYQQFFLLSFSFFFGRGRFIFIG-G-LLSHSHFFN------N------FFDDQQFFLTTLTTIIKCT-SPEALKCT-SPEALVVDDEEYVYVKKIINNFFLKTYNSKGS Q08964LKTYNSKGS Q08964
F1N21 at 217 TEEF1N21 at 217 TEEAAGNGNVCVCQQLFLFEEFFCCSASAFFGKGKAALLA-A-LLKEGHAET-IVKEGHAET-IVRREELLFFICGICGRRNTRRQQYCSNTRRQQYCSIITQTQMMIMMIQQLLLLDDLILISKDREM O49273SKDREM O49273
YGN3 sc 424 FDSYGN3 sc 424 FDSFFGKGKLLLLQQAYAYQQFFLLNTNTFFGSKGSKIIC-C-LLSHSHFFS------S------LLDDQQFFITSITSLLKCT-DPYELKGKCT-DPYELKGEEVVLVVVLVNNIIRTQTSKEQE P53125RTQTSKEQE P53125
hypAT1 at 187 EEAhypAT1 at 187 EEAVVVYVYLLLLSSVYVYGGFFLLRSRSFFSVQSVQLLY-Y-IICPCPFFG------G------LLDDDDFFVGAVGALLNFL-GPNSLNFL-GPNSLLLDADAVHVAVHVALLMMRRALALKGHLER BAB11682KGHLER BAB11682
hypAT2 at 258 PEDhypAT2 at 258 PEDAAGNGNVFVFQQFLFLEEFFCCSASAFFGKGKAALLD-D-LLRKGQAE--CVRKGQAE--CVIIRREEMMLSGLSGRRSKRRQQYSTSKRRQQYSTLLTQTQMIIMIIQQLLLLTTVIVILEDRGE BAB10159LEDRGE BAB10159
Consensus(80%) ...h.phh.lhpFhpsFuphL..lp.hp......hpph..ul.sp.p....h.plhhhLLphhhpp...Consensus(80%) ...h.phh.lhpFhpsFuphL..lp.hp......hpph..ul.sp.p....h.plhhhLLphhhpp...
sec.struc.pred ...hhHHHHHHHHHHHHHhh..............HHHHHHHH.......hHHHHHHHHHHHHHHh....sec.struc.pred ...hhHHHHHHHHHHHHHhh..............HHHHHHHH.......hHHHHHHHHHHHHHHh....
DDT
EMBL Heidelberg
TFB1_a sc 165 LDDSLSTFB1_a sc 165 LDDSLSKKEEKLLTNKLLTNLLKLQQ---SKLQQ---SLLLLKGNKVKGNKVLLMKMKVFVFQE---TQE---TVIVINAGNAGLLPPSEPPSEFWFWSTSTRIRIPLPLLLRARAFFA P32776A P32776
TFB1_b sc 243 SENKVNTFB1_b sc 243 SENKVNVVNLSRNLSREEKKIIL------NL------NIFIFENYPIENYPIVVKKKKAYAYTD----NTD----NVVPPKNKNFFKKEEPEPEFWFWARARFFFFSSSSKKLFLFRRK P32776K P32776
BTF2_a hs 99 LLPKFKBTF2_a hs 99 LLPKFKRRKANKKANKEELEEKN----RLEEKN----RMLMLQEDPVQEDPVLLFQFQLYLYKD---LKD---LVVVVSQVSQVIISAEESAEEFWFWANANRLRLNVNATDS P32780NVNATDS P32780
BTF2_b hs 180 GCNGLRBTF2_b hs 180 GCNGLRYYNLTSNLTSDDIIIIE------SE------SIFIFRTYPARTYPAVVKMKMKYKYAE----NAE----NVVPPHNHNMMTTEEKEKEFWFWTRTRFFFFQSQSHHYFYFHHR P32780R P32780
TFB1dm_a dm 109 LLPNFKTFB1dm_a dm 109 LLPNFKRRKVDKKVDKDDLEDKN----RLEDKN----RILILVENPNVENPNLLLQLQLYLYKD---LKD---LVIVITKVTKVLLTSDETSDEFWFWATATHHAAKDKDHHALALKKK Q9V713 K Q9V713
TFB1dm_b dm 182 GCNGLKTFB1dm_b dm 182 GCNGLKYYNLTSNLTSDDVVIIH------CH------CIFIFKTYPAKTYPAVVKRKRKHKHFE----NFE----NVVPPAKAKMMSSEEAEAEFWFWTKTKFFFFQSQSHHYFYFHHR Q9V713R Q9V713
R02D3.3_a ce 116 NELAKSR02D3.3_a ce 116 NELAKSVVEESQSKQSQSKQVVELQAKQKIELQAKQKILLQEDRNLEKLQEDRNLEKLYYQNL----QNL----VAVATKLTKLIITPDDTPDDFWFWSDSDYYYYQKEGVSE O44499 QKEGVSE O44499
R02D3.3_b ce 231 CKEILKR02D3.3_b ce 231 CKEILKFFTIQCTIQCEEYYLLTR-----KTR-----KIISRSENYSRSENYIIQKQKKKNLE----NLE----LVLVPPHEHEMMSSEEENENFWFWKKKKFFFFQSQSHHYFYFHHR O44499 R O44499
F2A19.20_a at 82 LTPAEQF2A19.20_a at 82 LTPAEQLLSMAEFESMAEFELLRF-----KRF-----KLLLLRENSERENSELLQKQKLHLHKQ---FKQ---FVVESKVESKVLLTTEEDEDEFWFWSTSTRKRKKLKLLLGKDS Q9M322 GKDS Q9M322
F2A19.20_b at 161 RTNRVTF2A19.20_b at 161 RTNRVTFFNLTSNLTSEEIIIIF------QF------QIFIFAEKPAAEKPAVVRQRQAFAFIN----IN----YVYVPPKKKKMMTTEEKDKDFWFWTKTKYFYFRAEYLRAEYLYYS Q9M322S Q9M322
SPAC16E8_a sp 60 RVNSTNSPAC16E8_a sp 60 RVNSTNLLEEKDIKDIDDLQE------SLQE------SLLLLTNNPDTNNPDLLLQTLQTFFKE---AKE---AVMVMKGHKGHLLSNEQSNEQFWFWSTSTRLRLHLHLLLRARAHHA O13745 A O13745
SPAC16E8_b sp 134 VDNQMKSPAC16E8_b sp 134 VDNQMKVVSLTGQQSLTGQQIIH------DH------DMFMFEQHPLEQHPLLLRKRKVYVYDK----DK----HVHVPP-P-PLLAAEEGEGEFWFWSRSRFFFFLSLSKKLCLCKKK O13745 K O13745
B8B20.390_a nc 147 WFEDDMB8B20.390_a nc 147 WFEDDMLLKADVKADVEELQQ------SLQQ------SLMLMKKDKAKKDKALLAHAHIYIYND[6]DSND[6]DSLLSDASFNSQSDASFNSQFWFWATATRIRISLSLLLRARAYYA Q9P5N7 A Q9P5N7
Consensus (80%) ......hp.p...h........lhp....l..hh.p....hss..hp.ppFW.haa..h..h.Consensus (80%) ......hp.p...h........lhp....l..hh.p....hss..hp.ppFW.haa..h..h.
sec.struc.pred ........hhHHHHHHHHHHHHHHHh.hHHHHHHHH...........hHHHHHHHHHHh...sec.struc.pred ........hhHHHHHHHHHHHHHHHh.hHHHHHHHH...........hHHHHHHHHHHh...
BSD