ì bazy danych i biologia · ì dobra baza danych = wiedza i doświadczenie informatyczne +...
TRANSCRIPT
ìBazydanychibiologiaBiologiczneAplikacjeBazDanych
PolitechnikaPoznańska drinż.AnnaLeśniewska [email protected]
„Biological databases play a central role inbioinformatics. They offer scientists theopportunity to access a wide variety ofbiologically relevant data, including thegenomicsequencesofanincreasinglybroadrangeoforganisms.”…………………………....
Andreas D. Baxevanis „The importance ofBiological Databases in BiologicalDiscovery” (1, sep 2009)………………………
BiologiczneAplikacjeBazydanych
Wprowadzenie
Oczymbędziemymówićnawykładach?
ì Planwykładów:ì Wprowadzeniedoświatabiologicznychbazdanychì Schodzimygłębiejczylibazydanychodpodszewki:użytkownik,
autoryzacja,uwierzytelnianie,struktura,tabela,sekwencjeetc.ì Relacyjnymodeldanychimodelowaniezwiązkówencjiì Transformacjadomodelurelacyjnegoiindeksywbaziedanychì Transakcjewbaziedanychì Tworzenieaplikacjiiinterfejsydobazy(jdbc,pdo,R,Apex)ì BazydanychnurtuNoSQLnaprzykładziebazMongoDB,Redisi
Cassandraì Prezentacje–BiologiczneBazyDanychì Zaliczenie:testkońcowy
Laboratoria
ì Planlaboratoriów:ì Uczymysiękorzystaćzgotowychbiologicznychbazdanych
(BioMartetc.)ì Autoryzacjawbaziedanych(uprawnieniawbaziedanych)ì OracleDataModelerizadaniazmodelowaniaitworzenia
diagramówzwiązkówencjiì Tworzymytabele,indeksyiinnestrukturywbaziedanychi
transformacjadomodelurelacyjnegoì Transakcjewbaziedanychì Tworzenieprostychaplikacji,tutorialeì BazynurtuNoSQL-tutorialeì Prezentacjagotowychprojektów
Zaliczenie-wykład
ì Obecnośćnawykładachpromowananastępująco:>=12wykładów–bdb11wykładów–db+10wykładów–db9wykładów–dst+8wykładów–dst<7wykładówndstlubtest
ì Testobejmującywiedzęzzakresuwiedzyprezentowanejnawykładach
Zaliczenie-laboratoria
ì Projekt
ì PrezentacjanatematwybranejBiologicznejBazyDanych
ì Wygodnysposóbnapracęzogromnąilościądanych
ì Umożliwiaefektywneprzechowywanie,wyszukiwanieiprzetwarzaniedanych
ì Przedanaliząkoniecznejestzłożeniewjednoscentralizowaneźródłodanychiudostępnienieużytkownikom
Czymjestbazadanych?
Bazadanych
ì Umożliwiaobsługęiudostępnianiedużychilościdanychrównieżbiologicznych
ì Wspieraanalizęnadużąskalę
ì Powoduje,żemamyłatwydostępdodanychrównieżaktualizacjędanych
ì Łączywiedzęuzyskanązróżnychdziedzin–takjakwnaszymprzypadkunp.obszarówbiologiiimedycyny
Dlaczegobazydanych?
Corozumiemyprzezaplikacje?
ì Aplikacja,programużytkowy–konkretny,zewzględunaoferowanąużytkownikomfunkcjonalność,elementoprogramowaniaużytkowego
raportaplikacjamobilna
aplikacjawww programwsadowy
formularz
Architekturasystemubazydanych
System Zarządzania Bazą Danych
Narzędzia SQL*Forms
Baza danych
Schemat
Narzędzia SQL*Report
Aplikacja raport
Aplikacja formatka 1
Aplikacja formatka 2
Użytkownicy końcowi (naiwni)
Administrator Użytkownik
zaawansowany
Programiści
SQL
4GL
Interfejs użytkownika
Dane
Narzędzia SQL*Plus
Serwer aplikacji
Aplikacja C/C++
Aplikacja J2EE
JDBC
OCI
Aplikacja WWW
Aplikacja iSQL*Plus
Bazadanych
ì Oracle11g
ì Adresserwera:admlab2-main.cs.put.poznan.pl
ì Użytkownicy:ì BINFnumer_indeksu,np.BINF12345ì hasłopoczątkowe:BINFnumer_indeksuì nazwabazydanych:dblab01
dblab01
Typbazydanych
ì Bibliograficzne
ì Taksonomiczne
ì KwasówNukleinowych
ì Genomowe
ì Białkowe
ì Enzymy/metabol.ścieżki
Typinformacji
ì Literatura
ì Klasyfikacje
ì InformacjeDNA
ì Informacjeogenach
ì Strukturabiałkowa
ì Ścieżkimetaboliczne
Biologicznebazydanych
ì BournePE.,WestbrookJ,BermanHM(PDB,zał.1971)TheProteinDataBankandlessonsindatamanagement
ì BairochA.,BoeckmannB,FerroS,GesteigerE(Swiss-Prot,zał.1986)Swiss-Prot:Jugglingbetweenevolutionandstability
ì BirneyE.,ClampM.(ENSEMBL,zał.1999)Biologicaldatabasedesignandimplementation
ì DwightSS,BalakrishnanRetal.(SGD,zał.1996)Saccharomycesgenomedatabase:Underlyingprinciplesandorganisation
ì 90tewww.ncbi.nlm.nih.govudostępnioneprzezInternetorazCDROMwww.rcsb.org
Trochęhistorii...
Tworzeniebiologicznychbazdanych
ì Tworzeniebiologicznychbazdanychwniczymnieróżnisięodtworzeniabazdanychzinnychdziedzin
ì Ale?
ì Problemkomunikacjibiolog–informatykmożebyćproblemem
Problemykomunikacyjne
Biologiczne aplikacje baz danych. AŻ-W1
Tworzeniebiologicznejbazydanych
ì Dobrabazadanych=wiedzaidoświadczenieinformatyczne+dogłębnezrozumienieproblemubiologicznego
ì 1osoba–ekspertwobudziedzinach
ì 2osoby–problemkomunikacji,odmiennepostrzeganieproblemówisposobówrozwiązań
Biologiczne aplikacje baz danych. AŻ-W1
Dobra baza danych = wiedza informatyczna + zrozumienie problemu biologicznego
1 osoba – czy ekspert w obu dziedzinach? 2 osoby – problem komunikacji, odmienne postrzeganie
wagi problemów i sposobów rozwiązań
Tworzeniebiologicznejbazydanych
ì Prostotaisprawdzonerozwiązania
ì Niemieszaćinnowacjibioiinformatycznychwjednymprodukcie
ì Takzaprojektowaćabybyłamożliwośćrozbudowy
ì Niezgubićbiologicznegoproblemuleżącegoupodstawprojektunarzecztechnologii
Tworzeniebiologicznejbazydanych
ì Potrzebnaprzejrzystawizjaceluisposobudziałania
ì DlawłaściwejfunkcjonalnościispełnieniazałożonejroliBBD,jejprojekt(interfejsużytkownikaorazorganizacjadanych)powinienpowstaćpoddyktandobiologii,nieinformatyki
ì Zastosowanienarzuconegosłownictwa(ang.Controlledvocabulary),np.doopisówontologiigenów
Specyfikabiologicznychbazdanych
ì Projektbazydanychmusiwyjśćnaprzeciwoczekiwaniomużytkowników–przewidziećiumożliwićokreślonysposóbprzeglądaniadanychprzezbiologów
ì Jednązgłównychmotywacjitworzeniabazdanychjestodkrywanienowychzależnościpomiędzydanymiiwtórnainterpretacjadanych,aniesamoprzechowywaniedanych
ì Narzędziadoporównywania,wizualizacjiorazanalizydanych
Specyfikabiologicznychbazdanych
ì Interpretacjabiologicznychdanychprzechowywanychwbaziedanychmożeuleczmianiewczasienp.Adnotacjagenomureferencyjnego
ì Nieostragranicapomiędzydaną„niezmienną”adaną„interpretowalną”np.Danezeksperymentówmikromacierzowychmożnatraktowaćjakopodstawoweinformacjeoekspresji,aledanetesąobrabianeprzezzdeponowaniemwbazachdanych
ì Podziałzewzględunarodzajprzechowywanychdanychì Pierwotne(Primarydatabases)ì Wtórne(Secondarydatabases)ì Złożone(Compositedatabases)
ì Podziałzewzględunatreśćprzechowywanychdanychì Sekwencjeì Strukturyizwiązaneznimianotacje
Klasyfikacjabiologicznychbazdanych
Bazydanychsekwencji
DDBJ : http://www.ddbj.nig.ac.jp DNA Databank of Japan
NCBI : http://www.ncbi.nlm.nih.gov/ NCBI, at the NIH campus, USA
EMBL : http://www.embl-heidelberg.de/ European Molecular Biology Laboratory, UK
Międzynarodowawspółpraca
ì ExPASy–ExpertProteinAnalysisSystemwww.expasy.ch
ì BazaUniProtKnowledgebaseskładasięz:
ì UniProtKB/SwissProt–proteinknowledgebase
ì UniProt/TrEMBL–computer-annotatedsuplementdoSwiss-Prot–bezpośrednietłumaczeniezEMBLnaSwiss-Prot
ì F
ì F
ì f
Serwisdoanalizysekwencjibiałkowych
aSwiss-Protentry…overview
sequence
Accessionnumber
Entryname
ProteinnameGenename
Taxonomy
References
Comments
Cross-references
Keywords
Featuretable(sequencedescription)
NationalCenterforBiotechnologyInformation
http://www.ncbi.nlm.nih.gov
ì http://www.ncbi.nlm.nih.gov/guide/all/#tools_
NCBI–narzędzia
ì GlobalQueryCross-DatabaseSearchSystem
ì http://www.ncbi.nlm.nih.gov/gquery
Entrez
ProjektEnsembl
Ensembl
Ensemblgenomebrowser
Ensembldane
Strukturabazdanych
Ilejestbiologicznychbazdanych?
„database”wbaziePubMed
0
5000
10000
15000
20000
25000
30000
20182016201420122010200820062004200220001998199619941992199019881986198419821980197819761974
Katalogibiologicznychbazdanychhttp://www.oxfordjournals.org/nar/database/a
2000–ok.250bazdanych2018>1600bazdanych
Czasopisma„biobazodanowe”
Od1996–SpecjalnynumerNARTopoweBazyDanych,noweobiecującebazy,aktualizacje
Od2010– DatabaseTheJournalofBiologicalDatabasesandCurationPlatformawymianypomysłówiopiniidlatwórców,kuratoróworazużytkownikówbazdanych
ì NucleicAcidResearch
DatabaseIssue
Rolabazdanychwspołeczności(bio)naukowej
ì Sposóborganizacjidanych
ì Miejsceskładowaniawyników(bazypierwotne)
ì Źródłodanych,np.Zinnychprojektówzestawytestowe,możliwośćporównaniawyników,weryfikacjadanych
ì Sposóbnapozyskanienowychinformacji(integracjadanych)
ì Identyfikacjadorobkunaukowegokonkretnejosoby
ì Istniejeogromnaliczbabiologicznychbazdanych,awnichcenneinformacje
ì Nawetnajlepszebazydanychniemająwszystkichinformacji
ì Wprzypadkuinformacjibiologicznejsekwencjastanowiczęstobardziejprecyzyjnyidentyfikatorniżnazwagenu