bioinformatics project guideline:

Bioinformatics project guideline: UPF 2011 Selenoprotein gene finding in protist genomes

Upload: aziza

Post on 12-Jan-2016




0 download


Bioinformatics project guideline:. Selenoprotein gene finding in protist genomes. UPF 2011. Selenoproteins. Selenoprotein translation. Recoding UGA codon. Selenoprotein families include selenoproteins and cysteine-homologues. SelU family. - PowerPoint PPT Presentation


Page 1: Bioinformatics project guideline:

Bioinformatics project guideline:

UPF 2011

Selenoprotein gene finding in protist genomes

Page 2: Bioinformatics project guideline:


Page 3: Bioinformatics project guideline:

Selenoprotein translationRecoding UGA codon

Page 4: Bioinformatics project guideline:

From Castellano et al. (2003), Reconsidering the evolution of eukaryotic selenoproteins: a novel nonmammalian family with scattered phylogenetic distribution - EMBO reports

Selenoprotein families include selenoproteins and cysteine-homologues

SelU family

Page 5: Bioinformatics project guideline:

Selenoproteins in protists

A pattern of scattered extinctions seems present in this group.

Page 6: Bioinformatics project guideline:

Project 2011Selenoprotein gene finding in recently sequenced protist genomes

SelenoDBGPx (subfamilies)MsrADI (subfamilies)15-kDaSelHSelISelKSelMSelNSelOSelPSelRSelSSelTSelUSelWSelVTR (subfamilies)sps (also machinery)

File with sequencesLmsel1, LinfSel1 (Leishmania selenoprotein [1])EhSEP (Emiliana huxley selenoprotein [2])SelQ (Toxoplasma selenoprotein [3])SelTryp (Trypanosoma) [5]FrnE [6]Fep15MSPSelJ


Page 7: Bioinformatics project guideline:

Fetching sequences

• SelenoDB• File with families not found in SelenoDB• Protein Databases (NCBI,...)

Page 8: Bioinformatics project guideline:

Homology-based gene finding

Query Genoma

Extract genomic region    fastasubseq    dnafromgff

Exonic structure    exonerate    genewise

Translation into protein    fastatranslate



Page 9: Bioinformatics project guideline:

Candidate protein sequence

Multiple sequence alignment

How good is the alignment? Conservation after a TGA codon?Selenoprotein or Cys-containing homologue?Does it belong to the family?

Page 10: Bioinformatics project guideline:

SECIS element inselenoprotein candidates


As an extra, you can extend your searchSelenoprotein machinery:

(sps2)sbp2pstksecp43Sla/lp (SecS)eEFsectRNAsec

Page 11: Bioinformatics project guideline:

ResultsPresented in a web siteScientific article format Examples:


Page 12: Bioinformatics project guideline:

Working groups

Families distribution

Page 13: Bioinformatics project guideline:


Aquest any us tornem a demanar que ens ajudeu, com en els anys anteriors, en la investigació dels selenoproteomes de protistes. En concret, dels selenoproteomes en alguns genomes de protistes que han estat seqüenciats darrerament. Cada grup tindrà assignades dues o tres famílies de selenoproteïnes i el que esperem de cada grup és la llista de genomes protistes en els quals els gens d’aquesta família apareixen. Per cada gen, haurieu de proporcionar  la seva seqüència i estructura exònica en cada un dels genomes en els quals apareix; i si es tracta d’una selenoproteïna autèntica o d’ homòleg amb Cys. Si els gen és una selenoproteïna, voldríem també que identifiquéssiu l’element SECIS. Ens agradaria que ens presentéssiu tots aquests resultats en un document web amb estructura d’article científic. Les estructures exoniques deurien donar-se en format gff, indicant genoma, cromosoma (o scaffold), coordenades i el nom de la query utilitzada.Volem emfatitzar que el treball que us demanem és un treball de recerca, en el sentit que no sabem quin és el resultat. Aquests genomes no han estat analitzats prèviament i, per tant, no sabem quines selenoproteïnes contenen i, ni tant sols, si en contenen alguna. En conseqüència és un treball que pot continuar més enllà d’allò que estrictament us demanem. Per exemple, si esteu interessats, podeu intentar comprobar si aquests genomes contene alguna nova familia de selenoproteïnes. RECURSOSNosaltres us proporcionem:

• Els genomes que heu d'investigar• Les famílies de selenoproteïnes que heu d'identificar• Accés a la base de dades selenodb ( d'on podeu extreure les

seqüències de selenoprteïnes  

Page 14: Bioinformatics project guideline:


Finding needles in a haystack. In silico identification of eukaryotic selenoprotein genes. Driscoll DM, Chavatte L.EMBO Rep. 2004 Feb;5(2):140-1.

REFERÈNCIES BIBLIOGRÀFIQUES SOBRE SELENOPROTEÏNES A PROTISTES[1] Cassago et al, 2006: Identification of Leishmania selenoproteins and SECIS element[2] Obata, Shiraiwa, 2005: A novel eukaryotic selenoprotein in the Haptophyte Alga Emiliania huxley[3] Novoselov et al, 2006: A highly efficient form of the selenocysteine insertion sequence element in protozoan parasites and its use in mammalian cells[4] Lobanov et al, 2006: The Plasmodium selenoproteome[5] Lobanov et al, 2006: Selenium metabolism in Trypanosoma: characterization of selenoproteomes and identification of a Kinetoplastida-specific selenoprotein[6] Jiang et al, 2010: In silico identification of the sea squirt selenoproteome