Skip to content
This repository has been archived by the owner on Dec 26, 2024. It is now read-only.

Latest commit

 

History

History
45 lines (27 loc) · 2.64 KB

README.md

File metadata and controls

45 lines (27 loc) · 2.64 KB

Investigando as variantes

Objetivo: Adicionar informações às variantes identificadas a fim de facilitar a interpretação dos resultados.

Tempo de duração: 6 horas

📜 Introdução

Existem diversos bancos de dados com informações genéticas a respeitos de variantes conhecidas do genoma humano. Alguns são focados em estudos sobre populações, como o gnomAD, enquanto outros são dedicados a relacionar variantes à doenças, como o ClinVar.

Em um exoma padrão podemos ter entre 50 a 100 mil variantes. Conseguimos reduzir este número usando informações de bancos de dados como os citados acima. Além destes bancos existem ferramentas, como o SnpEff e o VEP, que adicionam informações a cada uma de suas variantes, como por exemplo: se a variante causa um efeito sinonimo ou não sinonimo na proteína.

O Ensembl oferece uma ferramenta online muito conveniente, pois permite consultar pontualmente algumas informações, como por exemplo: qual a coordenada de determinado gene, se a variante já é conhecida, ou se já foi anotada pelo vep, entre várias outras informações. Todas as informações desta ferramenta estão disponiveis em https://rest.ensembl.org/.

Caso tenha ficado curioso sobre a palavra REST, veja este texto da RedHat - API REST. Este conceito é bastante usado quando desenvolvemos serviços que respondem via internet.

Apesar de termos citado como exemplo algumas ferramentas, fique a vontade para explorar outras que lhe pareçam úteis, pois sempre estão saindo novas tools. Lembre-se de sempre documentar os passos que você seguiu.

📦 Dado gerado em Controle de qualidade

  • VCF com as variantes identificadas

👷 Tarefa

Mais QC e utilização de bancos de dados públicos

  • Obtenha a razão Ti/Tv (transitions e transversions) das variantes encontrada no cromossomo 22.
  • Quantas variantes são encontradas na região de 16000000 a 20000000?
  • Exiba o conteúdo da linha do VCF relativa a uma variante:
    • Não-sinônima..
    • Variante no gnomAD v3.1.1 com MAF < 0.01.

Resultados

  • Disponibilize o VCF usado no calculo de Ti/Tv.
  • Um documento com os dados solicitados na tarefa

A nota será definida por: 25% - Para cada questão apontada.

🔗 Links