relatório bioinformatica

Upload: paula-cristina

Post on 10-Mar-2016

225 views

Category:

Documents


0 download

DESCRIPTION

Relatório Banco de dados bioinformática

TRANSCRIPT

  • Universidade Federal de Goias Instituto de Cincias Biolgicas

    Curso: BiomedicinaDisciplina: Bioinformtica

    Paula Cristina da Mata Lopes

    Relatrio I

    No site do Ncbi (National Center for Biotechnology Information), temos os Popular Resourcesque so os recursos populares que nos levam diretamente aos sites:

    PubMed: Compreende mais de 23 milhes de citaes de literatura biomdica do MEDLINE, revistas de cincias da vida, e livros on-line. As citaes podem incluir links para contedo de texto completo da PubMed Central e sites de editores.

    Bookshelf: oferece acesso gratuito a livros e documentos em cincias da vida e da sade. Um n vital na rede de recursos riqueza de dados em NCBI, Bookshelf permite aos usurios navegar facilmente, recuperar e ler o contedo, e estimula a descoberta de informaes relacionadas.

    PubMed Central ( PMC): um arquivo livre de texto completo da literatura revista cincias biomdicas e da vida no Instituto Nacional de Biblioteca Nacional de Sade de Medicina (NIH / NLM) dos Estados Unidos.

    PubMed Health: fornece informaes para os consumidores e mdicos sobre a preveno eo tratamento de doenas e condies. um servio prestado pelo Centro Nacional de Informaes sobre Biotecnologia (NCBI), na Biblioteca Nacional de Medicina dos EUA (NLM).

    BLAST: Encontra regies de similaridade local entre as sequncias. O programa compara assequncias de nucletidos ou a bases de dados de sequncias de protenas e calcula a significncia estatstica dos resultados. BLAST pode ser utilizado para inferir relaes funcionais e evolutivas entre sequncias, bem como ajudar a identificar os membros de famlias de genes.

    Nucleotide: O banco de dados de nucleotdeos uma coleo de seqncias de vrias fontes, incluindo o GenBank, RefSeq, TPA e PDB. Dados da seqncia do genoma, genes e transcritos fornecem a base para a pesquisa biomdica e descoberta.

    Genome: Este recurso organiza informaes sobre genomas, incluindo seqncias, mapas, cromossomos, montagens e anotaes.

    SNP: Banco de dados de polimorfismos de nucleotdeo nico (SNPs) e mltiplas variaes de pequena escala que incluem inseres / delees, microssatlites e variantes no-polimrficas.

    Gene: Gene integra informaes de uma ampla gama de espcies. Um registro pode incluir nomenclatura, seqncias de referncia (RefSeqs), mapas, percursos, variaes, fentipos, e links para genoma, fentipo, e de recursos especficas para um local no mundo inteiro.

    Protein: O banco de dados Protein uma coleo de seqncias de vrias fontes, incluindo tradues de regies codificantes anotadas no GenBank, RefSeq e TPA, bem como registros de SwissProt, PIR, PRF e PDB. As sequncias de protenas so os determinantes

  • fundamentais da estrutura e funo biolgica. PubChem: Lanado em 2004, fornece informaes sobre as atividades biolgicas de

    pequenas molculas. organizada como trs bancos de dados ligados dentro do sistema de recuperao de informao Entrez do NCBI. Estes so PubChem Substncia, PubChem Composto e PubChem bioensaio. PubChem tambm fornece uma estrutura ferramenta de busca rpida semelhana qumica. Mais informaes sobre o uso de cada banco de dados componente pode ser encontrado usando os links na pgina inicial.

    Alm de uma coluna de Recursos populares localizado na parte direita do site. J na parte esquerda se encontra uma coluna de Resource List (A-Z), ou seja Lista de recursos de (A-Z). Nesta lista contm :

    All Resources (Todos os recursos) : Bioproject (anteriormente Genome Project)Uma coleo de genmica, genmica funcional e estudos de gentica e links para os seus conjuntos de dados resultantes. Este recurso descreve o escopo do projeto , material, e os objetivos e fornece um mecanismo para recuperar conjuntos de dados que muitas vezes so difceis de encontrar devido anotao inconsistente, submisses mltiplas independentes , ea natureza variada de diversos tipos de dados que muitas vezes so armazenados em bancosde dados diferentes.A base de dados biosample contm descries de materiais de origem biolgica utilizados em ensaios experimentais .Base de dados que os grupos de literatura biomdica , pequenas molculas, e dados de sequncias em termos de relaes biolgicas .prateleira de livrosUma coleo de livros biomdicos que podem ser pesquisados diretamente ou a partir de dados ligados em outros bancos de dados do NCBI . A coleo inclui livros didticos biomdicos, outros ttulos cientficos , recursos genticos , como GeneReviews e manuais NCBI ajuda.Um recurso para fornecer um pblico , acompanhou recorde de relacionamentos relatados entre variao humana e estado de sade observado com elementos de prova. Informao relacionada no Genetic Testing Registro NIH ( GTR ) , MedGen , Gene , OMIM , PubMed eoutras fontes acessvel atravs de hiperlinks nos registros.

    Chemicals & Bioassays (Qumica e Bioensaios) : BioSystems :Base de dados que os grupos de literatura biomdica , pequenas molculas, e dados de sequncias em termos de relaes biolgicas .Recursos computacionais de Estrutura do Grupo do NCBIUma pgina centralizado fornecendo acesso e links para recursos desenvolvidos pela Estrutura do Grupo de Biologia Computacional Filial NCBI ( CBB ) . Esses recursos cobrem as bases de dados e ferramentas para ajudar no estudo de estruturas macromoleculares , domnios conservados e classificao de protenas, pequenas molculas e sua atividade biolgica , e as vias e sistemas biolgicos .PubChem bIOENSAIO :Consiste de dados de bioactividade depositados e as descries de testes de bioactividade utilizados para pesquisar as substncias qumicas contidas no banco de dados de substncias PubChem , incluindo descries das condies e as leituras (nveis de bioactividade ) especficas para o procedimento de triagem .PubChem Composto: Contm estruturas nicas , validados qumicas (molculas pequenas) que podem ser pesquisados utilizando nomes, sinnimos ou palavras-chave. Os registros compostos podem vincular a mais de um registro PubChem Substncia se diferentes depositantes fornecido a mesma estrutura. Esses registros compostos refletir validado informaes representao qumica fornecido para descrever substncias em PubChem

  • Substncia. Estruturas armazenados dentro Compostos PubChem so pr- agrupadas e com referncias cruzadas por grupos de identidade e similaridade. Alm disso, propriedades calculadas e descritores esto disponveis para a busca e filtragem de estruturas qumicas .PubChem registros de substncias contm informaes substncia enviadas eletronicamente para PubChem pelos depositantes. Isto inclui qualquer informao sobre a estrutura qumica apresentada , bem como nomes qumicos , comentrios e links para o site do depositante .

    Data & Software (Dados e Software): Um manual completo sobre o NCBI C + + kit de ferramentas, incluindo a sua concepo e estrutura de desenvolvimento, um C + + refernciabiblioteca, exemplos de software e demos, FAQs e notas de verso. O manual pesquisvel on-line e pode ser baixado como uma srie de documentos PDF.

    DNA & RNA: Bioproject (anteriormente Genome Project): Uma coleo de genmica, genmica funcional e estudos de gentica e links para os seus conjuntos de dados resultantes. Este recurso descreve o escopo do projeto, material, e os objetivos e fornece um mecanismo para recuperar conjuntos de dados que muitas vezes so difceis de encontrar devido anotao inconsistente, submisses mltiplas independentes, ea natureza variada dediversos tipos de dados que muitas vezes so armazenados em bancos de dados diferentes.

    Base de dados sobre variaes genticas curtas (dbSNP) :Inclui variaes de nucleotdeo nico, microssatlites e inseres de pequena escala e excluses. dbSNP contm freqncias genotpicas e dados especficos da populao, condies experimentais, o contexto molecular, e informaes de mapeamento para ambas as variaes neutras e mutaes clnicos. GenBank :O banco de dados de seqncia gentica NIH, uma coleo anotada de todas as seqncias de DNA disponveis publicamente. GenBank faz parte do Banco de Dados de Colaborao Internacional Nucleotide Sequence, que compreende o DNA DataBank do Japo (DDBJ), o Laboratrio Europeu de Biologia Molecular (EMBL) e GenBank pelo NCBI. Estas trs organizaes trocar dados em uma base diria. GenBank composto por vrias divises, a maioria das quais podem ser acessados por meio do banco de dados de nucleotdeos. As excees so as divises EST e GSS, que so acessados atravs dos bancos de dados de nucleotdeos EST e Nucleotide GSS, respectivamente.

    Domains & Structures (Domnios e Estruturas): BioSystems: Base de dados que os grupos de literatura biomdica, pequenas molculas, e dados de sequncias em termos de relaes biolgicas. Conservada Domnio de Banco de Dados (CDD) : Uma coleo de alinhamentos de seqncia e perfis que representam domnios de protenas conservadas na evoluo molecular. Tambm inclui os alinhamentos dos domnios a estruturas de protenas de 3 dimenses conhecidas no banco de dados MMDB. Estrutura (Modelagem Molecular Banco de Dados) : Contm estruturas 3D macromoleculares derivados da Protein Data Bank, assim como ferramentas para a sua visualizao e anlise comparativa

    Genes & Expression (Gene e expresso) :Bioproject (anteriormente Genome Project): Uma coleo de genmica, genmica funcional e estudos de gentica e links para os seus conjuntos de dados resultantes. Este recurso descreve o escopo do projeto , material, e os objetivos e fornece um mecanismo para recuperar conjuntos de dados que muitas vezes so difceis de encontrar devido anotao inconsistente, submisses mltiplas independentes , ea natureza variada de diversos tipos de dados que muitas vezes so armazenados em bancosde dados diferentes.BioSystems :Base de dados que os grupos de literatura biomdica , pequenas molculas, e dados de sequncias em termos de relaes biolgicas .Banco de dados de gentipos e fentipos ( dbGaP ): Um centro de arquivamento e distribuio para a descrio e os resultados dos estudos que investigam a interao entre gentipo e fentipo . Esses estudos incluem associao do genoma ( GWAS ) , resequenciamento mdica, exames de diagnstico molecular , bem como associao entre o

  • gentipo e os traos no- clnicos.Gene :Um banco de dados pesquisvel de genes , com foco em genomas que foram completamente seqenciados e que tm uma comunidade de investigao activa para contribuir dados especficos de genes. As informaes incluem nomenclatura, cromossmicalocalizao, produtos de genes e seus atributos (por exemplo , interaes protena) , marcadores associados , fentipos , interaes e links para citaes , seqncias, detalhes de variao , mapas , relatrios de expresso, homlogos , contedo domnio da protena , e bancos de dados externos .Gene Expression Omnibus (GEO) do banco de dados :Um repositrio de dados genmica funcional pblico apoiando apresentao dos dados Miame conformes. Dados baseados em seqncia de matriz e so aceitas e ferramentas so fornecidas para ajudar os usurios a consulta e descarregue experincias e perfis de expresso gnica com curadoria .

    Genetics & Medicine (Gentica e Medicina) : Prateleira de livros : Uma coleo de livros biomdicos que podem ser pesquisados diretamente ou a partir de dados ligados em outros bancos de dados do NCBI. A coleo inclui livros didticos biomdicos, outros ttulos cientficos, recursos genticos, como GeneReviews e manuais NCBI ajuda.Banco de dados de gentipos e fentipos (dbGaP) : Um centro de arquivamento e distribuio para a descrio e os resultados dos estudos que investigam a interao entre gentipo e fentipo. Esses estudos incluem associao do genoma (GWAS), resequenciamento mdica, exames de diagnstico molecular, bem como associao entre o gentipo e os traos no-clnicos.Gene : Um banco de dados pesquisvel de genes, com foco em genomas que foram completamente seqenciados e que tm uma comunidade de investigao activa para contribuir dados especficos de genes. As informaes incluem nomenclatura, cromossmicalocalizao, produtos de genes e seus atributos (por exemplo, as interaes protena), marcadores associados, fentipos, interaes e links para citaes, seqncias, detalhes de variao, mapas, relatrios de expresso, homlogos, contedo de domnio protenas e externo. Herana Mendeliana online em Man (OMIM) : Um banco de dados de genes humanos e distrbios genticos. NCBI mantm contedo atual e continua a apoiar a sua busca e integrao com outros bancos de dados do NCBI. No entanto, OMIM agora tem uma nova casa em omim.org, e os usurios so direcionados a este local para gravar telas completas. PubMed : Um banco de dados de citaes e resumos da literatura biomdica do MEDLINE e de cincias da vida adicional revistas. Os links so fornecidos quando ntegra dos artigos esto disponveis via PubMed Central (descrito abaixo) ou outros sites.

    Genomes & Maps (Genoma e mapas): Bioproject (anteriormente Genome Project) : Uma coleo de genmica, genmica funcional e estudos de gentica e links para os seus conjuntos de dados resultantes. Este recurso descreve o escopo do projeto, material, e os objetivos e fornece um mecanismo para recuperar conjuntos de dados que muitas vezes so difceis de encontrar devido anotao inconsistente, submisses mltiplas independentes, ea natureza variada de diversos tipos de dados que muitas vezes so armazenados em bancosde dados diferentes. Banco de Dados de Variao Genmica Estrutural (dbVar) : O banco de dados dbVar foi desenvolvido para arquivar informaes associado variao genmica em larga escala, incluindo grandes inseres, delees, translocaes e inverses. Alm de arquivamento descoberta variao, dbVar tambm armazena associaes de variantes definidas com informaes fentipo. Genoma : Contm seqncia e mapa de dados de todo o genoma de mais de 1000 organismos. Os genomas representam ambos os organismos completamente seqenciados e aqueles aos quais a sequenciao est em andamento. Todos os trs principais domnios de vida (bactrias, arqueobactrias, e Eucariotas) esto representadas, bem como diversos vrus, fagos, virides, plasmdeos, e organelos. Nucleotide Banco de Dados : Uma coleo de seqncias de nucleotdeos de vrias fontes, incluindo o GenBank, RefSeq, o banco de dados (TPA) Terceiros Anotao, e PDB.

  • Pesquisando na Nucleotide banco de dados trar resultados disponveis de cada um dos seus bancos de dados que o compem. Popset : Banco de dados de sequncias de DNA relacionados que se originam de estudos comparativos: filogenticos, populacionais, ambientais e, em menor grau, de mutao. Cada registro no banco de dados um conjunto de seqncias de DNA. Por exemplo, um conjunto da populao fornece informao sobre avariao gentica dentro de um organismo, enquanto que um conjunto filogentica pode conter sequncias, e o seu alinhamento, de um nico gene, obtido a partir de vrios organismos relacionados.

    Homology (Homologoia): Conservada Domnio de Banco de Dados (CDD) : Uma coleo de alinhamentos de seqncia e perfis que representam domnios de protenas conservadas na evoluo molecular. Tambm inclui os alinhamentos dos domnios a estruturas de protenas de 3 dimenses conhecidas no banco de dados MMDB. HomoloGene : Uma ferramenta de homologia do gene que compara as sequncias de nucletidos entre os pares de organismos, a fim de identificar os ortlogos putativos. Ortlogos Curadoria so incorporadas a partir de uma variedade de fontes, atravs da base de dados Gene. Clusters de protena : Uma coleo de seqncias de protenas relacionadas (clusters), composta por protenas seqncia de referncia codificadas por plasmdeos procariotas e organelas completos e genomas. O banco de dados fornece acesso fcil a informaes de anotaes, publicaes, domnios, estruturas, links externos e ferramentas de anlise.

    Literature ( Literatura) : Prateleira de livros : Uma coleo de livros biomdicos que podem ser pesquisados diretamente ou a partir de dados ligados em outros bancos de dados do NCBI. A coleo inclui livros didticos biomdicos, outros ttulos cientficos, recursos genticos, como GeneReviews e manuais NCBI ajuda. Revistas em NCBI Databases : Subconjunto do banco de dados do Catlogo NLM fornecendo informaes sobre as revistasque so referenciados nos registros do banco de dados do NCBI, incluindo resumos PubMed. Este subconjunto pode ser pesquisado usando o ttulo da revista, MEDLINE ou abreviatura ISO, ISSN, ou o ID de catlogo NLM. Base de dados MeSH : MeSH (Medical Subject Headings) a Biblioteca Nacional de Medicina do vocabulrio controlado para indexao de artigos para MEDLINE / PubMed EUA. Terminologia MeSH fornece uma maneira consistente para obter informaes que podem usar uma terminologia diferente para os mesmos conceitos. NCBI Handbook : Uma extensa coleo de artigos sobre bancos de dados e software NCBI. Projetado para um usurio iniciante, cada artigo apresenta uma viso geral dos recursos e seu design, juntamente com dicas para a pesquisa e utilizao de ferramentas de anlise disponveis. Todos os artigos podem ser pesquisados on-line e baixado em formato PDF, o manual pode ser acessado atravs do NCBI Bookshelf. NCBI Manual de Ajuda : Acessado atravs do NCBI Bookshelf, o Manual de Ajuda contm documentao de muitos recursos, incluindo NCBI PubMed, PubMed Central, o sistema Entrez Gene, SNP e LinkOut. Todos os captulos pode ser baixado em formato PDF.

    Proteins (Protena): uma coleo de sequncias de vrias fontes, incluindo tradues de regies codificantes anotadas no GenBank, RefSeq e TPA, bem como registros de SwissProt, PIR, PRF e PDB. As sequncias de protenas so os determinantes fundamentais da estrutura e funo biolgica. PubChem, lanado em 2004, fornece informaes sobre as atividades biolgicas de pequenas molculas. Organizado como trs bancos de dados ligadosdentro do sistema de recuperao de informao Entrez do NCBI. Estes so PubChem Substncia, PubChem Composto e PubChem bioensaio. PubChem tambm fornece uma estrutura ferramenta de busca rpida semelhana qumica. Mais informaes sobre o uso de cada banco de dados componente pode ser encontrado usando os links na pgina inicial.

    Sequence Analysis ( Analises Sequenciais): Vrus da Influenza Uma compilao de dados

  • do NIAID Influenza Seqenciamento do Genoma do projeto e GenBank. Ele fornece ferramentas para anlise da seqncia da gripe, anotao e submisso ao GenBank. Este recurso tambm tem links para outros recursos de seqncia de gripe, e as publicaes e informaes gerais sobre o vrus da gripe. Taxonomy - Contm os nomes e linhagens filogenticas de mais de 160.000 organismos que tm dados moleculares nos bancos de dados do NCBI. Novas espcies so adicionados base de dados como dados de Taxonomiaso depositados por eles. Training e Tutorials - Um manual completo sobre o NCBI C + + kit de ferramentas, incluindo a sua concepo e estrutura de desenvolvimento, um C + + referncia biblioteca, exemplos de software e demos, FAQs e notas de verso. O manual pesquisvel on-line e pode ser baixado como uma srie de documentos PDF.

    Training e Tutorials (Formao e tutoriais): - Um manual completo sobre o NCBI C + + kit de ferramentas, incluindo a sua concepo e estrutura de desenvolvimento, um C + + referncia biblioteca, exemplos de software e demos, FAQs e notas de verso. O manual pesquisvel on-line e pode ser baixado como uma srie de documentos PDF.

    Variation (Variao): Bioproject (anteriormente Genome Project) Uma coleo de genmica, genmica funcional e estudos de gentica e links para os seus conjuntos de dados resultantes. Este recurso descreve o escopo do projeto , material, e os objetivos e fornece ummecanismo para recuperar conjuntos de dados que muitas vezes so difceis de encontrar devido anotao inconsistente, submisses mltiplas independentes , ea natureza variada de diversos tipos de dados que muitas vezes so armazenados em bancos de dados diferentes. Banco de Dados de Variao Genmica Estrutural ( dbVar ) O banco de dados dbVar foi desenvolvido para arquivar informaes associado variao genmica em larga escala , incluindo grandes inseres, delees , translocaes e inverses . Alm de arquivamento descoberta variao , dbVar tambm armazena associaes de variantes definidas com informaes fentipo. Banco de dados de gentipos e fentipos ( dbGaP ) Umcentro de arquivamento e distribuio para a descrio e os resultados dos estudos que investigam a interao entre gentipo e fentipo . Esses estudos incluem associao do genoma ( GWAS ) , resequenciamento mdica, exames de diagnstico molecular , bem como associao entre o gentipo e os traos no- clnicos. Base de dados sobre variaes genticas curtas ( dbSNP ) Inclui variaes de nucleotdeo nico , microssatlites e inseresde pequena escala e excluses. dbSNP contm freqncias genotpicas e dados especficos da populao, condies experimentais , o contexto molecular , e informaes de mapeamento para ambas as variaes neutras e mutaes clnicos.