víctor maojo grupo de informática biomédica universidad ... · mol. pathway gene/protein...

51
Víctor Maojo Grupo de Informática Biomédica Universidad Politécnica de Madrid [email protected]

Upload: trananh

Post on 05-May-2019

218 views

Category:

Documents


0 download

TRANSCRIPT

Víctor MaojoGrupo de Informática Biomédica

Universidad Politécnica de [email protected]

2

Visión general

Proyecto Integrado financiado por la Comisión Europea (ICT

for Health)

2006-2010

25 socios de Europa y Japón

Motivo: Diseño de nuevos modelos de ensayos clínicos en el

marco de la medicina personalizada

Integración de información clínica y genómica altamente

heterogénea

3

El proyecto europeo integrado Advancing Clinico-Genomic

Trials on Cancer (ACGT) pretende dar solución a estos

problemas mediante el desarrollo de una plataforma basada en

servicios Grid para el soporte de ensayos clínicos post-

genómicos.

4

Núcleos del Proyecto

Infraestructura Grid para ensayos clínicos

Ensayos clínico-genómicos en cáncer

Desarrollo de una ontología de cáncer

Desarrollo de un mediador semántico de servicios Web

Modelización in-silico de diseño de nuevos medicamentos

Minería de datos clínico-genómicos

5

Organizaciones virtuales

VVirtual OOrganizationsGrid Services Infrastructure

(Metadata, Registry, Publishing, Query,

Invocation, Security, etc.)

Tool 1

Tool 2

Grid Data Service

Analytical Services

Clinicaldata Research

Center

Grid Portal

Microarray

Grid Data Service

Image

Tool 2

Tool 3

Research

CenterAnalytical Services

Grid Data Service

ResearchCenter

GeneDatabaseGrid-Enabled

Client

ProteinDatabase

Tool 3

Tool 4

Grid Data Services

Analytical Services

6

Motivaciones

Necesidad de integración de información y recursos de naturaleza heterogénea:

Imágenes DICOM

Microarrays

SNP’s, Mutaciones

Marcadores moleculares

Proteínas

Fenotipos

Genotipos

Información “ómica”: genómica,

proteómica, metabolómica, muy heterogénea

Fuentes bibliográficas (PubMed…)

HIS

Marcadores de expresión génica

-- SecuenciadoresSecuenciadores de ADN de ADN-- AlineadoresAlineadores de Secuencias ADN de Secuencias ADN-- Comparadores de Secuencias Comparadores de SecuenciasADNADN-- Comparadores de Proteínas Comparadores de Proteínas-- Análisis de Análisis de microarraysmicroarrays-- Búsquedas bibliográficas Búsquedas bibliográficas-- Simuladores 3D Simuladores 3D

7

Extracción de conocimientodesde fuentes de datos masivas,

remotas y heterogénease

Integración con informaciónclínica para investigación y

cuidado del paciente

Un ejemplo concreto en Informática Biomédica

8

Más de 950 bases de datospúblicas de genes,proteínas y enfermedades,110 más que en 2005(más miles de BDsprivadas)

Fuentes de Información específicas

9

Ejemplo: OXFORD (Instituto Europeo de BioInformática – EBI)

10

OXFORD: Ejemplo de acceso a una BD específica

11

DocumentDocument

EntryName: CECA_AEDAEAccesionNumber: P82592SecondaryAccesionNumber: Q95PI9ReleaseDate: Release 44, July 2004LastModificationDate: Release 44, July 2004AnnotationLastModificationDate: Release 45, October 2004ProteinName: Cecropin A [Precursor]Synonyms: NoneGeneName: Name: CECA

DiseaseOrigin: Aedes aegypti (Yellowfever mosquito); http://www.expasy.org/cgi-bin/get-entr...TaxID: 7159; http://www.ebi.ac.uk/newt/display?search=7159&from=ca

TaxonomiesTaxonomiesTaxonomy: Eukaryota; http://www.expasy.org/cgi-bin/get-entries?OC=EukaryotaTaxonomy: Metazoa; http://www.expasy.org/cgi-bin/get-entries?OC=MetazoaTaxonomy: Arthropoda; http://www.expasy.org/cgi-bin/get-entries?OC=Arthropoda

Extracción de información de BD Públicas

12

Problemática a Resolver

No existe un buscador de recursos

En los índices o sitios web

existentes tan sólo existen listas

planas de recursos. No pueden

realizarse búsquedas temáticas o

por funcionalidad de los mismos

Para su uso se requiere personal

altamente especializado en el

manejo del mismo

Imposibilidad de combinar recursos

entre sí de manera automática

13

Modelo distribuidoModelo distribuido

14

BD BiomédicaCentros de DesarrolloHospitales

Naturaleza Distribuida

15

Necesidad de integración

Las miles de bases de datos disponibles son muy

heterogéneas:

Plataformas

Sistemas Operativos

Sistemas Gestores de Bases de Datos

Estructuras

Semántica muy diferente

16

P.IIP.I

P.IFase I

Fase II

Fase III

Fase IV

Integración Virtual

P.IIP.I

P.IIP.I

P.II P.I

P.II P.I

Evaluación Resultados y visualizaciónMinería de datos

Idea de ACGT

17DNAACGTTCGCT Genomics B

IOlo

gyM

ED

icin

e

INFO

rmat

ics

Organ Radiology - Imaging -

RNA FunctionalGenomics

System Clinic - Specialty -

Immunochemistrye-Cell modelingMolecular imaging

Cell

Mol. PathwayGene/ProteinInteractions

Proteomics

Tissue Histopathology Organ Modeling - Simulations -

IntegraciIntegracióónn

18

Bioinformatics and Knowledge Discovery Services Layer

ComputationalBiology

VOManagement

KnowledgeDiscovery Services

User Access Layer

PortalClinical Data

Management and Trial Builder

Data BrowsersWorkflowAuthoring

Advanced Grid Middleware Layer

Common Grid Infrastructure Layer

Mobile GAS GDMS GRMS

GRAM RFT GridFTP MDS

Secu

rity

Ser

vice

s La

yer

Gene

ric

Secu

rity

Ser

vice

s(A

cces

s &

Iden

tity

Con

trol

)D

omai

nSpe

cifi

c(P

seud

o-A

nony

miz

atio

n, e

tc.) Visualization

tools

WorkflowManagement

and EnactmentSemantic Mediator

MasterOntology

Data Wrappers(OGSA-DAI)

Mediator Query Interface

Semantic Mediator

MasterOntology

Data Wrappers(OGSA-DAI)

Mediator Query Interface

19

InformationModeling Clinical Data Models Ontology

InformationModeling Genomic

Data Models

Data AnalysisDSS

Visualization

Data ExtractionGateways

Building-Blocks

GeneIS Genomic

InformationDNA-sequences

Gene-Expression profilesDifferential Gene - Markers

PatientGenomicGenomic Information

PatientClinicalClinical Information

OncoIS

ClinicalInformationDemographics

HistoryPhysiological

LabISLaboratoryInformationIndicators

HematologicalBiochemical

HistoPathIS

HistoPathologyInformation

TumorSample/Tissue

ExternalGenomicGenomic

Information Sources

BioInformatics

FunctionalGenomics

ExternalClinicalClinical(Cancer)

Information Sources

MedicalInformaticsClinical Practice

PACSImagesImages

InterfazInterfaz ClClíínico-Gennico-Genóómicomico

20

Estructura de pilotos en ACGT

Ontologies and mediation tools

Basic GRIDtechnology and security

D

D

D

U

U

U

D

D

Clinical pilots…U

User Dataand PublicDatabases Layer

KnowledgeDiscovery Tools D

D

Simulation andVisualization Tools

UD

D

D

D

Distributed Biomedical Data

The AC

GT Integration Layer, the

ACG

T Tools and Services

User Applicationsand services layer in supportof

U

21

Resource at domain 3

Resource at domain 4

Resource at domain 2Resource at domain 1

Library of components

Workflow editor

OrquestaciOrquestacióónn de de ServiciosServicios Grid Grid

Data sourceData source

Processing engine

Processing engine

Data MiningData Mining VisualisationVisualisation

Resource brokeringand orchestration

22

Mediador en ACGT

23

Mapping con una ontología de dominio

Modelo de homogeneización desarrollado en la UPM

24

Mapping Semántico

25

ONTOLOGÍAS DE DOMINIO EN EL “MAPPING”

26

Unificación de bases de datos

27

Execution track of a query

PSNC

UPM

PHILIPS

28

Busquedas en repositorios virtuales

29

Busquedas en repositorios virtuales

30

INTEGRATED KNOWLEDGE SPACES

PEOPLE - SNAPEOPLE - SNA

PATENTSPATENTS

BUSINESS EVENTSBUSINESS EVENTS

COMPANIES

PRODUCTS

COMPANIES

PRODUCTS

DISEASES

DRUG RESPONSES

DISEASES

DRUG RESPONSES

GENES

PROTEINS

PATHWAYS

GENES

PROTEINS

PATHWAYS

METHODSMETHODS

LAYER-SPECIFIC REASONING

ONTOLOGY REASONING

APP

LIC

ATI

ON

-LEV

EL R

EASO

NIN

G

31

MULTIPLE ANALYSIS TOOLS

MEDLINE

BEA GRAPH

QUERY ON ENTIRE CORPUS

QUERY ON CONCEPTS

QUERY ON UNDERLYING BIBLIOGRAPHY

TERMFREQUENCY

TABLE

or

CLUSTER

ANALYSIS

TAXONOMYOVERLAY

How are genesP38 and ERK connected?

Which of thesegenes are Kinases?

What are thesepapers talking about?

DR

ILL

D

OW

N

KINASES

underlying bibliography

32

Buscando enlaces entre enfermedades

Potential Link

Bipolar Disorder

RheumatoidArthritis

33

34

Patient

Disease

Therapeutic Procedure

Personal Data

Symptom

Measurements

TumorS R

S R

S R

S R

S R

S R

Patient

Disease

Therapeutic Procedure

Personal Data

Symptom

Measurements

TumorS R

Pharmacotherapy

Surgical Proc.

Radiotherapy

S R

S R

S R

S R

S R

S R

S R

S R

Patient

Disease

Therapeutic Procedure

Personal Data

Symptom

Measurements

TumorS R

Pharmacotherapy

Surgical Proc.

Radiotherapy

S R

S R

S R

S R

S R

S R

S R

S R

Radiotherapy of Lung S R

Abdominal Radiotherapy S R

Patient

Therapeutic Procedure

Personal Data

Symptom

Measurements

TumorS R

Pharmacotherapy

Surgical Proc.

Radiotherapy

S R

S R

S R

S R

S R

S R

S R

Radiotherapy of Lung S R

Device

Duration A

Field A

Begin A End A

TotalDose A S R

SingleDose A

Disease S R

Patient

Therapeutic Procedure

Personal Data

Symptom

Measurements

TumorS R

Pharmacotherapy

Surgical Proc.

Radiotherapy

S R

S R

S R

S R

S R

S R

S R

Radiotherapy of Lung S R

Device

Duration A

Field A

Begin A End A

TotalDose A S R

SingleDose A

Disease S R

Patient

Therapeutic Procedure

Personal Data

Symptom

Measurements

TumorS R

Pharmacotherapy

Surgical Proc.

Radiotherapy

S R

S R

S R

S R

S R

S R

S R

Radiotherapy of Lung S R

Device

Duration A

Field A

Begin A End A

TotalDose A S R

SingleDose A

Disease S R

41

Vista general de la Ontología de ACGT

42

43

Sistema para crear una simulación témporo-espacial de loslímites de un tumor y su respuesta a terapias específicasde quimioterapia y radioterapia

Experimentos “in-silico”

Usado en nefroblastoma y cáncer de mama

Oncosimulador en ACGT

44BIOPSY

MATERIALBLOOD

SAMPLE

GENE EXPRESSIONDATA

(MICROARRAYS)GENOTYPING

GENE/PROTEINNETWORK

RADIOBIOLOGICALPHARMACODYNAMIC

PARAMETERS

TUMOR & NORMALTISSUE RESPONSE

SIMULATIONIMAGING DATA

CANDIDATETHERAPEUTIC

SCHEME

PREDICTION

PREDICTIONEVALUATION

FURTHERSCHEME?

THERAPY DECISION

YES

NO

SYNOPTIC BLOCK DIAGRAM OF THE ONCOSIMULATOR

45

Región tumoral al inicio de la radioterapia

46

Resultados 8 semanas después con

dosis diferentes de radiación

47

4D (3D + time) visualization

AHF-48Gy HF-81.6Gy

GBM with mutant p53

1.0E+00

1.0E+01

1.0E+02

1.0E+03

1.0E+04

1.0E+05

1.0E+06

1.0E+07

1.0E+08

1.0E+09

1.0E+10

1.0E+11

0 1 2 3 4 5 6 7 8

Time (weeks)

Num

ber

of a

live

tum

our

cells

.

..

AHF- 48Gy

HF- 81.6Gy

48

49

50

AHF-48Gy HF-81.6Gy

51

Conclusiones

ACGT propone un nuevo modelo de diseño e implementación

de ensayos clínico-genómicos

La infraestructura Grid promete modelos computacionalmente

distribuidos y más potentes

Cuestión clave: Mediación semántica de servicios múltiples,

adaptados en workflows a cada usuario (simulación, data

mining, integración, etc)