víctor maojo grupo de informática biomédica universidad ... · mol. pathway gene/protein...
TRANSCRIPT
2
Visión general
Proyecto Integrado financiado por la Comisión Europea (ICT
for Health)
2006-2010
25 socios de Europa y Japón
Motivo: Diseño de nuevos modelos de ensayos clínicos en el
marco de la medicina personalizada
Integración de información clínica y genómica altamente
heterogénea
3
El proyecto europeo integrado Advancing Clinico-Genomic
Trials on Cancer (ACGT) pretende dar solución a estos
problemas mediante el desarrollo de una plataforma basada en
servicios Grid para el soporte de ensayos clínicos post-
genómicos.
4
Núcleos del Proyecto
Infraestructura Grid para ensayos clínicos
Ensayos clínico-genómicos en cáncer
Desarrollo de una ontología de cáncer
Desarrollo de un mediador semántico de servicios Web
Modelización in-silico de diseño de nuevos medicamentos
Minería de datos clínico-genómicos
5
Organizaciones virtuales
VVirtual OOrganizationsGrid Services Infrastructure
(Metadata, Registry, Publishing, Query,
Invocation, Security, etc.)
Tool 1
Tool 2
Grid Data Service
Analytical Services
Clinicaldata Research
Center
Grid Portal
Microarray
Grid Data Service
Image
Tool 2
Tool 3
Research
CenterAnalytical Services
Grid Data Service
ResearchCenter
GeneDatabaseGrid-Enabled
Client
ProteinDatabase
Tool 3
Tool 4
Grid Data Services
Analytical Services
6
Motivaciones
Necesidad de integración de información y recursos de naturaleza heterogénea:
Imágenes DICOM
Microarrays
SNP’s, Mutaciones
Marcadores moleculares
Proteínas
Fenotipos
Genotipos
Información “ómica”: genómica,
proteómica, metabolómica, muy heterogénea
Fuentes bibliográficas (PubMed…)
HIS
Marcadores de expresión génica
…
-- SecuenciadoresSecuenciadores de ADN de ADN-- AlineadoresAlineadores de Secuencias ADN de Secuencias ADN-- Comparadores de Secuencias Comparadores de SecuenciasADNADN-- Comparadores de Proteínas Comparadores de Proteínas-- Análisis de Análisis de microarraysmicroarrays-- Búsquedas bibliográficas Búsquedas bibliográficas-- Simuladores 3D Simuladores 3D
7
Extracción de conocimientodesde fuentes de datos masivas,
remotas y heterogénease
Integración con informaciónclínica para investigación y
cuidado del paciente
Un ejemplo concreto en Informática Biomédica
8
Más de 950 bases de datospúblicas de genes,proteínas y enfermedades,110 más que en 2005(más miles de BDsprivadas)
Fuentes de Información específicas
11
DocumentDocument
EntryName: CECA_AEDAEAccesionNumber: P82592SecondaryAccesionNumber: Q95PI9ReleaseDate: Release 44, July 2004LastModificationDate: Release 44, July 2004AnnotationLastModificationDate: Release 45, October 2004ProteinName: Cecropin A [Precursor]Synonyms: NoneGeneName: Name: CECA
DiseaseOrigin: Aedes aegypti (Yellowfever mosquito); http://www.expasy.org/cgi-bin/get-entr...TaxID: 7159; http://www.ebi.ac.uk/newt/display?search=7159&from=ca
TaxonomiesTaxonomiesTaxonomy: Eukaryota; http://www.expasy.org/cgi-bin/get-entries?OC=EukaryotaTaxonomy: Metazoa; http://www.expasy.org/cgi-bin/get-entries?OC=MetazoaTaxonomy: Arthropoda; http://www.expasy.org/cgi-bin/get-entries?OC=Arthropoda
Extracción de información de BD Públicas
12
Problemática a Resolver
No existe un buscador de recursos
En los índices o sitios web
existentes tan sólo existen listas
planas de recursos. No pueden
realizarse búsquedas temáticas o
por funcionalidad de los mismos
Para su uso se requiere personal
altamente especializado en el
manejo del mismo
Imposibilidad de combinar recursos
entre sí de manera automática
15
Necesidad de integración
Las miles de bases de datos disponibles son muy
heterogéneas:
Plataformas
Sistemas Operativos
Sistemas Gestores de Bases de Datos
Estructuras
Semántica muy diferente
16
P.IIP.I
P.IFase I
Fase II
Fase III
Fase IV
Integración Virtual
P.IIP.I
P.IIP.I
P.II P.I
P.II P.I
Evaluación Resultados y visualizaciónMinería de datos
Idea de ACGT
17DNAACGTTCGCT Genomics B
IOlo
gyM
ED
icin
e
INFO
rmat
ics
Organ Radiology - Imaging -
RNA FunctionalGenomics
System Clinic - Specialty -
Immunochemistrye-Cell modelingMolecular imaging
Cell
Mol. PathwayGene/ProteinInteractions
Proteomics
Tissue Histopathology Organ Modeling - Simulations -
IntegraciIntegracióónn
18
Bioinformatics and Knowledge Discovery Services Layer
ComputationalBiology
VOManagement
KnowledgeDiscovery Services
User Access Layer
PortalClinical Data
Management and Trial Builder
Data BrowsersWorkflowAuthoring
Advanced Grid Middleware Layer
Common Grid Infrastructure Layer
Mobile GAS GDMS GRMS
GRAM RFT GridFTP MDS
Secu
rity
Ser
vice
s La
yer
Gene
ric
Secu
rity
Ser
vice
s(A
cces
s &
Iden
tity
Con
trol
)D
omai
nSpe
cifi
c(P
seud
o-A
nony
miz
atio
n, e
tc.) Visualization
tools
WorkflowManagement
and EnactmentSemantic Mediator
MasterOntology
Data Wrappers(OGSA-DAI)
Mediator Query Interface
Semantic Mediator
MasterOntology
Data Wrappers(OGSA-DAI)
Mediator Query Interface
19
InformationModeling Clinical Data Models Ontology
InformationModeling Genomic
Data Models
Data AnalysisDSS
Visualization
Data ExtractionGateways
Building-Blocks
GeneIS Genomic
InformationDNA-sequences
Gene-Expression profilesDifferential Gene - Markers
PatientGenomicGenomic Information
PatientClinicalClinical Information
OncoIS
ClinicalInformationDemographics
HistoryPhysiological
LabISLaboratoryInformationIndicators
HematologicalBiochemical
HistoPathIS
HistoPathologyInformation
TumorSample/Tissue
ExternalGenomicGenomic
Information Sources
BioInformatics
FunctionalGenomics
ExternalClinicalClinical(Cancer)
Information Sources
MedicalInformaticsClinical Practice
PACSImagesImages
InterfazInterfaz ClClíínico-Gennico-Genóómicomico
20
Estructura de pilotos en ACGT
Ontologies and mediation tools
Basic GRIDtechnology and security
D
D
D
U
U
U
D
D
Clinical pilots…U
User Dataand PublicDatabases Layer
KnowledgeDiscovery Tools D
D
Simulation andVisualization Tools
UD
D
D
D
Distributed Biomedical Data
The AC
GT Integration Layer, the
ACG
T Tools and Services
User Applicationsand services layer in supportof
U
21
Resource at domain 3
Resource at domain 4
Resource at domain 2Resource at domain 1
Library of components
Workflow editor
OrquestaciOrquestacióónn de de ServiciosServicios Grid Grid
Data sourceData source
Processing engine
Processing engine
Data MiningData Mining VisualisationVisualisation
Resource brokeringand orchestration
30
INTEGRATED KNOWLEDGE SPACES
PEOPLE - SNAPEOPLE - SNA
PATENTSPATENTS
BUSINESS EVENTSBUSINESS EVENTS
COMPANIES
PRODUCTS
COMPANIES
PRODUCTS
DISEASES
DRUG RESPONSES
DISEASES
DRUG RESPONSES
GENES
PROTEINS
PATHWAYS
…
GENES
PROTEINS
PATHWAYS
…
METHODSMETHODS
LAYER-SPECIFIC REASONING
ONTOLOGY REASONING
APP
LIC
ATI
ON
-LEV
EL R
EASO
NIN
G
31
MULTIPLE ANALYSIS TOOLS
MEDLINE
BEA GRAPH
QUERY ON ENTIRE CORPUS
QUERY ON CONCEPTS
QUERY ON UNDERLYING BIBLIOGRAPHY
TERMFREQUENCY
TABLE
or
CLUSTER
ANALYSIS
TAXONOMYOVERLAY
How are genesP38 and ERK connected?
Which of thesegenes are Kinases?
What are thesepapers talking about?
DR
ILL
D
OW
N
KINASES
underlying bibliography
Patient
Disease
Therapeutic Procedure
Personal Data
Symptom
Measurements
TumorS R
S R
S R
S R
S R
S R
Patient
Disease
Therapeutic Procedure
Personal Data
Symptom
Measurements
TumorS R
Pharmacotherapy
Surgical Proc.
Radiotherapy
S R
S R
S R
S R
S R
S R
S R
S R
Patient
Disease
Therapeutic Procedure
Personal Data
Symptom
Measurements
TumorS R
Pharmacotherapy
Surgical Proc.
Radiotherapy
S R
S R
S R
S R
S R
S R
S R
S R
Radiotherapy of Lung S R
Abdominal Radiotherapy S R
Patient
Therapeutic Procedure
Personal Data
Symptom
Measurements
TumorS R
Pharmacotherapy
Surgical Proc.
Radiotherapy
S R
S R
S R
S R
S R
S R
S R
Radiotherapy of Lung S R
Device
Duration A
Field A
Begin A End A
TotalDose A S R
SingleDose A
Disease S R
Patient
Therapeutic Procedure
Personal Data
Symptom
Measurements
TumorS R
Pharmacotherapy
Surgical Proc.
Radiotherapy
S R
S R
S R
S R
S R
S R
S R
Radiotherapy of Lung S R
Device
Duration A
Field A
Begin A End A
TotalDose A S R
SingleDose A
Disease S R
Patient
Therapeutic Procedure
Personal Data
Symptom
Measurements
TumorS R
Pharmacotherapy
Surgical Proc.
Radiotherapy
S R
S R
S R
S R
S R
S R
S R
Radiotherapy of Lung S R
Device
Duration A
Field A
Begin A End A
TotalDose A S R
SingleDose A
Disease S R
43
Sistema para crear una simulación témporo-espacial de loslímites de un tumor y su respuesta a terapias específicasde quimioterapia y radioterapia
Experimentos “in-silico”
Usado en nefroblastoma y cáncer de mama
Oncosimulador en ACGT
44BIOPSY
MATERIALBLOOD
SAMPLE
GENE EXPRESSIONDATA
(MICROARRAYS)GENOTYPING
GENE/PROTEINNETWORK
RADIOBIOLOGICALPHARMACODYNAMIC
PARAMETERS
TUMOR & NORMALTISSUE RESPONSE
SIMULATIONIMAGING DATA
CANDIDATETHERAPEUTIC
SCHEME
PREDICTION
PREDICTIONEVALUATION
FURTHERSCHEME?
THERAPY DECISION
YES
NO
SYNOPTIC BLOCK DIAGRAM OF THE ONCOSIMULATOR
47
4D (3D + time) visualization
AHF-48Gy HF-81.6Gy
GBM with mutant p53
1.0E+00
1.0E+01
1.0E+02
1.0E+03
1.0E+04
1.0E+05
1.0E+06
1.0E+07
1.0E+08
1.0E+09
1.0E+10
1.0E+11
0 1 2 3 4 5 6 7 8
Time (weeks)
Num
ber
of a
live
tum
our
cells
.
..
AHF- 48Gy
HF- 81.6Gy
51
Conclusiones
ACGT propone un nuevo modelo de diseño e implementación
de ensayos clínico-genómicos
La infraestructura Grid promete modelos computacionalmente
distribuidos y más potentes
Cuestión clave: Mediación semántica de servicios múltiples,
adaptados en workflows a cada usuario (simulación, data
mining, integración, etc)