vertrouwen en verbinden - platform 31 · achtergrond: ymere en onderhoud woningcorporatie ymere...
TRANSCRIPT
Vertrouwen en verbinden
R Huizinga en J Ciocoiu
KPN Consulting
2
Data: driver voor digitale transformatie
Digitalisering aanjager van data management. Data management is
aanjager van digitalisering.
Van data silo’s naar een single source of truth
80% van relevante business informatie is ongestructureerde data.
< 1% daarvan wordt geanalyseerd
Kennis is macht. Data de bron. (data driven: +6 % en +9%
resultaatverbetering)
Snelheid is de nieuwe differentiator: Informatie=relevantie/
consumptietijd
Factor vertrouwen speelt grote rol in datamanagement
3
3
Denk platformen i.p.v. applicaties
Connectedassets
Data lake(RTDP)
Enterprise
External
Data sources
Descriptive
Analytics
Customer / Consumer
Partner
Business
Impact
Diagnostic
Predictive
Prescriptive
CONTROL ANDOPTIMIZATION
BASIC INSIGHTS
Application Silo’sHistoric
Dark data
LocationCondition
Use
Supplier dataTrafficSocial
IngestStore
Compute
Identify measuresto improveoutcomes
Capture conditionReport results
Examine causes of performance, faults
and problems
Detect patternsthat signal
impending events
Can X help me sellmore?
Better service formy clients
Fasterservice.BetterserviceHappier
customers
Lower costHappier employees
More innovation
4
Prorail: IoT, DataLake en analytics
5
Periodiek worden geldautomaten onderhouden, waarbij de onderhoudscyclus nu nog voor alle automaten gelijk is.
Dit kan efficiënter omdat de automaten niet allemaal even frequent worden gebruikt en onder verschillende omstandigheden opereren.
KPN consulting maakt een systeem voor efficiënter onderhoud op basis van de historische gebruiksgegevens, recente storingen en gegevens over het apparaat.
Geldservice NL: Datalake, IOT en analytics
6
Achtergrond: Ymere en onderhoud
Woningcorporatie Ymere beheert in Nederland ca. 1430
wooncomplexen met in totaal meer dan 5600 daken
Deze daken kennen ca. 7000 lekkages per jaar
Het voorkomen van lekkages kan o.a. door:
o Planmatig en preventief onderhoud
o Maatregelen op basis van historische analyse
o Predictive modeling (machine learning)
o Plaatsen van sensoren
Lekkages worden opgelost door het dakteam Klomp,
Patina en Consolidated (mede-opdrachtgever)
7
Aanpak: machine learning
Idee: eerste concept/voorproef van de mogelijkheden van predictive modeling
Doel:
o Niet: op dinsdag 12 januari om 21:50 ontstaat een lekkage op dak X
o Maar: in januari is het zeer waarschijnlijk dat op dak X, Y, Z een lekkage ontstaat
Gebruikte techniek:
o Machine learning classificatie logistische regressie RandomForest
o Implementatie m.b.v. Python en Spark
Data:
o Daken, complexen en activiteiten uit Dakota (Consolidated)
o Bouwjaar en locatie uit BAG
o Temperatuur, neerslag en luchtvochtigheid uit KNMI
8
Predictive modeling
FeaturesMaandDaktypeDakpartnerGebouwsoortGarantieConditieBladvalValbeveiligingAfschotVandalismeOppervlakteBouwjaarLengte gootLevensduurAantal lekkages cum.TemperatuurNeerslagduurNeerslagsomLuchtvochtigheid
LabelsWel/niet lekkage
Dakota
BAG
KNMI
Model
Training dataset
Features Labels
Validatie dataset
Predictions
(Logistische Regressie)
Validatie
2015 Q1 2016
IoT
9
(On)mogelijkheden
Mogelijkheden
Achterhalen van andere features
Meer data:
o meerdere Jaren
o maar ook van daken die niet op gebouwen van Ymere zitten
Externe databronnen
Obstakels
Privacy van personen, ook externe data
Onvolledige data
10
Resultaten
Overall accuracy
model: 93%
Logistische
regressie kent een
trade-off tussen
True Positive en
False Positive
voorspellingen
random voorspelling
model
theoretisch optimum
(ROC curve)
Bijv: 40% van de
lekkages kan correct
worden voorspeld
met minder dan 5%
false positives