data for good fr - meetup #1
TRANSCRIPT
Introduction #1 - Non-profit analytics #2 - I-Raiser Beer Time !
20’ 20’ 85’
Data For Good @Dataforgoodfr
Introduction #1 - Non-profit analytics #2 - I-Raiser Beer Time !
20’ 20’ 85’
Data For Good @Dataforgoodfr
Martin DANIEL Benjamin REY@martindaniel4 @twbrey
#Google #Fifty-Five #Yahoo #WisemetricsData For Good @Dataforgoodfr
Prediction of CTR on an Ad Banner Model 1 vs Model2
How many days a patient will stay in a HospitalKaggle, Heritage Health Prize Competition
Source : http://www.heritagehealthprize.com/c/hhp
Data For Good @Dataforgoodfr
« Faire se rencontrer des Data Scientists et des Non-profits pour résoudre des problèmes à fort impact. »
Data For Good @Dataforgoodfr
- Créé en 2011 - Jake Porway - Mobilisation de « DataCorps » - Principe de Hackathons «DataDives » - 5 chapters
Data For Good @Dataforgoodfr
- Créé en 2014. YC-backed - Paul Duan (FR!) - Data Scientists en poste - 6 à12 mois d’immersion sur un problème. - US only
Data For Good @Dataforgoodfr
- Dernière édition en 2014 (48 data scientists) - Rayid Ghani (Chief Scientist, Obama for America) - Summer Camp de 3 mois pour undergraduates & graduates - Universités US
Data For Good @Dataforgoodfr
Data For Good @Dataforgoodfr
Londres 2013, 900p., #9
San Francisco 2014, 680p, #3
Calgary 2013, 260p, #10
Bangalore 2014, 227p., #3
Ontario 2013, 540p, #12
Data For Good @Dataforgoodfr
Type d’analyse Acteur Pays
Prédictif
Descriptif
Gouvernement
ONG
Entreprises privées
Institutions Internationales
Pays
Ville
Data For Good @Dataforgoodfr
Optimiser le temps de réponse des ambulances à San FranciscoBayes Impact, 2014Prédictif Ville San Francisco
• SF Departement Emergency of Communications = 9-1-1
• Temps moyen d’attente - 9.5 minutes
• Développement d’un algorithme permettant : • Prédire le nombre d’ambulances nécessaire à t• Optimiser le point de départ des ambulances• Diminuer le temps de réponse moyen
Source : http://www.bayesimpact.org/projects/dispath-optimization-for-emergency-responders
Data For Good @Dataforgoodfr
Part du Statin prescrit sous forme commercialeNHS, prescribinganalytics.com, 2011 - 2012
> 200 millions £ économie / an
« The effort of getting data doesn’t necessarily correlate with its importance »
« Good domain knowledge usually beats super-smart algorithms. »
Descriptif Agence Nationale UK
Source : http://theodi.org/case-studies/mastodon-c-case-study
Martin Daniel @martindaniel4
Prédiction des « illegal conversion » à New YorkNYC.gov, June 2012
Source :
Prédictif Ville New York
Source : http://radar.oreilly.com/2012/06/predictive-data-analytics-big-data-nyc.html
• 20k plaintes > 2k incendies / 200 inspecteurs
• Modéliser les « Illegal conversion »
• x5 découverte des illegal conversion / x15 pour la découverte des maisons à risque
Optimiser l’intervention d’une ONG en se basant sur les images satellites de Google EarthDatakind, Give Directly, March 2015
• GiveDirectly intervient au sein de villages au Kenya
• Proxy richesse village = toits métal / chaume
• Développement d’un classifier permettant de prioriser l’intervention
Source : http://online.liebertpub.com/doi/full/10.1089/big.2014.0061
Prédictif Meetup Kenya
Projet Récupération des données Mise en production
#1 - Ambulances
#2 - Assurance Maladie
#3 - Incendies
#4 - Satellites
Facile Moyen Difficile
Choisir un sujet
meetup #1 meetup #2 meetup #3 meetup #4 meetup #5 meetup #6
Prochaines étapes
Etude #1 Prototypage #1 Prototypage #2 Production Nouveau sujet :)
Identification partenaire Collecte de données
Identification partenaire Collecte de données