lettre d'actualité n°9

2
J UILLET 2016, N O 9 L’actualité R 4 ciam L’actualité R 4 ciam La reproductibilité en question. Dans un article récent intitulé « 1,500 scientists lift the lid on re- producibility » paru dans la revue Nature, Monya BAKER analyse les résultats d’une enquête sur how reproducibility is viewed by the scientific community. 1576 chercheurs de différentes disciplines ont répondu au question- naire (les données sont disponibles en ligne ). Parmi les chercheurs ayant répondu, plus de 70% ont essayé sans succès de reproduire les expériences d’un autre scientifique. Plus étonnant, toujours parmi ces chercheurs, plus de la moitié ont échoué à reproduire leurs propres expériences ! ! Un autre pourcentage intéressant : environ les 3/4 (73%) des cher- cheurs interrogés pensent qu’au moins la moitié des documents produits dans leur domaine sont fiables. Pour la partie numérique, R propose plusieurs packages pour répondre, en partie, à cette nécessité de pouvoir reproduire et vérifier les travaux publiés (voir la task view : Reproducible Research). R 4 ciam : nouveaux tutoriels Plusieurs tutoriels ont été ajoutés sur le site. Une initiation au logiciel R (diaporama) Déterminer la taille d’échantillons (diaporama) Agenda : annonces Nouvelle version de R le 21 juin : 3.3.1 Agenda : séminaires, MOOC, . . . EARL (Effective Applications of the R Language) : 13-15 sep- tembre à Londres MOOC : Bases en épidémiologie des maladies animales : 10 octobre au 12 décembre 2016 MOOC : CheMoocs Principes et outils de la chimiométrie pour tous : 12 septembre au 10 novembre 2016 Agenda : ouvrages, publications Journal of Statistical Software : nouveau numéro, 70. The R Journal à paraitre. Data Scientist et langage R : Guide d’autoformation à l’ex- ploitation des Big Data. Henri L AUDE, Éditions ENI (descriptif) Langage R : Application à la statistique, à l’actuariat et à la finance. Nicolas BARADEL, Édition Économica (descriptif) Focus : un article L’article de Stephen J. EGLEN, paru dans le Journal de la Société Française de Statistique est intéressant à plus d’un titre. Outre une revue des méthodes d’analyse de semis points sur une surface (ici la rétine), il présente un exemple de recherche reproductible. La méthode proposée est basée sur l’utilisation d’un conte- neur logiciel (ici via Docker ) qui permet de reproduire les calculs et résultats obtenus.

Upload: hoangtu

Post on 14-Feb-2017

225 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: lettre d'actualité n°9

JUILLET 2016, NO 9

L’actualité R4ciam L’actualitéR4ciam

La reproductibilité en question.Dans un article récent intitulé « 1,500 scientists lift the lid on re-producibility » paru dans la revue Nature, Monya BAKER analyseles résultats d’une enquête sur how reproducibility is viewed by thescientific community.1576 chercheurs de différentes disciplines ont répondu au question-naire (les données sont disponibles en ligne ).

Parmi les chercheurs ayant répondu, plus de 70% ont essayé sanssuccès de reproduire les expériences d’un autre scientifique. Plusétonnant, toujours parmi ces chercheurs, plus de la moitié ontéchoué à reproduire leurs propres expériences ! !

Un autre pourcentage intéressant : environ les 3/4 (73%) des cher-cheurs interrogés pensent qu’au moins la moitié des documentsproduits dans leur domaine sont fiables.

Pour la partie numérique, R propose plusieurs packages pour répondre, en partie, à cette nécessité de pouvoirreproduire et vérifier les travaux publiés (voir la task view : Reproducible Research).

R4ciam : nouveaux tutoriels

Plusieurs tutoriels ont été ajoutés sur le site.• Une initiation au logiciel R (diaporama)• Déterminer la taille d’échantillons (diaporama)

Agenda : annonces

• Nouvelle version de R le 21 juin : 3.3.1

Agenda : séminaires, MOOC, . . .

• EARL (Effective Applications of the R Language) : 13-15 sep-tembre à Londres• MOOC : Bases en épidémiologie des maladies animales : 10

octobre au 12 décembre 2016

• MOOC : CheMoocs Principes et outils de la chimiométriepour tous : 12 septembre au 10 novembre 2016

Agenda : ouvrages, publications

• Journal of Statistical Software : nouveau numéro, 70.• The R Journal à paraitre.• Data Scientist et langage R : Guide d’autoformation à l’ex-

ploitation des Big Data. Henri LAUDE, Éditions ENI (descriptif)• Langage R : Application à la statistique, à l’actuariat et à la

finance. Nicolas BARADEL, Édition Économica (descriptif)

Focus : un article

• L’article de Stephen J. EGLEN, paru dans le Journal de laSociété Française de Statistique est intéressant à plus d’un titre.Outre une revue des méthodes d’analyse de semis points surune surface (ici la rétine), il présente un exemple de recherchereproductible.

La méthode proposée est basée sur l’utilisation d’un conte-neur logiciel (ici via Docker) qui permet de reproduire les calculset résultats obtenus.

Page 2: lettre d'actualité n°9

Focus : un site

• Le wiki Pratiques et outils pour le calcul scientifique proposeune série de conseils et de liens pour faire du calcul scientifiquede qualité et reproductible.

Focus : une fonction

La fonction within() permet d’évaluer une(des) instruc-tion(s) R dans un environnement construit à partir d’un tableaude données et éventuellement de modifier une copie des don-nées d’origine.

aq <- within(airquality, {lOzone <- log(Ozone)Month <- factor(month.abb[Month])cTemp <- round((Temp - 32) * 5/9, 1)S.cT <- Solar.R / cTemprm(Day, Temp)})head(aq, n=1)

Ozone Solar.R Wind Month S.cT cTemp lOzone1 41 190 7.4 May 9.793814 19.4 3.713572

Focus : un package

Le package mtk (Mexico ToolKit) facilite la conduite du projeten analyse de sensibilité. Basé sur un remodelage de l’organi-sation des processus en un workflow linéaire, ce package ras-semble les méthodes d’analyse de sensibilité disponibles dansune démarche unifiée et une syntaxe standardisée.

L’exemple ci-dessous montre la réalisation d’une analyse desensibilité du modèle Ishigami avec la méthode Fast, une pré-sentation du package se trouve ici.

# Chargement du package ’mtk’:library(mtk)# Définition des facteurs incertains :data(Ishigami.factors)# Spécification des processus impliqués :plan <- mtkFastDesigner(listParameters = list(n=1000))modele <- mtkIshigamiEvaluator()indice <- mtkFastAnalyser()# Création et lancement du workflow :wf <- mtkExpWorkflow( expFactors = Ishigami.factors,processesVector = c(design=plan, evaluate=modele,analyze=indice))

run(wf)

# Mise en rapport des résultats :summary(wf)

# Résumé textuelplot(wf) # Présentation graphique

Focus : une task view

Les Task views sont des compilations disponibles sur le site duCRAN. Elles regroupent par grands thèmes/disciplines, les pa-ckages R jugés les plus pertinents pour le thème ou la discipline(voir la fiche Les Task views et le package ctv). Il y a actuellement33 compilations.

La task view gR, gRaphical Models in R, maintenue par SorenHOJSGAARD, recense les packages R utiles pour l’utilisation desmodèles graphiques sous R. Elle présente 36 packages dont 1essentiel (gRbase).

> library("ctv")> install.views("gR")# update.views("gR")

Détente : les fractales

Une figure fractale ou fractale est une courbe ou surface deforme irrégulière ou morcelée qui se crée en suivant des règlesdéterministes ou stochastiques impliquant une homothétie in-terne (Wikipedia). Des formes fractales approximatives sont fa-cilement observables dans la nature : les nuages, les flocons deneige, les montagnes, le chou-fleur ou le brocoli.

Elles fournissent aussi des représentations graphiques trèsesthétiques. C’est le cas de l’ensemble de Mandelbrot.

Cette figure a été produite par Myles HARRISON avec le code Rdisponible ici.

# Rédaction> paste(sample(auteurs), collapse=", ")[1] "F. Dessaint, A. Bouvier, C. Chabanet";-) fortunes::fortune("packages")If you really want to assess uncertainty you need to take into account that the models are false andthat several models may capture different aspects of the data and so be false in different ways.-- Brian D. Ripley R-help (July 2007)

Pour nous joindre, proposer une fiche, s’inscrire à la liste de diffusion, . . . une seule adresse : informatique-mia.inra.fr/r4ciam/contact