Formation à l’analyse des données avec R
Contexte
Sous R – De la donnée brute au rapport reproductible : maîtriser R en écotoxicologie
L’analyse de données joue un rôle central en écotoxicologie pour évaluer les effets des substances sur les organismes vivants et modéliser les risques environnementaux. Face à la complexité croissante des jeux de données et à l’exigence de transparence scientifique, la maîtrise d’outils comme R et RStudio devient essentielle. Cette formation propose une approche pratique et structurée pour accompagner les professionnels dans l’adoption de méthodes reproductibles, de la manipulation de données à la génération de rapports, en passant par la modélisation dose-réponse et la visualisation des résultats.
Objectifs de la formation
Apprendre à utiliser R et RStudio pour manipuler, visualiser et modéliser des données en écotoxicologie.
Structurer des projets reproductibles, produire des rapports automatisés, et appliquer des outils modernes d’analyse et de versioning.
Date
2 et 3 octobre 2025
08:30-17:30
Si vous avez un handicap, merci de nous contacter au plus tard 21 jours, avant la formation à l’adresse suivante contact@everteafee.com
Lieu
En distantiel ou en présentiel à Valence (Drôme) dans les locaux de la Fondation evertéa au 3 rue Henry Chalamet.
Public visé
Chercheurs, ingénieurs et doctorants en écotoxicologie, écologie ou sciences de l’environnement souhaitant maîtriser R pour analyser, modéliser et visualiser des données expérimentales, tout en adoptant des pratiques reproductibles et transparentes.
Prérequis
Aucune connaissance préalable de R n’est nécessaire.
Cependant, une expérience en programmation (par exemple, Python) est recommandée. Une familiarité avec les données écotoxicologiques (tableurs, concepts expérimentaux) et un intérêt pour l’analyse reproductible sont également souhaités.
Un test de positionnement sera utilisé pour adapter la formation au niveau des participants.
Scénario pédagogique :
- L’usage de R sera acquis par la pratique et l’utilisation d’exemples concrets issus de l’écotoxicologie ;
- Divers types de données seront travaillées incluant des tableaux de survie, de croissance et de reproduction, ainsi que des dictionnaires détaillant les formulations de produits et les caractéristiques des espèces biologiques.
- Les scripts et fonctions d’analyse de données développés couvriront plusieurs aspects clés : l’évaluation des effets, la construction de modèles dose-réponse, le calcul de endpoints (via des distributions de probabilité) et la simulation de cartes de risque.
Programme de la journée
- Maîtrise de l’environnement R et RStudio
- Introduction à R et à l’éditeur de code (IDE) RStudio,
- Rstudio pour des données FAIR (notamment reproductibilité et transparence) : organiser les projets (données brutes, scripts, notebook, documentation), intérêt de faire des packages, de les versionner et “encapsuler” (version des dépendances).
- Programmation en R : gestion et manipulation des données
- Éléments de programmation: environnement de travail et structures des objets,
- Importer/Exporter des données locales (Excel) ou depuis base de données (API).
- Examiner la structure interne des objets dans l’environnement R
- Focus sur 2 formats de données : clé-valeur (dictionnaire) et tabulaire (dataframe),
- Éventuellement un point sur les données géographiques tabulaires (GeoDataFrame),
- Maîtriser la manipulation des données tabulaire (trier, filtrer, grouper, résumer),
- Générer la représentation graphique des données tabulaires “grammar of graphics”,
- Comparaison des fonctions de base avec le “tidyverse” : exemple via la manipulation des données textes (strings) et des dates,
- Sauvegarder les données (csv, json, geojson, ou rda/rds),
- Automatisation de tâches (factoriser du code) (boucles for, fonctions apply).
- Visualisation de données et génération de rapports “notebooks”
- Revue des librairies de graphiques (ggplot2, plotly, leaflet),
- Créer des notebook avec rmarkdown pour créer des rapports, et des tutoriels,
- Compréhension de la différence entre les scripts R, le package et les notebooks Rmd,
- Éventuellement, brève introduction sur la création d’applications
- Outils pour la reproductibilité des analyses
- Compréhension et utilisation de Git (Github et Gitlab) pour le versioning,
- Utilisation de `renv` pour la gestion des environnements reproductibles,
- Introduction d’outils de containerisation docker.
Le programme de cette journée peut paraître ambitieux, mais il pourra être ajusté en fonction du niveau initial des participants, qui sera évalué par un test de 20 questions, ainsi que de leurs intérêts spécifiques.
Savoir-faire attendus en fin de journée
- Savoir importer correctement sous R un jeu données (expérimental ou théorique) et en extraire les caractéristiques principales
- Savoir quel(s) test(s) statistique(s) choisir en fonction de son jeu de données
- Conduire et interpréter les résultats d’un test statistique et en comprendre les avantages et les limites.
Méthode d’évaluation des acquis
Un questionnaire à choix multiples (environs 20 questions) avant et après le cours permettant d’évaluer le niveau des élèves en amont, afin d’adapter la vitesse et le vocabulaire du cours, et les acquis de la journée.
Les formulaires seront en ligne (google form, voir par exemple: https://forms.gle/DcxyfDCXLGRYjBqL7) permettant de collecter les données en fonction des choix des répondants (possibilité d’anonymiser).
Formateur
Virgile BAUDROT, docteur en éco-épidémiologie et dirige le cabinet d’ingénierie logicielle en écotoxicologie Qonfluens.
TARIFS sur place (Accueil café et déjeuner compris)
- Etudiant / post-doctorant : 700 euros ;
- Académique / public : 960 euros ;
- Non académique / privé : 1120 euros
A noter que le nombre maximum est de 10 participants
Autres informations
Un questionnaire de satisfaction vous sera envoyé par mail à la fin de la formation, afin de récolter vos impressions, commentaires et suggestions dans le but de nous améliorer. Vos réponses resteront anonymes.
Besoin d’informations complémentaires ? N’hésitez pas à nous contacter : contact@everteafee.com