Science en équipe
Une approche centrée sur les données et la "science en équipe", visant l'excellence dans les travaux de recherche en génétique humaine.
Accès aux données
Le programme de recherche de l'équipe utilise les ressources considérables qui sont maintenant disponibles pour la recherche en génétique humaine au niveau international et en Suisse. Les financeurs de la recherche insistent désormais pour que toutes les données soient librement accessibles et "FAIR". Cette approche de plus en plus ouverte est facilitée par le fait de travailler avec des données dans des "environnements de données sécurisés", également connus sous le nom d'"environnements de recherche fiables". Cette nouvelle façon de travailler nécessite des pipelines d'analyses robustes et une formation à l'utilisation de ces environnement pour les doctorants et les jeunes chercheurs postdoctoraux.
Analyses de données et statistiques transversales
Parallèlement aux thèmes de recherche et aux projets, l'organisation de l'équipe comprend un axe de travail fonctionnel transversal axé sur l'analyse des données et les statistiques, dirigé par Aurélie et Lauric.
Cette initiative vise à s'assurer que les membres de l'équipe disposent d'un soutien solide et de directives pratiques pour tous les aspects de l'analyse des données et des statistiques, en particulier en s'assurant que les doctorants et les jeunes post-doctorants disposent de la meilleure formation et du soutien dont ils ont besoin pour développer efficacement des outils d'analyse de manière collaborative et reproductible.
Ce type d'organisation matricielle comportant à la fois des dimensions de recherche et des dimensions opérationnelles/fonctionnelles est inhabituel dans le monde universitaire, mais il sera de plus en plus important étant donné les énormes possibilités, mais aussi les défis considérables, que représente le travail avec de grands ensembles de données complexes, y compris dans des environnements de recherche sécurisés tels que DNA nexus et la plateforme Genomics England (GEL).
Méthodologie Agile
L'équipe utilise les principes de la méthodologie Agile pour développer et construire des pipelines analytiques dans les contraintes des environnements de recherche sécurisés basés sur le cloud qui hébergent l'ensemble des jeux de données d'intérêt pour l'équipe.
Pipelines analytiques reproductibles
L'ensemble du code développé par l'équipe est effectué en veillant à ce que l'analyse des données soit reproductible et en suivant les principes FAIR (Findable, Accessible, Inter-operable and Reproducible). Il s'agit notamment d'adhérer aux bonnes pratiques de base en matière d'analyse de données, telles que :
- Conserver les variables nouvellement dérivées sous forme de code uniquement, et non dans de nouvelles copies des ensembles de données ;
- La diffusion et le contrôle des versions à l'aide des outils Git et de Github pour le partage du code et le développement collaboratif.
- Travailler sur le cloud, dans les environnements de recherche sécurisés hébergeant les données, tels que DNA Nexus.