Il a attrapé le virus de la statistique
Daniel Probst agrège les données sur le Covid-19 et les met à disposition sur son site corona-data.ch.
by Selver KabacalmanInjoignable depuis quelque temps, il rappelle tout désolé. Daniel Probst était occupé par la défense de sa thèse de doctorat en chémoinformatique à l’Université de Berne. Si son nom peut encore paraître étranger à certains, son travail l’est beaucoup moins. A 34 ans, ce jeune chercheur originaire de Finsterhennen (BE) s’est démarqué en créant une plateforme de récoltes de données sur le coronavirus en Suisse: corona-data.ch. Ce mardi, le site recensait vers 18h plus de 70’000 visiteurs et 3,9 millions au cours des trente derniers jours.
«L’idée m’est venue un dimanche pluvieux, confie-t-il. Je venais de terminer l’écriture de ma thèse. Je n’avais rien à faire. Quelque chose était en train de se passer dans le pays. J’ai pensé qu’il serait intéressant d’avoir des données pour la Suisse.» Ni une ni deux, il s’y attaque et monte une plateforme en quelques heures. Le codage n’a aucun secret pour lui. Daniel Probst détient un CFC en informatique, un bachelor en sciences informatiques obtenu en HES à Bienne ainsi qu’un master en bio-informatique de l’Université de Berne.
Auprès des cantons
Au début, le jeune chercheur copie les données qu’il trouve sur le site de l’Office fédéral de la santé publique (OFSP), mais très vite elles lui semblent insuffisantes. «Les chiffres n’étaient pas actualisés régulièrement», argue-t-il. Et les informations se trouvent dans un document PDF. Extraire chaque donnée du document pour le reporter dans son programme Python prend du temps.
«Je ne suis pas épidémiologiste, mais je crains que le nombre de cas ne grimpe à nouveau» Daniel Probst
Daniel Probst ne compte plus sur l’OFSP mais va directement récolter les données sur les sites des 26 cantons. «Leurs publications semblaient plus à jour que celles de l’OFSP, précise-t-il. Les informations mettent probablement du temps à arriver à l’OFSP. Je suppose que les données sont d’abord récoltées par les centres de dépistages ou les hôpitaux puis transmises aux médecins cantonaux et atterrissent en dernier à l’OFSP qui compile tout cela.» A la lenteur du fédéralisme, il oppose la rapidité d’un chercheur en informatique. A lui tout seul, il va plus vite que l’administration fédérale.
Lancé mi-mars, en anglais, corona-data.ch a bien évolué. Aujourd’hui, la plateforme est disponible aussi en allemand et en français. Chaque jour, la carte de la Suisse est actualisée et des nouvelles fonctions sont ajoutées à la plateforme. On peut consulter une timeline précise, isoler un canton pour connaître le nombre d’hospitalisations et de décès. La plateforme compile désormais les données des cantons et de l’OFSP, le tout sous forme de graphiques et compare les données avec ceux des autres pays.
«On rouvre trop vite»
Alors que la plupart des cantons rafraîchissent leurs données régulièrement, ce qui permet à Daniel Probst d’actualiser rapidement le site, certains sont très en retard. «Berne le fait chaque soir, précise le chercheur mais Vaud et Genève prennent plus de temps.» Ces deux cantons, fortement touchés, attendent d’avoir les résultats des tests pour rapporter les données au bon jour, à savoir au jour où le test a été réalisé. «Si un canton actualise ses données en cours ou en fin journée, cela ne serait pas totalement juste, puisque les cas comptabilisés à ce moment-là ne seraient pas de nouveaux cas mais ceux de la veille», précise-t-il.
Et que pense-t-il de la situation actuelle? «Le semi-confinement a fonctionné. On le voit en regardant les chiffres. A partir de ce moment précis, le nombre de cas a commencé à baisser», répond-il. Mais pour Daniel Probst, la Suisse rouvre les vannes trop vite. «C’est ce que dit aussi la task force scientifique à Berne, répète-t-il. Voyons comment tout cela va évoluer dans les trois à quatre prochaines semaines. Je ne suis pas épidémiologiste, mais je pense que cela va grimper à nouveau.»
Ces données sont-elles suffisantes pour comprendre ce qui se passe vraiment en Suisse? «Non, répond-il franchement. Nous gagnerions en visibilité avec plus de données», précise-t-il. Et d’ajouter: «Il serait bien d’avoir une vision plus granulaire de ce qui se passe à l’intérieur des cantons, en particulier dans des grands territoires comme Vaud, Berne ou le Valais.» Le chercheur souhaiterait que les cantons indiquent les cas recensés par région à l’image de ce que fait Berne qui l’a mandaté pour analyser ses données.
De grandes disparités
«On arrive à voir ainsi que le virus n’est pas présent de manière homogène. Il y a beaucoup de cas dans le Jura bernois, alors que dans l’Oberland, autour de Berne et Thoune, il y en a très peu.» Daniel Probst se dit prêt à collaborer avec d’autres cantons. «En faisant ainsi, il sera plus facile pour les autorités de mener leur monitorage. Avec la réouverture, il est encore plus crucial de savoir où les choses se passent afin d’être proactif au bon endroit», plaide-t-il.
Son souhait le plus cher? Que ces données servent aux cantons à l’avenir. «J’espère qu’une fois tout cela derrière nous, les autorités partageront les informations sur leurs patients entre elles afin d’avoir une vue d’ensemble et une analyse de bonne qualité de ce que nous aurons vécu.» Cela pourra toujours servir à l’avenir, surtout si d’autres pandémies surviennent.