Première utilisation
Visite guidée du Datalab
Bienvenue sur le Datalab Onyxia, plateforme libre service mutualisée de traitement de données, destinée aux statisticiens et data scientists de l'Etat. Ce tutoriel propose une visite guidée du Datalab pour être rapidement opérationnel dans l'utilisation de ses services.
Les conditions d'utilisation du Datalab sont consultables à cette adresse. Nous rappelons que le Datalab est destiné exclusivement au traitement de données publiques et non-sensibles. Des projets d'expérimentation mobilisant des données non ouvertes peuvent être menés en concertation avec l'équipe du Datalab, sous réserve de se conformer aux règles de sécurité spécifiques au projet.

Le catalogue de services

Le catalogue de services est au centre de l'utilisation du Datalab. Il propose un ensemble de services destinés aux traitements statistiques de données ainsi qu'à la gestion complète des projets de data science.

Lancer un service

Pour lancer un service, il suffit de cliquer sur le bouton Lancer du service désiré.
Une page centrée sur le service demandé s'ouvre alors, qui offre plusieurs possibilités :
  • cliquer à nouveau sur le bouton Lancer pour lancer le service avec sa configuration par défaut ;
  • personnaliser le nom que portera l'instance une fois le service lancé ;
  • dérouler un menu de configuration afin de personnaliser la configuration du service avant de le lancer ;
  • sauvegarder une configuration personnalisée en cliquant sur le signet en haut à droite du service.
La configuration précise des services du Datalab constitue un usage avancé et n'est donc pas traité dans ce tutoriel, mais dans d'autres pages de ce site documentaire.

Utiliser un service

L'action de lancer un service amène automatiquement sur la page Mes Services, où sont listées toutes les instances en activité sur le compte de l'utilisateur.
Une fois le service lancé, un bouton Ouvrir apparaît qui permet l'accès au service. Un mot de passe — et, selon les services, un nom d'utilisateur — est généralement requis pour pouvoir utiliser le service. Ces informations sont disponibles dans le README associé au service, auquel on accède en cliquant sur le bouton du même nom.

Supprimer une instance

Supprimer une instance d'un service s'effectue simplement en cliquant sur l'icône en forme de poubelle en dessous de l'instance.
Pour certains services, la suppression d'une instance entraîne la suppression de toutes les données associées, et cette action est irrémédiable. Il est donc nécessaire de toujours bien lire le README associé à l'instance, qui précise les conséquences d'une suppression de l'instance. De manière générale, il est très important de s'assurer que les données ainsi que le code utilisés sont sauvegardés avant de supprimer l'instance. L'idéal est de versionner son code avec Git et de procéder à des sauvegardes régulières des données à l'aide du système de stockage S3.
Les ressources mises à disposition pour l'execution des services sont partagées entre les différents utilisateurs du Datalab. Veuillez à ne pas laisser en cours des services dont vous ne faites plus l'usage. Nous procédons parfois à une suppression systématique des instances inactives depuis un certain temps, afin de libérer des ressources.

Aller plus loin

Nous avons souhaité présenter à travers ce tutoriel l'usage standard des services proposés sur le Datalab. Des usages plus avancés sont présentés dans d'autres pages de ce site documentaire :

Support

Le support et l'aide à l'utilisation du Datalab sont effectuées sur un salon dédié du service de messagerie instantanée interministériel Tchap. Toute question sur l'utilisation du Datalab ou suggestion d'amélioration y sont les bienvenues.
Pour les agents n'utilisant pas Tchap, il est également possible de nous contacter par mail sur la BAL [email protected]