seperator
Collège de Bois-de-Boulogne - Formation continue
seperator
Cours


Atelier 2 : Collecte et stockage des données 





Atelier 2 : Collecte et stockage des données
(DSAI10_2)


Ouverture des inscriptions bientôt

Titre du cours : Collexte et stockage des données
Durée : 21 heures

Préalables :

- Connaissances de base en python
- Avoir suivi le cours Edulib: Introduction à la science des données pour l’IA- Module 2 : https://catalogue.edulib.org/fr/cours/PIA-IGSDFR/

Clientèle visée : Toute personne ayant un intérêt pour les sciences des données

Description :
La collecte de données est essentielle dans le développement de modèles d'apprentissage. C'est l'étape préliminaire dans un processus de science de données

Comme élément principal, on verra les différents types de données qu'on peut collecter ainsi que les différentes sources de données à partir desquelles on fait la collecte.

On utilisera des techniques de données sur des fichiers, des bases de données relationnelles et non relationnelles.

On passe aussi en revue le format JSON ainsi que le moissonnage ou scraping de pages web.

Contenu :

1. Introduction à la collecte de données dans le contexte de l'IA

2. Types de données

3. Collecte de données fichiers

4. Collecte à partir de bases de données relationnelles
a. Bases de données relationnelles
b. Opérations de base
c. Collecte à partir d’une BD MySQL

5. Collecte à partir de bases de données NoSQL
a. Bases de données NoSQL
b. Opérations de base
c. Collecte à partir d’une BD NoSQL MongoDB

6. Collecte à partir de fichiers JSON
a. Format JSON
b. Module json
c. Manipulation de fichier JSON

7. Moissonnage sur le web
a. Concept de moissonnage
b. Modules de moissonnage
c. Collecte à partir de sites internet



Retour