Compétences pour la Data Science
Mathématiques
Maîtrise des fonctions fondamentales des tableurs
- Fonctions de calculs
- Fonctions de recherche, de filtre
- Tableaux croisés dynamiques
- Représentations graphiques
Algorithmique et Programmation en Python
- Concepts fondamentaux (structures conditionnelles, boucles, fonctions,...)
- Strucutures de données (listes, dictionnaires, tuples, arbres, graphes, piles,...)
- Les bases de la Programmation Orientée Objet
- Algorithmique (récursivité, diviser pour régner, programmation dynamique, algorithmes gloutons,...)
Manipulation de données en Python
- Nettoyage, manipulation de données, jointures de dataframes,... (connaissance du module pandas)
- Visualisation de données (modules matplotlib, seaborn, Folium)
Interrogation de bases de données en SQL
- Requêtes classiques (SELECT...FROM...WHERE), sous-requêtes
- Jointure de tables
- Common Table Expressions (CTE)
- Window functions
Bases de Machine Learning en Python
- Module scikit-learn
- Algorithmes de régression, de classification et de clustering
- Entrainement et évaluation des modèles (validation croisée, recherche de minimisation des problèmes d'underfitting et d'overfitting)
SAP Business Objects
- Création d'univers sur Information Design Tool
- Création de tableaux de bord sur Web Intelligence
Notions de bases du logiciel Microsoft Power BI
- Importation et nettoyage de données
- Tableaux de bords
- Data Analysis Expressions (DAX)
Notions de bases du logiciel Apache Superset
- Création de Datasets et de tableaux de bord