
POLYTECH PROJECTS
Projet Data Engineering : Centralisation et Valorisation des Données d'une Marketplace
22 déc. 2024
Centraliser et rationaliser les données d'Olist, la plus grande marketplace brésilienne, en un entrepôt de données. Les données, issues de multiples sources (API, S3, FTP, Postgres), serviront à développer des indicateurs clés, comme les commandes livrées par mois et le top 10 des clients par dépense, ainsi qu'à créer des visualisations avec Streamlit pour une meilleure compréhension des performances commerciales.
Modélisation d'une Maladie Endémique : Approches Stochastiques et Déterministes
15 déc. 2024
Modéliser l'épidémiologie d'une maladie endémique de courte durée à l'aide de deux approches complémentaires : un modèle markovien stochastique, adapté aux petites populations, et un modèle déterministe, pertinent pour les grandes populations. Les analyses permettent de comprendre les dynamiques de propagation, d'extinction ou de persistance de l'épidémie, tout en identifiant les facteurs critiques tels que la taille de la population et les probabilités d'infection.
Big Data - PageRank : Analyse et Personnalisation d'un Graphe Orienté
15 déc. 2024
Mise en œuvre l'algorithme PageRank pour analyser un graphe orienté à partir de données réelles issues du projet Wikispeedia. En utilisant la méthode de la puissance, les expérimentations ont permis d’étudier l’influence des paramètres clés, comme le facteur d’amortissement, et d'explorer des variantes, notamment un PageRank personnalisé pour cibler des nœuds spécifiques du graphe.
Gestion de Projet - Dans la peau d'un PO
4 nov. 2024
Dans ce projet, nous avons appliqué le cours pour modéliser et implémenter une solution technique en suivant une méthodologie précise. Les étapes clés incluent l’analyse des besoins, la spécification fonctionnelle, la planification, et le développement, le tout dans un cadre itératif et structuré pour garantir l’efficacité et la satisfaction des utilisateurs finaux.
Test & Maintenance - Git project
25 juin 2024
Ce projet implémente une analyse de fréquence de mots et de n-grams dans un fichier texte, en supprimant les mots vides et en triant les résultats par fréquence. Il comprend des outils pour traiter efficacement de grands fichiers grâce à une structure optimisée, atteignant des vitesses de traitement allant jusqu'à 737K mots par seconde pour les fichiers volumineux.
Modélisation avancée
23 juin 2024
Le projet vise à modéliser l'appétence au crédit des clients d'une société financière. Cela inclut le nettoyage des données et l'optimisation des variables pour maximiser les performances. Les résultats sont évalués à l'aide de deux indicateurs clés : l'indice de Gini, qui mesure la performance du modèle par rapport à un modèle parfait ou aléatoire, et le Gain Chart, qui aide à déterminer les seuils de score pour identifier les clients appétants.
Datawarousing & Data-Mining
28 mai 2024
Réalisation d'une application interactive R/Shiny où les étudiants choisissent un jeu de données complexe, définissent une problématique et l'explorent. L'objectif inclut la validation des données, la reproductibilité de l'ingestion, et la création d'un dépôt GitHub pour l'application, sans obligation de déploiement.
Java : coder un tableur de type Excel
20 déc. 2023
L’objectif est de programmer par objets un noyau de grilles de calcul telles qu’on les rencontre dans les tableurs ou plus généralement pour faire des formulaires en ligne.
Régression Linéaire Multivariée
13 déc. 2023
L’objectif de ce projet est de mettre en œuvre sous R la sélection de modèles de régression linéaire.
On cherche à connaître l’influence des proportions de sept composants sur l’indice d’octane moteur
de douze différents mélanges d’essences. Expliquons l’association entre les composants et l’essence.
Prédiction de données (Python)
13 déc. 2023
Nous appliquerons l'Analyse Factorielle Discriminante (AFD) et l'Analyse Discriminante Linéaire (LDA) pour prédire et classer des données. Nous utiliserons une matrice de confusion pour évaluer la précision de nos prédictions et identifier les erreurs potentielles de classification.
Graphe : Optimisation de modèle
11 déc. 2023
La Societe IS company envisage l’ajout d’un nouveau produit a la gamme de ceux qu’elle fabrique déjà. Deux modèles du nouveau produit ont été analysés et testés.
Création d'un jeu : Démineur (Java)
14 oct. 2023
L’objectif de ce projet était de programmer un démineur. Il s'est déroulé en deux grandes parties :
une première partie sur l’implémentation d’un noyau fonctionnel correspondant au démineur et une
seconde partie sur l’interface graphique.
Statistiques exploratoires : ACP, ACM, AFC
10 oct. 2023
Voici trois projets illustrant l'utilisation de l'analyse en composantes principales (ACP), de l'analyse des correspondances multiples (ACM) et de l'analyse factorielle des correspondances (AFC).
Graphe : ordonnancement de tâche optimal
22 juin 2023
Avant de se lancer dans la réalisation d’une enquête sur la consommation de glaces et sorbets, on veut estimer la durée du projet pour savoir si les résultats de l’enquête seront obtenus à temps pour la préparation de la période estivale.
Programmation C : système de gestion pour un hôtel
5 févr. 2023
Développer un programme de gestion de réservations pour des chambres d'hôtes. Le programme doit permettre de visualiser les réservations, d'ajouter et de modifier des réservations, de calculer les coûts, les taux de réservation et le chiffre d'affaires, ainsi que de sauvegarder les données sur fichier.
HTML & PHP : Site de réservation en ligne
3 févr. 2023
Projet de création d'une plateforme centralisée de réservations dans des restaurants, avec un site fonctionnel pour consulter la liste des restaurants et réserver directement en ligne pour le jour même. L'interface pour les restaurateurs permet de gérer les réservations et l'historique, avec six fichiers à entretenir.