
STID PROJECTS
Projet de fin d'étude
01/06/2022
Analyser en temps réel les offres d'emploi de Pôle Emploi. En utilisant des techniques telles que le clustering, la régression logistique et l'analyse factorielle, nous avons identifié des tendances clés dans les dynamiques de l'emploi. Notre approche a permis des résultats étonnants et des insights précieux pour les d'éventuels décideurs.
Tests non-paramétriques : Statistiques avancées
13 mai 2022
On s’intéresse à la base de données dureevie.csv. On souhaite comparer la durée de vie
d’appareils de deux marques différentes. Les durées de vie sont en heure.
Étude des déterminants de la performance en Basket Ball
28 févr. 2022
Identifier et lister les variables caractérisant la performance et celles caractérisant les hypothétiques
déterminants.
Tests paramétriques : étude complète
25 févr. 2022
Une étude sur l’insuffisance pondérale des nouveaux nés à été menée aux États-Unis (Baystate Medical Center, Springfield, Massachusetts) auprès de 189 mères. Nous analysons les résultats via des tests de comparaison à deux échantillons et test du chi-deux.
Projet Système Informatique Décisionnel (SID)
01/02/2022
Réaliser une application de A à Z en utilisant exclusivement des données Open Source. Nous avons su relever le défi en construisant une base de données optimale et en implémentant un code efficace. Notre capacité à travailler en équipe et à exploiter des données complexes nous a permis de produire une solution solide en un temps record.
Analyse des causes du diabète
18/01/2022
Les données présentées dans ce rapport sont issues de l’investigation de 145 individus non obèses qui se sont portés volontaires pour participer à l’étude réalisée en 1979 par GM Reaven et RG Miller. Ceux-ci cherchaient à définir et analyser la nature du diabète.
Concours National Dataviz
1 mai 2021
Produire une dataviz saisissante en une journée seulement, en travaillant efficacement en groupe sur un gros volume de données. Notre projet démontre notre capacité à travailler avec des données complexes pour produire des résultats percutants dans des délais serrés.
Projet Fact Checking statistique
1 mars 2021
Utiliser les données pour déconstruire les préjugés en identifiant les manipulations employées pour les créer. Nous réfutons les arguments à partir de données scientifiques et extrayons des données de sources officielles telles que l'INSEE. En utilisant SAS et R pour effectuer des calculs statistiques, nous déconstruisons statistiquement ces préjugés. Notre travail a été présenté sous forme d'un article grand format.
Projet programmation statistique sous R
1 janv. 2021
Analyse de données pour identifier les facteurs de risque du diabète en utilisant des techniques avancées : analyse univariée, bivariée et multivariée, ainsi que des algorithmes supervisés et non supervisés tels que Kmeans, CAH et EM. Le résultat ? Des prédictions précises des causes du diabète en fonction des données des patients. Projet réalisé en fin de première année de DUT STID.
Projet NLP
1 sept. 2020
Etude statistique complète sur le sommeil des étudiants de l'Université de Paris. Nous avons développé un algorithme de traitement de variables textuelles et utilisé des techniques avancées telles que l'analyse factorielle pour identifier les variables clés d'un bon sommeil. Présentation de nos recommandations concrètes à un jury pour améliorer la qualité du sommeil des étudiants.