
Projet programmation statistique sous R
1 janv. 2021
Analyse de données pour identifier les facteurs de risque du diabète en utilisant des techniques avancées : analyse univariée, bivariée et multivariée, ainsi que des algorithmes supervisés et non supervisés tels que Kmeans, CAH et EM. Le résultat ? Des prédictions précises des causes du diabète en fonction des données des patients. Projet réalisé en fin de première année de DUT STID.
✓ Comprendre le jeu de données et le logiciel R
✓ Identifier les facteurs de diabète à partir de 4 variables
✓ Mener une analyse univariée, bivariée et multivariée pour comprendre le lien entre les variables quantitatives
✓ Identifier la problématique, à savoir quels sont les facteurs du diabète ?
✓ Prédire les causes du diabète en fonction des données des patients grâce à des algorithmes supervisés et non supervisés (Kmeans, CAH et EM notamment).