
Analyse des causes du diabète
18/01/2022
Les données présentées dans ce rapport sont issues de l’investigation de 145 individus non obèses qui se sont portés volontaires pour participer à l’étude réalisée en 1979 par GM Reaven et RG Miller. Ceux-ci cherchaient à définir et analyser la nature du diabète.
Dans le cadre de notre projet avancé en science des données, nous avons réalisé les objectifs suivants :
✓ Acquis une compréhension approfondie du jeu de données tout en maîtrisant le logiciel R.
✓ Identifié les facteurs liés au diabète à partir de quatre variables clés.
✓ Effectué une analyse approfondie univariée, bivariée et multivariée afin d'élucider les relations entre les variables quantitatives.
✓ Défini clairement la question de recherche pour déterminer les facteurs contribuant au développement du diabète.
✓ Prédit les causes du diabète à partir des données des patients en utilisant des algorithmes supervisés et non supervisés (notamment Kmeans, le clustering hiérarchique et l'algorithme EM).
Ce projet a été récompensé par une note exceptionnelle de 19/20.