Diese Studie nutzt einen öffentlich zugänglichen Datensatz des University of Oxford (UO) Repositoriums in Zusammenarbeit mit dem National Canter for Voice. Der Datensatz umfasst Sprachaufnahmen von 31 Personen: 23 mit der Parkinson-Krankheit (PD) diagnostiziert und 8 gesunden Kontrollpersonen (AC). Die Sprachaufnahmen wurden mit einem kalibrierten Mikrofon in einem schallgedämpften Raum aufgenommen und sind durch 24 biomedizinische Sprachmessungen charakterisiert. Die PD-Teilnehmer waren im Durchschnitt 65,8 Jahre alt und die Diagnosedauer variierte zwischen 0 und 28 Jahren. Eine „Status“-Spalte im Datensatz identifiziert Personen mit PD als „1“ und gesunde Kontrollen als „0“, um eine klare Unterscheidung zu ermöglichen. Die Analyse und Differenzierung zwischen den beiden Gruppen wird dadurch erleichtert.
Die vorgeschlagene Ensemble-Methode zur Klassifizierung der Parkinson-Krankheit integriert verschiedene maschinelle und Deep-Learning-Modelle, um die Klassifizierungsgenauigkeit und -robustheit zu verbessern. Die Daten werden sorgfältig vorverarbeitet und relevante Merkmale werden ausgewählt, um die Leistung des Modells zu optimieren. Durch die Nutzung von Techniken wie SMOTE zur Behebung von Klassenungleichgewichten und RandomizedSearchCV zur Hyperparametersuche, werden Modelle wie K-Nearest Neighbor (KNN), Support Vector Machine (SVM) und Feed-forward Neural Network (FNN) optimiert. Durch die Konstruktion eines Ensemble-Modells, das Vorhersagen aus mehreren Modellen nutzt, kann die Ensemble-Methode die Gesamtklassifizierungsgenauigkeit verbessern und somit effektivere Diagnose- und Behandlungsmethoden für Patienten mit Parkinson-Krankheit bieten.
Die Datenvorverarbeitung spielt eine zentrale Rolle im effektiven Lernen von Modellmerkmalen und der Entfernung unnötiger Informationen. Es werden verschiedene Techniken wie SMOTE für Klassenungleichgewichte und Recursive Feature Elimination (RFE) zur Identifizierung relevanter Merkmale angewendet. Das Skalieren von Features mit StandardScaler gewährleistet, dass alle Merkmale gleichwertig zum Modell beitragen. Der Einsatz von RandomizedSearchCV zur Hyperparametersuche und die Evaluierung der Modelle anhand verschiedener Metriken wie Genauigkeit, Präzision, Recall und F1-Score ermöglichen eine umfassende Bewertung der Modellleistung und korrekten Identifizierung von Personen mit und ohne Parkinson-Krankheit.
Hinterlasse eine Antwort