Dieser Abschnitt erläutert die Arbeitsmethodik des vorgeschlagenen Rahmens. Das Ziel dieses Ansatzes ist die Entwicklung eines präzisen Vorhersagemodells für den Energieverbrauch und das Raumklima in grünen Gebäuden unter Verwendung eines aktiven Lernmodells. Es umfasst verschiedene Phasen, darunter die Visualisierung von Datensätzen, die Vorverarbeitung, die Modellauswahl und die Nutzung von maschinellen Lernverfahren zur Implementierung. Dieser Prozess wird in Abb. 1 visuell dargestellt. Der Energieeffizienz-Datensatz, der für die Vorhersage verwendet wird, bildet den Ausgangspunkt des vorgeschlagenen Systems. Die Datenvisualisierung erfolgt mithilfe verschiedener Diagramme wie Dichtediagrammen, Paardiagrammen und Heatmap-Diagrammen, um die Merkmale aller Datensätze anzuzeigen. Die Vorverarbeitungstechniken umfassen die Merkmalsnormalisierung, die die Daten normalisiert. Das Modell wird aufgeteilt in 70% Trainingsdaten und 30% Testdaten. Letztendlich wurde ein maschinelles Lernmodell auf Basis des aktiven Lernens entwickelt, um den Energieverbrauch in grünen Gebäuden genau zu identifizieren.
Die Datenvorbereitung spielt eine entscheidende Rolle bei der Datenauswertung sowie bei der Entwicklung von maschinellen Lernsystemen. Effektive Vorverarbeitung verbessert die Qualität und Effizienz von Modellen, indem Probleme wie fehlende Daten und unausgeglichene Daten behoben werden. In dieser Studie wird die Merkmalsnormalisierung eingesetzt, um die Skala von Merkmalswerten auf einen konsistenten Bereich anzupassen. Dies ist besonders vorteilhaft, da viele Deep-Learning-Klassifikatoren eine verbesserte Leistung zeigen, wenn die Merkmale in einem ähnlichen Bereich liegen. In dieser Studie wird ein Normalisierungsansatz verwendet, um Datensatzmerkmale zwischen 0 und 1 neu zu skalieren und ihre Einheitlichkeit und Vergleichbarkeit zu fördern.
Aktives Lernen ist eine Methode des maschinellen Lernens, die effizient Datenattribute anhand ihrer aufschlussreichen Elemente erkennt und identifiziert. Sein Ziel ist es, die Leistung des Modells zu maximieren und gleichzeitig die Beschriftungskosten zu senken, trotz seiner Anfälligkeit für unvorhersehbare Änderungen. Dabei selektiert AL Proben mit unterscheidenden Merkmalen aus einem Satz von nicht beschrifteten Beispielen im Datensatz. Eine Auswahl von AL-Techniken wird angewendet, um komiteegestütztes Abfragen, informationssättigendes Abfragen und Unsicherheitsabtasten zu kombinieren. Nachdem die benötigten Datenpunkte aus dem Pool ausgewählt und annotiert wurden, wird der Algorithmus neu trainiert. Dieser iterative Prozess wird fortgesetzt, bis der gewünschte Genauigkeitsgrad erreicht wird.
Hinterlasse eine Antwort