Auf dem Weg zu einem universellen Mechanismus für erfolgreiches Deep Learning – Wissenschaftliche Berichte

Auf dem Weg zu einem universellen Mechanismus für erfolgreiches Deep Learning – Wissenschaftliche Berichte

Die Untersuchung der Ergebnisse des VGG-16-Modells auf dem CIFAR-100-Datensatz zeigte, dass durch das Training mit optimierten Parametern eine Testgenauigkeit von etwa 0,75 erreicht wurde. Es wurde festgestellt, dass das Einfrieren der Gewichte der ersten \(m\) trainierten Schichten und die Verwendung von FC-Ausgängen mit zufälligen Anfangsgewichten zu einer Steigerung der Genauigkeit führte, die sich mit steigender Anzahl der Schichten zunächst erhöhte und bei \(m=10\) stabilisierte. Es wurde erkannt, dass die Schichten \(11-13\) aufgrund der geringen Bildgröße von \(32\times 32\) für kleine Bilder redundant sind. Filter des VGG-16-Netzwerks wurden charakterisiert, wobei die Analyse der Filterleistung und Rauschelemente durchgeführt wurde.

EfficientNet-B0 lieferte auf dem CIFAR-100-Datensatz eine verbesserte Genauigkeit von 0,867 im Vergleich zu VGG-16. Eine progressive Verringerung des Rauschens mit steigenden Schichten wurde beobachtet. Die Analyse der Testgenauigkeit und der statistischen Eigenschaften der Filter legt nahe, dass die Rauschreduktion mit zunehmenden Schichten ein universelles Merkmal von Deep Learning darstellt. Die Ergebnisse zeigen, dass die Genauigkeit mit den Schichten zunahm. Es wurde festgestellt, dass der Mechanismus des Deep Learning auf der progressiven Verringerung des Rauschens mit den Schichten beruht.

Für EfficientNet-B0, das auf dem ImageNet-Datensatz trainiert wurde, zeigten die Ergebnisse ähnliche Trends wie auf dem CIFAR-100-Datensatz. Die Genauigkeit stieg mit den Schichten, während das Rauschen in der Regel abnahm. Die Analyse der Filter auf verschiedenen Stufen legt nahe, dass die zunehmende Genauigkeit mit dem fortschreitenden Rauschrückgang in Einklang steht. Es wurde gezeigt, dass das Verständnis der Funktionsweise der Filter in trainierten Netzwerken die Technologieimplementierung durch Anwendung von Filter-Cluster-Verbindungen verbessern kann.

Zusätzlich wurde gezeigt, dass die Filtercluster-Verbindungen (AFCC) die Genauigkeit reduzieren können. Dieser Ansatz wurde anhand des VGG-16-Netzwerks auf dem CIFAR-100-Datensatz demonstriert, wobei durch Pruning der FC-Schicht mit AFCC eine enorme Reduzierung der Gewichte erreicht wurde, ohne die Genauigkeit zu beeinträchtigen. Ähnliche Ergebnisse wurden für EfficientNet-B0 auf dem CIFAR-100-Datensatz erzielt. Dieses Verfahren wurde auch zur Optimierung von EfficientNet-B0 angewendet, um die Latenz des Modells zu reduzieren, ohne die Leistung wesentlich zu beeinträchtigen, vor allem für kleinere Datensätze wie CIFAR-100.