Über die Stichprobenkomplexität des quantenmechanischen Boltzmann-Maschinenlernens – Communications Physics

Über die Stichprobenkomplexität des quantenmechanischen Boltzmann-Maschinenlernens – Communications Physics

Die Stochastic Gradient Descent löst das Problem des Quantum Boltzmann Machine (QBM) Lernens mit einer polynomischen Stichprobenkomplexität. Ein wichtiger theorematischer Resultat besagt, dass nach einer bestimmten Anzahl von Iterationen des Stochastic Gradient Descent mit konstante Lernrate die Erwartungswerte der QBM-Operatoren einen bestimmten vorgegebenen Fehler erreichen. Dieser Prozess erfordert die Vorbereitung von Gibbs-Zuständen und die Erfolgswahrscheinlichkeit des Algorithmus wird angegeben. Die Beweise basieren auf der Kombination verschiedener Ergebnisse wie der Stetigkeit des quantenrelativen Entropie und der SGD-Konvergenzresultate aus der Machine-Learning-Literatur.

Um die Ausgangsrelativen Entropie vor dem Training zu reduzieren, wird das Konzept des Pre-Trainings auf QBM-Modelle angewandt. Dabei werden verschiedene Modellierungsstrategien wie Mean-Field, Gaussian Fermionic und Geometrically Local Modelle verwendet, um die relative Entropie zu minimieren. Das Pre-Training ermöglicht die Reduzierung der Anzahl der SGD-Iterationen, die benötigt werden, um zum globalen Minimum zu gelangen. Dabei werden verschiedene Szenarien betrachtet, um die Wirksamkeit des Pre-Trainings zu untersuchen und die potenziellen Verbesserungen bei der Optimierung zu zeigen.

Zusätzlich werden numerische Experimente durchgeführt, um die theoretischen Ergebnisse zu bestätigen. Dabei wird der Lernalgorithmus auf Datenquellen angewendet und die Konvergenzgeschwindigkeit sowie die Auswirkungen des Pre-Trainings auf die Leistung des Algorithmus untersucht. Die experimentellen Ergebnisse zeigen, dass das Pre-Training die Konvergenz verbessern kann und die Anzahl der Iterationen reduziert, die zur Erreichung bestimmter Fehlergrenzen erforderlich sind. Das Pre-Training dient dazu, die Lernfähigkeit des QBM-Modells zu verbessern und die Generalisierungsfähigkeit auf verschiedene Datensätze zu unterstützen.