Beweis des Werts eines alten Algorithmus bei der Schulung von Deep-Learning-Modellen für KI

Beweis des Werts eines alten Algorithmus bei der Schulung von Deep-Learning-Modellen für KI

Seit etwa einem Jahrzehnt hat der Informatikingenieur Kerem Çamsari einen neuartigen Ansatz namens probabilistisches Rechnen angewendet. Basierend auf probabilistischen Bits (p-Bits) wird dies verwendet, um verschiedene komplexe kombinatorische Optimierungsprobleme zu lösen. In einem der bekanntesten Probleme, dem “Problem des Handlungsreisenden”, muss ein Verkäufer den kürzesten Weg finden, um eine bestimmte Anzahl von Städten zu besuchen, wobei keine Stadt mehr als einmal besucht werden darf.

Mit der Aussage: “Alles bewegt sich auf KI zu”, begann Çamsari, ein außerordentlicher Professor im Fachbereich Elektrotechnik und Informatik an der UC Santa Barbara, seine Optimierungsalgorithmen auf die neue Aufgabe anzuwenden, ein tiefgreifendes generatives künstliche Intelligenzmodell (KI) zu schulen. Kürzlich gelang Shaila Niazi, eine Doktorandin im dritten Jahr in Çamsaris Labor, ein bedeutender Durchbruch in diesen Bemühungen, indem sie als erste probabilistische Hardware verwendete, um ein tiefgreifendes generatives Modell im großen Maßstab zu trainieren, um realen Problemen wie der Erkennung von handschriftlichen Ziffern oder Bildern realer Objekte wie Vögeln, Hunden und Autos zu begegnen.

Niazi nutzte diese neuartigen Tools, um ein Bild zu generieren, das nicht im Schulungsdatensatz enthalten war, einer grundlegenden Aufgabe für ein generatives KI-Modell. Nachdem sie das Netzwerk trainiert hatte, konnte sie ihm befehlen, ein neues Bild zu entwerfen, was es auch tat. Dieser Artikel besagt, dass dies möglicherweise das erste Paper ist, in dem Ising-Maschinen eingesetzt wurden, um ein groß angelegtes maschinelles Lernmodell ohne Vereinfachungen des Datensatzes zu trainieren.

Die traditionelle EDV basiert auf deterministischen Bits, die zu einem bestimmten Zeitpunkt nur einen von zwei Werten haben müssen – 0 oder 1 – und nur gemäß einer spezifischen Berechnung geändert werden können. Ein probabilistisches Bit unterscheidet sich davon, dass es nie ein bestimmtes 0 oder 1 ist, sondern ständig schwankt, so schnell wie jede Nanosekunde. Das p-Bit ist ein physischer Hardware-Baustein, der diese Abfolge von 0en und 1en generieren kann und in Algorithmen oft nützlich ist.

Niazis Errungenschaft beruhte auf der enormen Rechenleistung in einer Maschine, die durch ein adaptives Hardwarestück, das in Çamsaris Labor entwickelt wurde, noch leistungsfähiger gemacht wurde. Sie konnte ein sehr “tiefes” dreischichtiges neuronales Netzwerk erstellen, indem sie einen Algorithmus verwendete, der seit mehr als einem Jahrzehnt bei der KI-Gemeinschaft außer Mode war. Dies ermöglichte es Niazi, neue Bilder zu erzeugen, indem sie nur dreißigtausend Parameter verwendete.

In den letzten Jahren wurde das Gebiet des maschinellen Lernens hauptsächlich von dem sogenannten Backpropagation-Algorithmus dominiert, der alles, was wir tun, im Wesentlichen vorantreibt. Niazi erzielte ihre Ergebnisse, indem sie ein tieferes Modell trainierte. QIconzufügen