Entwirrung des menschlichen Belohnungslernens: Ein hybrider Ansatz, der Verstärkungslernen mit fortgeschrittenen Speicherarchitekturen kombiniert.

Die menschliche belohnungsgesteuerte Lernweise wird oft mit einfachen RL-Algorithmen modelliert, die vergangene Erfahrungen in Schlüsselvariablen wie Q-Werten zusammenfassen, die erwartete Belohnungen darstellen. Neueste Befunde legen jedoch nahe, dass diese Modelle die Komplexität des menschlichen Gedächtnisses und der Entscheidungsfindung vereinfachen. ANNs, insbesondere RNNs, bieten ein komplexeres Modell, das langfristige Abhängigkeiten und komplexe Lernmechanismen erfasst, obwohl sie oft interpretierbarer sein müssen als traditionelle RL-Modelle.

Forscher von Institutionen wie Google DeepMind, der Universität Oxford, der Princeton University und dem University College London haben das menschliche Belohnungslernverhalten unter Verwendung eines hybriden Ansatzes aus RL-Modellen und ANNs untersucht. Sie fanden heraus, dass das menschliche Verhalten durch Algorithmen angemessen erklärt werden muss, die Wahlvariablen inkrementell aktualisieren. Das menschliche Belohnungslernen beruht auf einem flexiblen Gedächtnissystem, das komplexe Darstellungen vergangener Ereignisse über mehrere Zeitabläufe bildet.

Ein Datensatz wurde aus einer Belohnungserlernaufgabe mit 880 Teilnehmern gesammelt. Die Studie umfasste nach der Filterung 862 Teilnehmer und 617.871 gültige Versuche. Die meisten Teilnehmer lernten die Aufgabe, indem sie konsequent Aktionen mit höheren Belohnungen wählten. Dieser umfangreiche Datensatz ermöglichte eine signifikante Verhaltensvarianzextraktion unter Verwendung von RNNs und Hybridmodellen, die die traditionellen RL-Modelle in der Erfassung menschlicher Entscheidungsmuster übertrafen.

Die Daten wurden zunächst mit einem traditionellen RL-Modell (Best RL) und einem flexiblen Vanilla RNN modelliert. Das Vanilla RNN, das Aktionen, Belohnungen und latente Zustände zusammen verarbeitet, sagte die Entscheidungen genauer voraus als Best RL. Weitere Hybridmodelle wie RL-ANN und Context-ANN, die sich gegenüber Best RL verbesserten, konnten jedoch den Vanilla RNN nicht übertreffen. Memory-ANN, das rekurrente Gedächtnisrepräsentationen einbezieht, erreichte die Leistung des Vanilla RNN, was darauf hindeutet, dass eine detaillierte Verwendung des Gedächtnisses entscheidend für das Lernen der Teilnehmer in der Aufgabe war.

Die Studie zeigt, dass traditionelle RL-Modelle, die ausschließlich auf inkrementell aktualisierten Entscheidungsvariablen beruhen, im Vergleich zu einem neuartigen Modell, das entscheidungssensitive Gedächtnisfunktionen integriert, in der Vorhersage menschlicher Entscheidungen aufholen müssen. Dieser neue Ansatz trennt Entscheidungs- und Gedächtnisvariablen, was zu einem besseren Verständnis führt, wie das Lernen die Entscheidungen beeinflusst.

Memory-ANN, die vorgeschlagene modulare kognitive Architektur, trennt belohnungsbasiertes Lernen von aktionsbasiertem Lernen. Diese Erkenntnisse stimmen darin überein, dass komplexe Modelle mit reichen Darstellungen das gesamte Spektrum menschlichen Verhaltens, insbesondere in Lernaufgaben, erfassen müssen. Die gewonnenen Erkenntnisse könnten breitere Anwendungen haben, die sich auf verschiedene Lernaufgaben und die Kognitionswissenschaft erstrecken.

Entwirrung des menschlichen Belohnungslernens: Ein hybrider Ansatz, der Verstärkungslernen mit fortgeschrittenen Speicherarchitekturen kombiniert.

Zunehmender Einsatz von KI im Gesundheitswesen erfordert weltweite Nachhaltigkeitsinitiativen

Zunehmende Verbreitung künstlicher Intelligenz im indischen Gesundheitswesen

Zunehmende Beweise zeigen die Bedeutung von KI für das Gesundheitswesen

Zoom und Suki arbeiten zusammen, um KI-gestützte klinische Dokumentation bereitzustellen.

Hochleistungsfähige maschinelles Lernen-basierte Kalibrierung kostengünstiger Stickstoffdioxid-Sensoren unter Verwendung von Umgebungsparameter-Differenzen und globaler Datenskalierung – Wissenschaftliche Berichte

Schätzungen der klimabedingten Auswirkungen auf die Sterblichkeit in Deutschland auf Basis neuronaler Netzwerke: Anwendung auf Klimasimulationen von Handlungsgeschichten – Scientific Reports

XElemNet: Ein Machine Learning-Framework, das eine Reihe von erklärbaren KI-Technologien (XAI) für tiefe neuronale Netze in der Materialwissenschaft anwendet

Integration von maschinellem Lernen und Einzelzell-Transkriptomanalyse zur Identifizierung potenzieller Biomarker und Analyse immunologischer Merkmale bei ischämischem Schlaganfall

Generative KI-Ethik: 8 größte Bedenken und Risiken

KI in den Finanzmärkten: Potenzielle Vorteile, Hauptrisiken und Regulierungsbehörden, die versuchen Schritt zu halten.

Exklusiv: Serve Robotics Executive Interview mit EnerCom – Oil & Gas 360

Die Zukunft von ChatGPT: Wird es kostenlos bleiben?