Große Sprachmodelle sind großartig, aber sie sprechen mich nicht an.

Große Sprachmodelle sind großartig, aber sie sprechen mich nicht an.

Die Grenzen des maschinellen Lernens: Warum Sprache eine Herausforderung bleibt

Die Nobelpreise im Bereich Maschinelles Lernen: Ein Blick auf die Vorzüge und Grenzen

Gerade erst haben wir das erste Jahr der Nobelpreise im Bereich Maschinelles Lernen (ML) abgeschlossen. Wer weiß, vielleicht wird es in 20 Jahren weitere Auszeichnungen in diesem Bereich geben, aber dieser besondere Moment bleibt unvergesslich. Obwohl ich als skeptische Stimme im Bereich Künstliche Intelligenz (KI) oft als kritisch angesehen werde, kann ich bei den diesjährigen Preisträgern nicht anders, als ihnen mein vollstes Lob auszusprechen.

Die Bedeutung von Maschinellem Lernen

Maschinelles Lernen ist in der Tat äußerst nützlich. Die Qualität der Proteinstrukturen, die moderne Software bereitstellt, ist beeindruckend. Diese Ergebnisse haben neue Forschungsperspektiven eröffnet und profitieren von hervorragend kuratierten Datensätzen aus über vielen Jahren gesammelten experimentellen Informationen, wie etwa dem Protein Data Bank. Die Anwendung von ML-Techniken in der Materialwissenschaft und verwandten Bereichen ist nur ein weiteres Beispiel für die Potenziale dieser Technologie.

Die Rolle von Daten in ML-Anwendungen

Eine Gemeinsamkeit all dieser herausragenden Anwendungen ist die Verwendung großer, vielfältiger und präzise kuratierter Datensätze. Ob in der Kristallographie, Metallurgie oder bei Materialien – für ML-Ansätze gibt es viele geeignete Bereiche. Leider gibt es jedoch auch Bereiche, die nicht gut für ML geeignet sind. Die organische Chemie ist ein solches Beispiel, das mit Reproduzierbarkeitsproblemen, fehlenden negativen Ergebnissen und subtilen Biases in Reaktionswahl und -bedingungen kämpft. Ein weiteres Terrain, das ich für ungeeignet halte, ist die menschliche Sprache.

Die Herausforderungen von Sprachmodellen

Es mag paradox erscheinen, da große Sprachmodelle wie ChatGPT immense Beliebtheit genießen und weit verbreitet sind. Im Grunde genommen haben diese Modelle Muster in der Sprache gelernt, ähnlich wie sie in der Proteinstruktur arbeiten – sie erkennen Wahrscheinlichkeiten für bestimmte Wortfolgen. Doch die Sprachverarbeitung ist komplexer. Die Vielschichtigkeit der menschlichen Sprache mit ihren unzähligen Nuancen und Grammatikformen führt dazu, dass Sprachmodelle oft oberflächlich korrekten Unsinn produzieren.

Ein Beispiel: Bei der Google-Suche nach dem französischen Wort für "Popover" wird fälschlicherweise "Yorkshire Pudding" als Antwort präsentiert. Solche Fehler sind symptomatisch für ein tieferliegendes Problem, das nicht einfach behoben werden kann.

Warum Sprachmodelle nicht neues Wissen erzeugen

Sprachmodelle neigen dazu, neues Wissen nicht zu schaffen, sondern lediglich einsichtig zu machen, was bereits vorhanden, aber zu subtil für uns war. Sie sind in erster Linie Textumordner, die Inhalte von tatsächlich Menschen verfassten Texten wiederverwenden. Die Wahrscheinlichkeit, dass ein LLM Ihnen etwas wirklich Neues mitteilt, ist äußerst gering. Daher sollten wir die Verlockung vermeiden, ML-Algorithmen auf die menschliche Sprache loszulassen.

Es gab einmal ein Team, das die Wortfrequenzen in Englisch und anderen Sprachen überwachte, um Veränderungen im Laufe der Zeit zu dokumentieren. Sie haben jedoch aufgegeben – zu viel Inhalt stammt mittlerweile von Chatbots, sodass die Datenbasis, auf der sie arbeiteten, unbrauchbar geworden ist.

Fazit

Letztlich zeigt sich, dass maschinelles Lernen in klar definierten Problembereichen mit präzisen und umfassenden Daten zu bemerkenswerten Ergebnissen führen kann. Doch der Versuch, diese Technologien auf die menschliche Sprache anzuwenden, könnte mehr Schaden als Nutzen bringen. Es bleibt die Frage: Wohin führt uns dieser Weg, und werden wir weiterhin in einen Pool von Chatbot-generierten Inhalten eintauchen? Die Antwort bleibt abzuwarten.

Maschinelles Lernen bietet zweifelsohne viele Chancen, doch wir müssen weiterhin kritisch hinterfragen, wo seine Anwendung sinnvoll ist und wo nicht.