Alibaba startet mathematikspezifische KI-Modelle, die laut Aussage LLMs von OpenAI und Google übertreffen

Die Alibaba Group Holding plant, mit einer Gruppe von mathematischen spezifischen Large Language Models (LLMs) namens Qwen2-Math die KI-Entwicklung auf ein neues Level zu heben und behauptet, dass diese die Fähigkeiten von OpenAI’s GPT-4o auf diesem Gebiet übertreffen können. Die Qwen-Gruppe von Alibaba’s Cloud-Computing-Einheit hat in den letzten Jahr erhebliche Anstrengungen unternommen, um die Fähigkeiten von Large Language Models zu verbessern, insbesondere bei der Lösung von Rechen- und mathematischen Problemen. Die Technologie der neuesten LLMs basiert auf den im Juni veröffentlichten Qwen2 LLMs und umfasst drei Modelle, die anhand ihrer Parameter skaliert sind.

Das Modell mit der größten Anzahl von Parametern, Qwen2-Math-72B-Instruct, hat laut dem Qwen-Team proprietäre US-LLMs in Mathematik-Benchmarks übertroffen. Diese Benchmarks beinhalteten GPT-4o, Claude 3.5 Sonnet von Anthropic, Gemini 1.5 Pro von Google und Llama-3.1-405B von Meta Platforms. Die Qwen2-Math KI-Modelle wurden sowohl an englischen als auch an chinesischen Mathe-Benchmarks getestet, darunter GSM8K, OlympiadBench und das Gaokao.

Die neuen Modelle haben noch einige Einschränkungen aufgrund ihrer “nur-Englisch-Unterstützung”, aber es ist geplant, bald zweisprachige Modelle zu veröffentlichen, mit multilingualen LLMs ebenfalls in der Entwicklungspipeline von Alibaba. Die Anerkennung der Large Language Models von Alibaba zeigt den schnellen Fortschritt des Unternehmens im Bereich der künstlichen Intelligenz, und der Abstand zwischen chinesischen und US-amerikanischen KI-Modellen scheint sich zu verringern.

Alibaba’s spezifisch für Mathematik entwickelte Modelle tragen weiter zu den AI-Kompetenzen des Unternehmens bei, nachdem das Qwen-72B-Instruct LLM kürzlich die weltweiten Top 10 Open-Source-Modell-Rankings anführte. Diese Entwicklung zeigt, dass China signifikante Fortschritte bei der Entwicklung von Inlands-LLMs gemacht hat.

Durch Tests und Benchmarks wird deutlich, dass Alibaba große Fortschritte im Bereich der künstlichen Intelligenz macht und auf dem Weg ist, führend in diesem Bereich zu werden. Die Rapidität der Entwicklung und die Anerkennung für die Qwen-Familie von Large Language Models unterstreichen das Engagement von Alibaba für die Forschung und Innovation in diesem Bereich.

Alibaba startet mathematikspezifische KI-Modelle, die laut Aussage LLMs von OpenAI und Google übertreffen

Zunehmender Einsatz von KI im Gesundheitswesen erfordert weltweite Nachhaltigkeitsinitiativen

Zunehmende Verbreitung künstlicher Intelligenz im indischen Gesundheitswesen

Zunehmende Beweise zeigen die Bedeutung von KI für das Gesundheitswesen

Zoom und Suki arbeiten zusammen, um KI-gestützte klinische Dokumentation bereitzustellen.

Hochleistungsfähige maschinelles Lernen-basierte Kalibrierung kostengünstiger Stickstoffdioxid-Sensoren unter Verwendung von Umgebungsparameter-Differenzen und globaler Datenskalierung – Wissenschaftliche Berichte

Schätzungen der klimabedingten Auswirkungen auf die Sterblichkeit in Deutschland auf Basis neuronaler Netzwerke: Anwendung auf Klimasimulationen von Handlungsgeschichten – Scientific Reports

XElemNet: Ein Machine Learning-Framework, das eine Reihe von erklärbaren KI-Technologien (XAI) für tiefe neuronale Netze in der Materialwissenschaft anwendet

Integration von maschinellem Lernen und Einzelzell-Transkriptomanalyse zur Identifizierung potenzieller Biomarker und Analyse immunologischer Merkmale bei ischämischem Schlaganfall

KI im Gesundheitswesen: Gestaltung der Zukunft der Gesundheitstechnologie-Landschaft in Indien

Künstliche Intelligenz an unerwarteten Orten: Transformation von Gesundheitswesen, Gaming, Einzelhandel und darüber hinaus

Die Zukunft von ChatGPT: Wird es kostenlos bleiben?

Exklusiv: Serve Robotics Executive Interview mit EnerCom – Oil & Gas 360