Alibaba startet mathematikspezifische KI-Modelle, die laut Aussage LLMs von OpenAI und Google übertreffen

Alibaba startet mathematikspezifische KI-Modelle, die laut Aussage LLMs von OpenAI und Google übertreffen

Die Alibaba Group Holding plant, mit einer Gruppe von mathematischen spezifischen Large Language Models (LLMs) namens Qwen2-Math die KI-Entwicklung auf ein neues Level zu heben und behauptet, dass diese die Fähigkeiten von OpenAI’s GPT-4o auf diesem Gebiet übertreffen können. Die Qwen-Gruppe von Alibaba’s Cloud-Computing-Einheit hat in den letzten Jahr erhebliche Anstrengungen unternommen, um die Fähigkeiten von Large Language Models zu verbessern, insbesondere bei der Lösung von Rechen- und mathematischen Problemen. Die Technologie der neuesten LLMs basiert auf den im Juni veröffentlichten Qwen2 LLMs und umfasst drei Modelle, die anhand ihrer Parameter skaliert sind.

Das Modell mit der größten Anzahl von Parametern, Qwen2-Math-72B-Instruct, hat laut dem Qwen-Team proprietäre US-LLMs in Mathematik-Benchmarks übertroffen. Diese Benchmarks beinhalteten GPT-4o, Claude 3.5 Sonnet von Anthropic, Gemini 1.5 Pro von Google und Llama-3.1-405B von Meta Platforms. Die Qwen2-Math KI-Modelle wurden sowohl an englischen als auch an chinesischen Mathe-Benchmarks getestet, darunter GSM8K, OlympiadBench und das Gaokao.

Die neuen Modelle haben noch einige Einschränkungen aufgrund ihrer “nur-Englisch-Unterstützung”, aber es ist geplant, bald zweisprachige Modelle zu veröffentlichen, mit multilingualen LLMs ebenfalls in der Entwicklungspipeline von Alibaba. Die Anerkennung der Large Language Models von Alibaba zeigt den schnellen Fortschritt des Unternehmens im Bereich der künstlichen Intelligenz, und der Abstand zwischen chinesischen und US-amerikanischen KI-Modellen scheint sich zu verringern.

Alibaba’s spezifisch für Mathematik entwickelte Modelle tragen weiter zu den AI-Kompetenzen des Unternehmens bei, nachdem das Qwen-72B-Instruct LLM kürzlich die weltweiten Top 10 Open-Source-Modell-Rankings anführte. Diese Entwicklung zeigt, dass China signifikante Fortschritte bei der Entwicklung von Inlands-LLMs gemacht hat.

Durch Tests und Benchmarks wird deutlich, dass Alibaba große Fortschritte im Bereich der künstlichen Intelligenz macht und auf dem Weg ist, führend in diesem Bereich zu werden. Die Rapidität der Entwicklung und die Anerkennung für die Qwen-Familie von Large Language Models unterstreichen das Engagement von Alibaba für die Forschung und Innovation in diesem Bereich.