Hybrid-Reasoning für flexiblere Denkprozesse
Mit Qwen3 führt Alibaba erstmals sogenannte Hybrid-Reasoning-Modelle ein. Diese können dynamisch zwischen einem „Denkmodus“ für komplexe Aufgaben wie Mathematik, Programmierung und logisches Schlussfolgern und einem „Nicht-Denkmodus“ für schnelle, einfache Antworten wechseln.
Über die API lässt sich dabei zudem steuern, wie lange das Modell im Denkmodus bleiben darf – mit einem Kontextfenster bis maximal 38.000 Token. Besonders das neue Qwen3-235B-A22B-Modell (MoE) punktet laut Alibaba mit hoher Leistung bei deutlich geringeren Infrastrukturkosten im Vergleich zu anderen Modellen seiner Klasse.
Starke Performance bei Sprachen, Tools und Reasoning
Qwen3 wurde auf einem Datensatz mit 36 Billionen Token trainiert – doppelt so viel wie beim Vorgängermodell Qwen2.5 – und zeigt deutliche Fortschritte in den Bereichen multilinguale Fähigkeiten, Tool-Nutzung, Reasoning und Mensch-Maschine-Interaktion. Zu den Highlights zählen:
- Multilinguale Kompetenz: Das Modell unterstützt 119 Sprachen und Dialekte und liefert starke Ergebnisse bei Übersetzungen und der Verarbeitung mehrsprachiger Anfragen.
- Agentenfähigkeiten: Qwen3 unterstützt das Model Context Protocol (MCP) sowie leistungsstarkes Function Calling und gehört damit zu den führenden Open-Source-Modellen für komplexe, agentenbasierte Anwendungen.
- Reasoning-Leistung: In Benchmarks zu Mathematik, Programmierung und logischem Schlussfolgern übertrifft Qwen3 alle bisherigen Modelle der Reihe – darunter QwQ im Denkmodus und Qwen2.5 im Nicht-Denkmodus.
- Bessere Mensch-Maschine-Interaktion: Qwen3 sorgt für natürlichere kreative Texte, realistischere Rollenspiele und flüssigere mehrstufige Dialoge, die das Nutzererlebnis deutlich verbessern.
Dank einer neuen Modellarchitektur, eines vergrößerten Trainingsdatensatzes und optimierter Lernmethoden erzielt Qwen3 Bestwerte in Benchmarks wie AIME25 (mathematisches Reasoning), LiveCodeBench (Programmierkompetenz), BFCL (Tool- und Funktionsnutzung) und Arena-Hard (Instruction Tuning). Die Entwicklung des Hybrid-Reasoning-Modells basiert auf einem vierstufigen Trainingsprozess: Zunächst startet das Modell mit einem Cold Start, bei dem es lernt, komplexe Aufgaben in nachvollziehbare Denkschritte aufzuteilen (Chain-of-Thought). Darauf folgt reasoning-basiertes Reinforcement Learning, das Verschmelzen von Denk- und Nicht-Denkmodus sowie ein abschließendes Feintuning durch allgemeines Reinforcement Learning.
Freie Verfügbarkeit, um Innovation zu fördern
Die Qwen3-Modelle sind ab sofort kostenlos über Hugging Face, Github und ModelScope verfügbar. Interaktive Tests können auf chat.qwen.ai durchgeführt werden. Ein API-Zugang wird in Kürze über Alibabas Model Studio bereitgestellt. Zudem wird Qwen3 bereits in Alibabas hauseigener Superassistent-App Quark eingesetzt.
Seit ihrer Veröffentlichung wurde die Qwen-Modellreihe mehr als 300 Millionen Mal heruntergeladen. Über 100.000 abgeleitete Qwen-Modelle wurden von Entwicklern auf Hugging Face erstellt, wodurch Qwen zu einer der am meisten genutzten Open-Source-AI-Modellreihen weltweit zählt.