Alibaba Cloud, das IT-Kompetenzzentrum der Alibaba Group, hat heute über 100 seiner neu eingeführten Large Language Models Qwen 2.5 weltweit Open Source veröffentlicht. Die Ankündigung erfolgte auf der Apsara-Konferenz, dem jährlichen Flaggschiff-Event des Unternehmens.
Zusätzlich hat Alibaba Cloud eine komplett überarbeitete Full-Stack-Infrastruktur vorgestellt, die den steigenden Anforderungen an leistungsstarke KI-Anwendungen gerecht wird. Diese neue Infrastruktur umfasst innovative Cloud-Produkte und -Services, die die Rechenleistung, Netzwerk-Performance und Architektur von Rechenzentren optimieren – alles mit dem Ziel, die Entwicklung und den Einsatz von KI-Modellen weiter voranzutreiben.
„Alibaba Cloud investiert so intensiv wie nie zuvor in die Entwicklung von KI-Technologien und den Ausbau globaler Infrastrukturen. Unser Ziel ist es, eine moderne KI-Infrastruktur aufzubauen, die unseren Kunden weltweit dabei hilft, ihr Geschäftspotenzial auszuschöpfen“, so Eddie Wu, Vorsitzender und CEO von Alibaba Cloud Intelligence.
Über 100 Open-Source-Modelle veröffentlicht
Die neu vorgestellten Qwen 2.5 Open-Source-Modelle, mit einer Größenordnung von 0,5 bis 72 Milliarden Parametern, bieten erweitertes Wissen und verbesserte Funktionen in Mathematik und Programmierung. Sie unterstützen über 29 Sprachen und eignen sich für eine breite Palette von KI-Anwendungen, sowohl in der Cloud als auch am Edge, und werden in Branchen wie Automobil, Gaming und Forschung eingesetzt.
Seit ihrer Einführung im April 2023 haben die Qwen-Modelle, das Portfolio der proprietären Large Language Models von Alibaba Cloud, große Erfolge erzielt. Bis heute wurden sie mehr als 40 Millionen Mal auf Plattformen wie Hugging Face und ModelScope, einer Open-Source-Plattform von Alibaba, heruntergeladen. Zudem haben sie die Entwicklung von über 50.000 weiteren Modellen auf Hugging Face inspiriert.
Mit der Veröffentlichung der Qwen 2.5-Serie stehen über 100 Modelle als Open Source zur Verfügung. Das umfassende Angebot umfasst Basismodelle, Anleitungsmodelle und quantisierte Modelle mit unterschiedlichen Genauigkeitsstufen und Methoden. Sie deckt verschiedene Modalitäten wie Text, Audio und Bildverarbeitung ab. Darüber hinaus sind spezialisierte Modelle für Codeverarbeitung und mathematische Aufgaben enthalten.
„Heute feiern wir einen wichtigen Schritt mit der Einführung unserer bisher größten Open-Source-Initiative“, sagte Jingren Zhou, Chief Technology Officer von Alibaba Cloud Intelligence. „Diese Initiative wird Entwicklern und Unternehmen aller Größen helfen, KI-Technologien besser zu nutzen und das Wachstum der Open-Source-Community fördern.“
Alibaba Cloud hat außerdem ein Upgrade seines Flaggschiffmodells Qwen-Max angekündigt. Das verbesserte Qwen-Max-Modell erreicht nun Leistungsniveaus, die mit denen der aktuellsten Modelle in den Bereichen Sprachverständnis, Schlussfolgerungen, Mathematik und Programmierung vergleichbar sind.
Erweiterte Multimodalität: Neue KI-Modelle für Video und Bildverarbeitung
Neben seiner umfangreichen Reihe großer Sprachmodelle hat Alibaba Cloud innerhalb der Reihe Tongyi Wanxiang ein neues Text-zu-Video-Modell vorgestellt. Dieses Modell kann hochwertige Videos in verschiedenen visuellen Stilen erzeugen, von realistischen Szenen bis hin zu 3D-Animationen. Es verarbeitet Textanweisungen in Chinesisch und Englisch und verwandelt statische Bilder in dynamische Videos. Es nutzt eine fortschrittliche Diffusion-Transformer (DiT)-Architektur zur Verbesserung der Video-Rekonstruktionsqualität.
Zusätzlich bringt Alibaba Cloud ein wichtiges Update für sein Vision-Language-Modell Qwen2-VL heraus. Dieses Modell kann Videos von über 20 Minuten Länge analysieren und unterstützt die Beantwortung von Fragen auf Basis von Video-Inhalten. Mit fortschrittlichen Funktionen zur Analyse und Entscheidungsfindung ist Qwen2-VL für die Integration in Mobiltelefone, Autos und Roboter ausgelegt und erleichtert die Automatisierung spezieller Aufgaben.
Im Bereich der Softwareentwicklung hat Alibaba Cloud zudem einen AI Developer vorgestellt, einen KI-Assistenten auf Basis von Qwen. Dieser unterstützt Programmierer dabei, Aufgaben wie Anforderungsanalyse, Codierung und das Identifizieren sowie Beheben von Softwarefehlern zu automatisieren. So können Entwickler ihre Zeit besser auf wesentliche Aufgaben konzentrieren und ihre Fähigkeiten weiter ausbauen.
Umfassendes Upgrade der KI-Infrastruktur
Alibaba Cloud hat eine Reihe bedeutender Updates für seine Full-Stack-KI-Infrastruktur angekündigt. Diese beinhalten:
- Rechenzentrumsarchitektur der nächsten Generation: Die neu vorgestellte CUBE DC 5.0-Architektur adressiert die steigende Nachfrage nach hoher Rechenleistung durch fortschrittliche Technologien wie ein Wind-Wasser-Kühlsystem, eine Gleichstrom-Stromversorgung und ein intelligentes Managementsystem. Diese Architektur erhöht die Energie- und Betriebseffizienz und reduziert die Bauzeiten um bis zu 50 Prozent durch vorgefertigte modulare Designs.
- Open Lake-Lösung für effiziente Datenverwertung: Die Open Lake-Lösung integriert große Datenverarbeitungssysteme und optimiert die Datenverwertung, insbesondere für generative KI-Anwendungen. Sie vereint Workflows, Leistungsoptimierung und umfassende Datenverwaltung auf einer einzigen Plattform. Die Trennung von Rechenleistung und Speicherung verbessert die Ressourcennutzung und führt zu signifikanten Einsparungen bei Kosten und Zeit.
- AI Scheduler mit integriertem Modelltraining und Inferenz: Der PAI AI Scheduler ist eine Cloud-native-Lösung zur effizienten Verwaltung von Modelltraining und -inferenz. Durch die intelligente Integration unterschiedlicher Rechenressourcen, flexibles Ressourcenmanagement, Echtzeitanpassungen und automatische Fehlerbehebung erreicht das System eine effektive Auslastung von über 90 Prozent.
- DMS für zentrales Metadatenmanagement: Die Plattform DMS OneMeta+OneOps ermöglicht die zentrale Verwaltung von über 40 Datentypen aus Datenbanken, Data Warehouses und Data Lakes in verschiedenen Cloud-Umgebungen. Sie steigert die Datenverwertungsrate um das Zehnfache und verbessert die Effizienz bei der Umwandlung von Daten in wertvolle Erkenntnisse.
- Leistungsstärkerer Elastic Compute Service: Die 9. Generation des Enterprise Elastic Compute Service (ECS) bietet signifikante Leistungssteigerungen: So wurde die Geschwindigkeit bei Suchempfehlungen um 30 Prozent erhöht und die Effektivität bei Lese- und Schreibvorgängen (Queries Per Second, QPS) um 17 Prozent verbessert, insbesondere bei der Nutzung von Datenbankprodukten im Vergleich zur Vorgängergeneration.