Die Alibaba Group gibt einen selbst entwickelten Datenverkehrskontrollmechanismus namens HPCC (High Precision Congestion Control) bekannt. Die Technologie ermöglicht Datenübertragung mit extrem geringer Latenzzeit, hoher Bandbreite und hoher Stabilität. Dies ist ein wichtiger Meilenstein auf dem Weg zu Ultra-High-Speed-Rechenzentren, die unerlässlich sind, um das volle Potenzial von KI und IoT zu schöpfen.
Alibaba macht diese Ankündigung innerhalb eines Forschungspapiers, das auf der hochrangigen akademischen Konferenz ACM SIGCOMM’19 in Peking, China, veröffentlicht wurde.
Forscher von Alibaba haben in Laborexperimenten und groß angelegten Simulationen bewiesen, dass HPCC im Vergleich zu anderen Alternativen schneller auf verfügbare Bandbreite und Überlastung reagiert und dabei Warteschlangen nahe Null hält. In den Simulationen für unter 50 Prozent Verkehrslast verkürzt HPCC die Ablaufzeiten um bis zu 95 Prozent und verursacht selbst bei größeren Incasts wenig Staus.
Das Papier diskutiert, wie die Leistung des Rechenzentrumsnetzwerks heutzutage für die Servicequalität einer Cloud wesentlich ist und dass eine schnellere Netzwerkgeschwindigkeit die Erfahrung der Cloud-Nutzer erheblich verbessern kann. Angetrieben von der Notwendigkeit schnellerer Netzwerke hat die Siliziumindustrie in den letzten zehn Jahren die Verbindungsgeschwindigkeit in Rechenzentren erfolgreich von 1 Gbit/s auf 100 Gbit/s erhöht, eine Wachstumsrate, die sogar die Prognose des Mooreschen Gesetzes übertrifft.
Schnellere Hardware allein reicht nicht aus, um zu einer extrem schnellen Vernetzung in Rechenzentren zu führen. Eine weitere Überlegung ist, dass eine höhere Verbindungsgeschwindigkeit auch der Netzwerkstabilität schaden kann, da bei schnelleren Sendern, die gleichzeitig Daten im Netzwerk übertragen können, eine Überlastung wahrscheinlicher ist. Überlastung ist auch schädlich für die Netzwerklatenz, die Anwendungen aufgrund von Warteschlangenverzögerungen und möglichen Paketverlusten erleiden.
Aus jahrelanger Erfahrung im Betrieb von großen und schnellen RDMA-Netzwerken kennt Alibaba die inhärenten Einschränkungen der vorhandenen Staukontrolllösungen, darunter langsame Konvergenz, unvermeidliche Warteschlangen für Pakete und komplizierte Parametereinstellung. Der neue HPCC soll diese Lücke schließen.
Die Forscher fanden heraus, dass die Hauptursache für solche Einschränkungen in den bestehenden Lösungen der Mangel an granularen Netzwerklastinformationen in älteren Netzwerken ist. Dieser Zustand hat sich jedoch in jüngster Zeit mit der Verfügbarkeit neuer Funktionen wie In-Band Netzwerk Telemetrie (INT) geändert. Insbesondere neue Switching-ASICs sind in der Lage, detaillierte Netzwerklastinformationen zu erhalten und diese zu nutzen, um eine Art Überlastungssteuerungsmechanismus bereitzustellen, der ein stabiles und extrem schnelles Netzwerk liefern kann.
Die Alibaba-Forscher haben HPCC als Mechanismus vorgeschlagen, da es das Potenzial hat, INT zu nutzen, um Linklastinformationen zu erhalten und den Verkehr mit hoher Präzision zu steuern.
Indem es Herausforderungen wie verzögerte INT-Informationen während einer Überlastung oder Überreaktion auf INT-Informationen löst, kann HPCC schnell die freie Bandbreite nutzen und beinahe Null Warteschlangen innerhalb des Netzwerks und damir extrem niedrige Latenzzeiten erreichen. HPCC hat den zusätzlichen Vorteil, dass nur drei Parameter zur Konfiguration benötigt werden; es ist zudem einfach in der Hardware zu implementieren.
Weitere Informationen finden Sie in dem Whitepaper, das Ihnen hier (auf Englisch) zum Download zur Verfügung steht.