Snabbare nätverksprestanda: Effekten av RDMA över Converged Ethernet (RoCE)
2024-12-27
Den snabba utvecklingen av beräkningsintensiva tillämpningar har ökat behovet av snabbare, effektivare och mer skalbara nätverkslösningar. En av de mest innovativa teknikerna för att möta denna efterfrågan är Remote Direct Memory Access (RDMA) via Converged Ethernet (RoCE). Denna banbrytande teknik möjliggör direkta dataöverföringar mellan system utan inblandning av processorn, vilket minskar latensen och förbättrar systemets övergripande prestanda avsevärt. iWave, ett framstående företag inom FPGA-konstruktion, ligger i framkant när det gäller denna utveckling och har implementerat en robust lösning för 100G Ethernet genom att integrera ERNIC IP (Ethernet RDMA Network Interface Controller Intellectual Property) från AMD i sitt sortiment med inbyggda datormoduler. Integrationen kommer att förbättra funktionerna för RDMA i högeffektiva tillämpningar.
Figur 1: RoCE möjliggör direkt dataöverföring mellan system utan inblandning från processorn, vilket minskar latensen och förbättrar systemets prestanda avsevärt. (Bildkälla: iWave)
Förståelse för RDMA via Converged Ethernet (RoCE)
RDMA är en viktig teknik för att möjliggöra direkta minnesöverföringar mellan värdar eller servrar, som på ett effektivt sätt kringgår processorn. Det gör att processorerna kan fokusera på att köra program och bearbeta information, vilket leder till märkbara förbättringar av nätverksprestanda i form av minskad latens, lägre processorbelastning och ökad bandbredd - allt på ett kostnadseffektivt sätt. RoCE är ett specifikt nätverksprotokoll som är utformat för att underlätta RDMA-åtgärder via Ethernet-nätverk. Genom att utnyttja den befintliga infrastrukturen för Ethernet utgör RoCE ett tilltalande alternativ för organisationer som vill förbättra prestandan utan att behöva se över sina nuvarande nätverkskonfigurationer.
Olika typer av RoCE
RoCE delas upp i två olika versioner baserat på det nätverkskort som används: RoCE v1 och RoCE v2.
- RoCE v1: Detta protokoll möjliggör kommunikation mellan två värdar som befinner sig inom samma Ethernet-domän för broadcast (VLAN). Den använder Ethertype 0x8915 och begränsar standardramarna för Ethernet till 1500 byte, medan jumboramar för Ethernet kan utökas till 9000 byte.
- RoCE v2: RoCE v2 löser begränsningarna i RoCE v1 och introducerar förbättringar i paketinkapslingen genom att införliva IP- och UDP-huvuden. Denna ändring gör det möjligt för RoCE v2 att fungera sömlöst via både lager 2 (datalänklagret) och lager 3 (nätverkslagret) för stödja routning i lager 3 och skalbarhet över flera subnät. RoCE v2, som ofta kallas Routable RoCE (RRoCE), har även stöd för IP-multicast, vilket ökar användningsområdet ytterligare.
ERNIC IP: förbättrad RDMA-kapacitet
ERNIC (Embedded RDMA enabled NIC) IP är en anpassningsbar Ethernet RDMA Network Interface Controller IP-kärna som är utformad för sömlös integration med FPGA:er från AMD, MPSoC:er och soft MAC IP-implementeringar. Lösningen kännetecknas av hög kapacitet, låg latens och en tillförlitlig dataöverföringsmekanism över via vanligt Ethernet som är helt oberoende av hårdvara. iWave har visat exempel på sitt engagemang för teknisk utveckling genom att implementera en framgångsrik lösning för 100G Ethernet. Denna prestation möjliggjordes genom användning av den Zynq UltraScale+ MPSoC-drivna utvecklingssatsen från iWave, som integrerar ERNIC IP från AMD.
Utvecklingssatsen Zynq UltraScale+ MPSoC är särskilt anpassad för prototyper och utvärdering av lösningar med 100G Ethernet och QSFP-28-kontaktdon för hög hastighet.
Demonstrationsinstallation
En typisk demonstrationsinstallation (figur 2) består av:
- iWaves utvecklingssats för Zynq UltraScale+ MPSoC ZU19EG med strömförsörjning
- Nätverkskortet Mellanox ConnectX-5 100G från Advantech
- Nätverkskort för 1G med Sync 1588 PTP aktiverat
- MTP-kabel, QSFP-28 moduler och CAT6 RJ45 Ethernet-kabel
- Serverdator med Ubuntu 22.04
Figur 2: En typisk installation med utvecklingssatsen Zynq UltraScale+ MPSoC. (Bildkälla: iWave)
Översikt över systemarkitekturen
Systemarkitekturen är utformad för att optimera dataöverföringen, med tydligt definierade roller mellan komponenterna PS (bearbetningssystem) och PL (programmerbar logik). Implementationen omfattar även PTP-synkronisering (Precision Time Protocol), vilket är avgörande för realtidstillämpningar. Med anmärkningsvärda prestandamått, som förmågan att hantera video i 8K med över 100 bilder per sekund, spänner de potentiella tillämpningarna över olika branscher, inklusive datacenter, multimedia och högeffektiv databehandling, vilket understryker teknikens mångsidighet och betydelse i moderna databehandlingsmiljöer.
Systemets arkitektur på hög nivå, som visas i figur 3, belyser de olika rollerna för PS- och PL-komponenterna inom Zynq UltraScale+ MPSoC. PS har en ARM Cortex-A53-baserad Hard SoC, som är nödvändig för systemkonfiguration, styrning och diagnostik. Viktiga komponenter i denna arkitektur är bland annat:
- MAC-drivkrets för 100G Ethernet: Garanterar robust prestanda och dataöverföring med låg latens vid 100 Gbit/s
- Drivkrets för ERNIC-styrenhet: Ansvarig för att hantera inkommande data till DDR och underlätta kommunikationen mellan användarens tillämpning och ERNIC IP genom effektiva utbyten av hälsningsmeddelanden
- RDMA-bibliotek för kärn- och användarutrymmen: Garanterar kompatibilitet och optimal prestanda för RDMA-åtgärder i både kärn- och användarutrymmen
Figur 3: Fördelarna med bearbetningssystemets olika roller och de programmerbara logikkomponenterna i Zynq UltraScale+ MPSoC. (Bildkälla: iWave)
AMD ERNIC IP flyttar effektivt över RoCE v2-stacken till FPGA:n, där ERNIC-styrenheten hanterar handskakningen mellan olika moduler för att underlätta dataöverföringen. Den genererar poster i arbetskön och skickar meddelanden (dörrklockor) till ERNIC IP. Samtidigt hanteras MAC-lagret och det fysiska lagret av delsystemet Zynq UltraScale+ MPSoC:s 100G Ethernet, medan datamönstergeneratorn ansvarar för att producera rådata och datamönster för video.
Precision Time Protocol (PTP)
PTP-tidsstämpeln (IEEE 1588 Standard) spelar en avgörande roll när det gäller att synkronisera tiden mellan olika system i ett Ethernet-nätverk. Synkroniseringen är avgörande för att förbättra prestandan i realtidstillämpningar och möjliggör synkroniserade datautbyten med låg latens på nanosekundnivå.
Viktiga funktioner i installationen
De funktioner som bör noteras i denna installation inkluderar:
- Implementering av 100G Ethernet över RoCE v2 med hjälp av AMD ERNIC IP
- Tillförlitlig transporttyp för anslutning
- RDMA SEND-, RDMA READ- och RDMA WRITE-funktioner för pakethantering
- Stöd för meddelandetyperna RDMA Send with Immediate och RDMA Write with Immediate
- Prestandatestning för RDMA med hjälp av programmen XRPING och PERFTEST
- Generator för anpassade datamönster för RAW och datamönster för video
- Infogning av PTP-tidsstämplar tillsammans med data
Den detaljerade genomströmningsstatistiken för överföringar av videodata från utvecklingssatsen Zynq UltraScale+ MPSoC till serverdatorn visar på imponerande prestanda, med kapacitet att hantera video i 8K med över 100 bps och video i 4K med över 400 bps.
Potentiella tillämpningar
Integrationen av RDMA över Converged Ethernet och ERNIC IP öppnar nya vägar för olika branscher och förbättrar anslutningsmöjligheterna, prestandan och effektiviteten i en rad olika tillämpningar avsevärt, inklusive:
- Datacenter och molnbaserad databehandling: Underlättar effektiv serverkommunikation och påskyndar databehandling i molnarkitekturer
- Inspelning och överföring av video/bilder: Fördelaktigt i multimediatillämpningar, sändning och VR-miljöer (virtual reality)
- Lagringslösningar: Möjliggör snabbare dataöverföring mellan lagringsenheter och servrar, vilket förbättrar lagringssystemets prestanda
- Högeffektiv databehandling (HPC): Ökade dataöverföringshastigheter och minskad latens i HPC-kluster för snabbare beräkningsuppgifter och simuleringar
- IoT-enheter i molnkanten: Möjliggör insamling och överföring av data i realtid från sensorer och enheter
Efterfrågan på snabbare och effektivare lösningar för dataöverföring fortsätter att öka, och RDMA över Converged Ethernet och ERNIC IP är redo att spela en avgörande roll den högeffektiva databehandlingens framtid.
Sammanfattning
Det omfattande sortimentet av FPGA- och SoC FPGA-plattformar från iWave, i kombination med dess djupa tekniska expertis, gör det möjligt för kunder att utveckla toppmoderna produkter som drar nytta av de senaste framstegen inom artificiell intelligens (AI), maskininlärning och databehandling i molnkanten. Genom att samarbeta med iWave kan företag påskynda sin produktutveckling, minska riskerna och ligga steget före konkurrenterna i ett alltmer komplext tekniskt landskap.
Kontakta oss på mktg@iwave-global.com, för mer information eller för att diskutera anpassade krav.
Disclaimer: The opinions, beliefs, and viewpoints expressed by the various authors and/or forum participants on this website do not necessarily reflect the opinions, beliefs, and viewpoints of DigiKey or official policies of DigiKey.




