Snabb implementering av kraftfull och effektiv AI och maskininlärning med Renesas MCU RA8M1

Av Kenton Williston

Bidraget med av DigiKeys nordamerikanska redaktörer

Ökningen av artificiell intelligens (AI), maskininlärning (ML) och andra beräkningsintensiva arbetsbelastningar i molnkanten för sakernas internet (IoT) innebär en extra belastning på microcontrollers (MCU:er). Hanteringen av dessa nya arbetsbelastningar ökar strömförbrukningen, även om konstruktörer uppmanas att minimera strömförbrukningen och påskynda marknadsintroduktionen.

Konstruktörer behöver ett beräkningsalternativ som bibehåller MCU:ns effektivitet och samtidigt tillför högeffektiva funktioner som är särskilt anpassade för användarfall med låg strömförbrukning. Alternativet bör också bevara de enkla driftsättningsmodeller som förknippas med traditionella MCU-enheter, samtidigt som tillräckliga funktioner läggs till för att stödja de sofistikerade tillämpningar som möjliggörs av AI och ML, till exempel röststyrning och förebyggande underhåll.

I den här artikeln diskuteras de faktorer som driver efterfrågan på AI och ML och den förklarar varför nya processorarkitekturer behövs för att leverera dessa funktioner på ett effektivt sätt. Därefter introduceras MCU-familjenRA8M1 från Renesas och visar hur den kan användas för att hantera dessa krav.

Kraven på avancerad AI och ML

Efterfrågan på AI och ML ökar för IoT-tillämpningar i molnkanten och sträcker sig från fastighetsautomation och industriella enheter till hushållsapparater. Även relativt små, inbäddade system med låg strömförbrukning har nu fått arbetsuppgifter som igenkänning av sökord, röststyrning och ljud- och bildbehandling. Måltillämpningarna omfattar sensorhubbar, navigering och styrning av drönare, förstärkt verklighet (AR), virtuell verklighet (VR) och kommunikationsutrustning.

För att minimera energiförbrukning, overheadkostnader och fördröjningar samtidigt som sekretessen garanteras, är det ofta bättre att bearbeta informationen i molnkanten än att skicka den till molnet. Detta är en utmaning för konstruktörer eftersom enheter i molnkanten ofta har begränsade resurser, i synnerhet om de är batteridrivna.

Förbättrade MCU-enheter för databehandling i molnkanten

Arbetsbelastningar för AI och ML innebär vanligtvis att samma matematiska operation utförs upprepade gånger i en stor datauppsättning. Arbetsbelastningarna är lämpade för acceleration med hjälp av SIMD-behandling (single instruction, multiple data). SIMD utför flera matematiska operationer parallellt, vilket ger betydligt högre genomströmning och bättre energieffektivitet än konventionell bearbetning.

Eftersom traditionella MCU:er saknar SIMD-funktionalitet behöver de hjälp med att exekvera AI- och ML-arbetsbelastningar. En lösning är att använda en digital signalprocessor (DSP) eller andra SIMD-acceleratorer tillsammans med MCU:n. Denna metod med flera processorer komplicerar dock systemkonstruktionen.

Ett annat alternativ är att byta till en högeffektiv mikroprocessorenhet (MPU) med SIMD-kapacitet. Detta kan ge den prestanda som krävs i en konfiguration med en enda processor, men MPU:er innebär kompromisser när det kommer till strömförbrukning och funktionsuppsättningar. Alla MPU:er är exempelvis inte utformade för att leverera de deterministiska beräkningar med låg latens som krävs i MCU-orienterade tillämpningar.

Möjliggörande av AI och ML i MCU:er

Renesas har insett behovet av en optimerad serie MCU-enheter för att stödja AI- och ML-arbetsbelastningar och lanserade därför MCU-serien RA8M1 (Figur 1). Serien är baserad på en Arm® Cortex®-M85 arkitektur med Helium och TrustZone, och kan köras i 480 megahertz (MHz) med en typisk strömförbrukning på 225 µA/MHz.

Diagram över Renesas MCU RA8M1 (klicka för att förstora)Figur 1: Renesas MCU RA8M1 är baserad på en Arm Cortex-M85 och innehåller Helium-teknik för att accelerera AI- och ML-bearbetning. (Bildkälla: Renesas)

MCU:n RA8M1 har konstrueras för effektiv prestanda och låg energiförbrukning, och har funktioner som determinism, kort avbrottstid och toppmodernt stöd för energihantering. Processorn uppnår en prestandaeffektivitet på 6,39 CoreMark/MHz.

Helium är en SIMD M-Profile Vector Extension (MVE) som avsevärt accelererar signalbehandling och ML. Den lägger till 150 skalär- och vektorinstruktioner och möjliggör bearbetning av 128-bitarsregister (figur 2). Den är optimerad för resursbegränsade microcontrollers med lägre strömförbrukning. Helium återanvänder t.ex. FPU-registren (Floating Point Unit) i stället för att införa nya SIMD-register. Detta bidrar till att sänka processorns strömförbrukning och minska konstruktionens komplexitet.

Diagram över hur Helium återanvänder FPU:ns registerbank för vektorbearbetningFigur 2: Helium återanvänder FPU:ns registerbank för vektorbearbetning. (Bildkälla: Arm)

Som framgår av figur 3 innehåller den Cortex-M85 som används i RA8M1 tekniken TrustZone från Arm. TrustZone tillhandahåller hårdvaruisolering av kritisk firmware, tillgångar och privat information. Cortex-M85 tillför också nya säkerhets- och trygghetsfunktioner, som t.ex. tillägget PACBTI (Pointer Authentication and Branch Target Identification). Dessa säkerhetsfunktioner är särskilt värdefulla i ett AI-sammanhang där en enhet kan interagera med personuppgifter.

Bild på TrustZone i Arm Cortex-M85Figur 3: TrustZone i Cortex-M85 tillhandahåller hårdvaruisolering för kritisk firmware, tillgångar och privat information. (Bildkälla: Arm)

Hårdvarufunktioner som behövs i en AI-kompatibel MCU

För att stödja AI-tillämpningar bör en MCU kombinera effektiv prestanda med en robust uppsättning funktioner. RA8M1 är välutrustad för motorstyrning, programmerbar logikstyrning (PLC), mätning och andra industriella och IoT-tillämpningar.

AI-algoritmer kräver till exempel mycket minne. Systemminnet i RA8M1 innehåller upp till 2 Mbyte flashminne och 1 Mbyte SRAM-minne. SRAM innehåller 128 Kbytes TCM-minne (tightly coupled memory), vilket möjliggör snabb minnesåtkomst för högeffektiva beräkningar.

För att säkerställa tillförlitlig drift är 384 kbyte av användar-SRAM och hela 128 kbyte av TCM konfigurerade som ECC-minne (error correction code). Instruktions- och datacacharna på 32 Kbyte är också ECC-skyddade.

RA8M1 innehåller flera säkerhetsfunktioner utöver de som ingår i Arm-kärnan. Dessa inkluderar RSIP-kryptografimotorn (Reprogrammable Secure Intellectual Property) för säker databehandling, oföränderlig lagring för skydd av kritisk information och mekanismer för manipulationsskydd.

MCU:n är utrustad med Ethernet för nätverksanslutning, Controller Area Network Flexible Data Rate (CAN FD) för fordons- och industritillämpningar samt USB High-Speed/Full-Speed för allmänna anslutningsmöjligheter. Den har också ett kameragränssnitt och ett oktalt SPI-gränssnitt (Serial Peripheral Interface) med direkt dekryptering av externt minne.

De analoga gränssnitten inkluderar en 12-bitars analog-till-digital-omvandlare (ADC) och digital-till-analog-omvandlare (DAC), analoga höghastighetskomparatorer och tre sample-and-hold-kretsar. För seriekommunikation har RA8M1 stöd för flera protokoll, inklusive SCI (Serial Communication Interface) med SPI, UART (Universal Asynchronous Receiver/Transmitter) och I²C-lägen (Inter-Integrated Circuit). MCU:n har också en förbättrad I3C-krets (Improved Inter-integrated Circuit) för ökad dataöverföringshastighet och effektivitet.

Utvecklare som behöver full tillgång till dessa I/O-funktioner (in-/utgångar) kan använda en BGA-kapsling (ball grid array) som R7FA8M1AHECBD#UC0 med 224 kulor. De som vill ha en effektivare konstruktions- och monteringsprocess för kretskort kan överväga att använda en LQFP-kapsling (low profile quad flat package), som t.ex. R7FA8M1AHECFB#AA0 med 144 stift.

Utvecklingsmiljöer för AI-tillämpningar

Konstruktörer som är intresserade av att experimentera med serien RA8M1 kan börja med utvärderingskortet EK-RA8M1 R7FA8M (figur 4). Kortet har ett RJ45 RMII Ethernet-gränssnitt, ett USB High-Speed värdenhets- och enhetsgränssnitt och en trepolig CAN FD-kontakt. I minnesväg innehåller det 64 Mbyte oktal SPI-flash.

Bild på utvärderingskortet EK-RA8M1 från Renesas (klicka för att förstora)Figur 4: Utvärderingskortet EK-RA8M1 har robust I/O-stöd för användning av MCU:n RA8M1. (Bildkälla: Renesas)

RA8M1 stöds av Renesas Flexible Software Package (FSP), ett omfattande ramverk som är utformat för att ge en användarvänlig, skalbar och högkvalitativ mjukvarubas för inbäddade system.

Paketet innehåller utvecklingsverktyg, inklusive den integrerade utvecklingsmiljön (IDE) e² studio som baseras på den populära integrerade utvecklingsmiljön (IDE) Eclipse. Den innehåller också två framstående, royaltyfria realtidsoperativsystem: Azure RTOS och FreeRTOS.

Paketet innehåller små, produktionsklara drivrutiner med stöd för vanliga användningsområden i inbäddade system. I kombination med utvärderingskortet ger drivrutinerna utvecklare en snabb väg till experimentering med in-/utgångarna i RA8M1.

Sammanfattning

RA8M1 ger utvecklare ett nytt alternativ för att implementera arbetsbelastningar för AI- och ML i IoT-tillämpningar som sparar ström, förbättrar prestandan, minskar komplexiteten och förkortar tiden till marknaden.

DigiKey logo

Disclaimer: The opinions, beliefs, and viewpoints expressed by the various authors and/or forum participants on this website do not necessarily reflect the opinions, beliefs, and viewpoints of DigiKey or official policies of DigiKey.

Om skribenten

Image of Kenton Williston

Kenton Williston

Kenton Williston tog sin kandidatexamen i elektroteknik år 2000 och började sin karriär som utvärderingsanalytiker för processorer. Sedan dess har han arbetat som redaktör för EE Times-gruppen och hjälpt till att starta och leda flera tidskrifter och konferenser för elektronikindustrin.

Om utgivaren

DigiKeys nordamerikanska redaktörer