Maskininlärning har kommit för att stanna – använd det på rätt sätt

Maskininlärning (ML) – en underkategori till artificiell intelligens (AI) – används redan framgångsrikt i tillämpningar som medicinsk diagnostik, bildbehandling, klassificering, förutsägelse, regressionstestning etc. Om vi tittar lite närmare på maskininlärning kan vi se att det generellt finns två riskområden: säkerhet vid användning och äventyrande av validiteten i dess resultat.

Figur 1: det industriella sakernas internet (IIoT) har många sammankopplingar som kan hanteras effektivare om systemet använder maskininlärning. (Bildkälla: SlideShare.net)

Säkerhetsattacker inom AI har förekommit länge, men vad som är nytt är att de blir allt mer sofistikerade. Attackytan (antalet punkter där obehöriga användare kan ta sig in eller från vilka det går att extrahera data) kan utsättas för angrepp. Det finns tre riskområden med sårbarheter: inkommande data, algoritmdesign och beslut vid utmatning.

Maskininlärningsresultatet förbättras om det finns tillgång till stora datamängder som motorn kan lära sig av på en nivå som det är svårt för människor att uppnå. Angreppen är till exempel inlärda modeller som smittas med bakdörrar och placering av nyttolast eller utlösare med skadlig kod. För detta segment inom AI är algoritmerna komplexa och oförutsägbara, de omfattas inte av standarder eller förordningar och de är baserade på äganderättsligt skyddad data vilket gör det än svårare att upptäcka eventuell manipulation.

Förutom säkerhet finns det ytterligare ett riskområde. Eftersom maskininlärningsmodeller skapas av människor riskerar de att smittas med bias som byggs in i modellen. Databias är farligt och måste hanteras på rätt sätt. Hantering av bias är en mycket viktig aspekt av riskhantering inom maskininlärning.

Andra risker är otillräckliga data och förekomst av bra eller lämplig data. Avsaknaden av variabel data med tillräckliga datapunkter (för att kunna hitta bästa möjliga indata för att uppnå optimal utdata) kan vara ett stort problem. Den data som maskininlärningsmodeller består av bör varieras vad gäller datatyp, tidsramar och andra typer av variabilitet.

Slutligen har vi tolkningar av utdata. Det finns alltid en risk för feltolkningar av utdata.Modeller tillhandahåller uppskattningar och vägledning, men för att tolkningarna ska ha så bra värde som möjligt är det viktigt att ta med i beräkningen hur modellen byggdes upp, vilka antaganden som gjordes och hur utdata ska tolkas.

Det finns mycket som kan gå fel, som till exempel följande:

  • Algoritmer sägs ligga bakom det brittiska pundets fall på 6 % under 2 minuter vid folkomröstningen om brexit 2016.
  • Algoritmer som används i straffrättssystem i hela USA och som förutsäger återfallsfrekvens har rasrelaterad bias.
  • Många resultat från hjärnundersökningar kan ifrågasättas till följd av felaktiga statistiska antaganden, och fel har upptäckts i funktionell MRI (fMRI).
  • När bitcoin-kursen steg snabbt under 2017 lyckades hackare utvinna bitcoin kostnadsfritt med hjälp av Google Cloud-instanser. Google Clouds system för avvikelseidentifiering användes för Google Cloud-instanser så att kunder fick varningar om säkerhetsluckan.

Maskininlärningssystem löser svåra problem. Det faktum att maskininlärning påverkas negativt vad gäller säkerhet och precision påverkas också av framsteg inom den använda tekniken och av tillväxten för framgångsrika applikationer som använder den.

Framsteg inom maskininlärning på senare tid

STMicroelectronics presenterade nyligen den första maskininlärningsapplikationen på sin STM32G4 av partnern Cartesiam, en medlem av partnerprogrammet ST inom maskininlärning. ST lanserade STM32Cube.AI för att utvecklare på ett enkelt sätt skulle kunna träna ett neuralt nätverk genom att samla in data. Denna data processas sedan i ett träningsramverk för neurala nätverk på en dator i att känna igen specifika aktiviteter som till exempel gång, löpning eller simning. Utdata konverteras därefter till kod med hjälp av vilken STM32-microcontrollers kan känna igen dessa aktiviteter.

Figur 2: Bilden visar STMicroelectronics utvärderingskort SensorTile. (Bildkälla: STMicroelectronics)

Cartesiams NanoEdge AI kör inlärningsfasen på microcontrollern. Ingenjörer väljer denna lösning när de inte kan skapa förinlärda modeller för specifika situationer men fortfarande vill använda sig av maskininlärning för att komma på smarta lösningar. Träningsfasen körs på microcontrollern för att lära in normalt beteende för en enhet inom dess avsedda miljö. Därefter kör träningsfasen interferenser på samma microcontroller för att detektera och rapportera avvikelser i beteende.

Med NanoEdge AI kan utvecklare enkelt integrera lokal kapacitet för AI-träning och -analys i C-kod, vilken optimeras för STM32-microcontrollers. I demonstrationer har Cartesiam visat hur dess maskininlärningsbibliotek skulle kunna använda STM:s SensorTile-modul, SensorTile utvärderingskort (figur 2), för att lära in beteendet för en BLDC-motor med hjälp av vibrationsanalys och därefter detektera och rapportera en avvikelse tack vare den inbäddade microcontrollern STM32L4.

Det finns även en maskininlärningskärna på STMicroelectronics avancerade sensorer, som till exempel LSM6DSOX iNEMO. Med denna kärna (kombinerad med en finit tillståndsmaskin (FSM) och avancerade digitala funktioner) kan man växla från ultralåg effekt till hög prestanda, AI-kapacitet med hög noggrannhet för batteridriven sakernas internet, spel, bärbar teknik och hemelektronik. Tack vare att den stöder typiska operativsystemskrav kan den erbjuda verkliga sensorer, virtuella sensorer och batch-sensorer med 9 kb RAM för dynamisk datagruppering.

Samtidigt som artificiell intelligens och maskininlärning i alla dess former fortsätter att imponera är det kombinationen av nya tillämpningar, kvaliteten för utdata och möjligheten att upprätthålla säkerheten som kommer att driva på dess utveckling.

Om skribenten

Image of Carolyn Mathas

Carolyn Mathas har burit både redaktörs- och skribenthattar för publikationer som EDN, EE Times Designlines, Light Reading, Lightwave och Electronic Products i mer än 20 år. Hon levererar även anpassat innehåll och marknadsföringstjänster till ett flertal företag.

More posts by Carolyn Mathas
 TechForum

Have questions or comments? Continue the conversation on TechForum, DigiKey's online community and technical resource.

Visit TechForum