SEK | EUR | USD

Öppnar maskininlärning en dörr in till era industrisystem för hackare?

By Carolyn Mathas

Contributed By Digi-Keys nordamerikanska redaktörer

Alla databehandlingsmetoder har sina egna säkerhetsrisker, och maskininlärning (ML) är inget undantag. Lyckligtvis är sårbarheterna inom detta segment för artificiell intelligens (AI) förhållandevis förutsägbara. Dessvärre är de emellertid inte alltid lätta att upptäcka.

Att det är en stor utmaning är inte svårt att förstå när man tar med i beräkningen den mängd data det gäller, granulariteten för denna data och det faktum att maskininlärningsmotorn både lär sig och förbättrar sig själv under processens gång. Vid maskininlärning behandlas data från mönster som är omöjliga att upptäcka för människor och som kan vara både en tillgång och en säkerhetsrisk.

Alla områden inom artificiell intelligens ger hög effektivitet, hög kvalitet och ofta oöverträffad innovation. Inom tillverkningsprocesser bidrar AI exempelvis till att hitta och åtgärda problem, och AI-baserade säkerhetsmetoder skyddar de berörda processerna.

Maskininlärning ”lär sig” med träningsalgoritmer och fastställer tänkbart utfall för en situation, medan djupinlärningsalgoritmer (DL) (en annan underkategori inom AI) gör att programvaran kan träna sig själv i att utföra uppgifter. I detta exempel exponeras flerlagrade neurala nätverk för miljontals datapunkter och speglar förmågan hos den mänskliga hjärnan att känna igen mönster samt kategorisera och förtydliga information.

Sårbarheter inom maskininlärning

Så åter till frågan vi ställde tidigare då. Öppnar maskininlärning en dörr in till era industrisystem för hackare? Svaret är att det inte finns något som heter idiotsäkert, särskilt inte i en snabbt växande bransch. Men det betyder inte att det inte finns både bra och dåligt utformade system för maskininlärning/djupinlärning och att visa system är mer lätthackade än andra.

Gartner förutsäger att maskininlärning år 2025 kommer att vara en del av alla säkerhetslösningar. Under tiden kommer antalet säkerhetsöverträdelser som behöver hanteras att fördubblas. Som exempel på effektiva försök att lösa detta kan vi ta Google, vilka blockerar cirka 99 % av all skräppost med hjälp av maskininlärning. IBM:s Watson sägs ha förhindrat 200 miljoner cyberattacker som utfördes mot Wimbledon 2017. Maskininlärningsalgoritmer spelar en viktig roll i att säkra molnbaserade plattformar och analysera misstänkta aktiviteter, inklusive inloggningar och andra avvikelser.

Det vanligaste angreppet är när skadlig teknik används för att infiltrera modeller med skadlig kod så att modellerna begår ett misstag. När ny indata är infekterad med skadlig data fungerar modellen dåligt, men modellens statistiska prestanda kan vara opåverkad. Maskininlärningsmodeller kan också angripas på följande sätt:

  • Försämra integriteten är ett sätt. Om maskininlärningsmodellen inte filtrerar ut ett eller flera negativa fall och dessa passerar systemet kan systemet hackas.
  • Undersökande angrepp genomförs för att försöka förstå modellförutsägelser med hjälp av värden för indatapost.
  • Angrepp med följdverkan ändrar inlärningsdata och själva modellen. Indataposter som passerar genom systemet kan ha en skadlig post som tar sig in eller ofarlig post som blockeras och inte kan ta sig in.
  • Integriteten angrips om skadlig kod tar sig genom skyddet, så att angriparen kan ta sig in regelbundet och det finns risk att systemet bedömer skadlig indata som ofarlig data.
  • Tillgänglighetsattacker kommer när modellen har lärts in med en angripares data och bra indata filtreras bort från systemet. I detta scenario kan legitima poster avlägsnas.

Det är förvisso så att kriminell aktivitet blir allt vanligare inom maskininlärning, men det är långt ifrån så enkelt som det kan låta. Som tur är finns det mycket enkla sätt att skydda system, innan man tar till det tunga artilleriet. Om till exempel systemets programvara är inaktuell och uppdateringar inte hämtas direkt när de finns tillgängliga underlättas angrepp. Det är viktigt med både säkra autentiseringsuppgifter och flerfaktorautentisering. Dessutom måste nätverk ha andra säkerhetslösningar än enkla användarnamn/lösenord.

Hur ska jag börja?

Som hjälp vid utveckling av AI-tillämpningar finns följande satser:

NVIDIA Jetson Nano utvecklingssats från Seeed Technology har den prestanda som behövs för den typen av arbetsuppgifter inom AI, som djupinlärning, visuellt innehåll, databehandling för grafikprocessorer och processning av multimedia (figur 1). Med hjälp av denna kan användare köra AI-ramverk och -modeller för tillämpningar som bildklassificering, objektdetektering, segmentering och taligenkänning. Det är helt enkelt ett enkelt sätt att ansluta flera olika sensorer för att kunna utföra flera olika AI-tillämpningar.

Bild på JetPack från Seeed TechnologyFigur 1: Jetson Nano stöds av JetPack från Seeed Technology, vilket omfattar ett kortsupportpaket, Linux OS, NVIDIA CUDA, cuDNN och TensorRT programvarubibliotek för AI-applikationer. (Bildkälla: Seeed)

Adafruit och Digi-Key visade nyligen det inbäddade utvärderingskortet BrainCraft EDGE BADGE (figur 2) och tog därmed maskininlärning ett steg framåt med hjälp av små microcontrollers genom att köra en miniatyrversion av TensorFlow Lite. Kortet, som är ungefär lika stort som ett kreditkort (se figur 2), drivs av Microchips ATSAMD51J19 med 512 kb flashminne och 192 kb RAM. Det har inbyggd mikrofoningång för taligenkänning och ett Arduino-bibliotek med demonstrationer om igenkänning av olika ordpar och gester.

Bild på Adafruit Supercon ID-brickaFigur 2: Denna Supercon ID-bricka kan också användas som namnbricka programmerad med CircuitPython. Den visas som en USB-enhet, utan behov av IDE för att visa namn, QR-koder eller annan information. (Bildkälla: Adafruit)

Slutligen kan sägas att avancerade sensorer som STMicroelectronics LSM6DOX kombinerar en maskininlärningskärna, en finit tillståndsmaskin och avancerade digitala funktioner. Detta är en mycket bra uppgradering för företagets STM32-mikroprocessorer så att man kan uppnå den prestanda och precision som krävs för AI-funktioner.

Trender framöver

Idag finns det molnbaserade beräkningsmodeller som använder tillgängliga maskininlärningsplattformar via kognitiv databehandling, automatiserad maskininlärning, modellhantering med maskininlärning, modellbetjäning med maskininlärning och databehandling baserad på grafikprocessorer. Med tanke på den mängd data som behövs för maskininlärning och djupinlärning kan vi emellertid konstatera att det finns gott om rubriker om allt större molnangrepp.

Företag gör rätt i att vara försiktiga när det gäller flytt av känsliga data till molnet om dessa data omfattar AI och maskininlärning. De säkerhetsprinciper som krävs för att verkligen kunna skydda känslig data och metoder att hantera angrepp är inte alltid så tillförlitliga som de skulle behöva vara.

Det är en ofattbar mängd data som genereras av IoT. Data som krävs för att starta AI, automatisering, maskininlärning etc. (särskilt om den omfattar äldre data) måste vara korrekt för den specifika tillämpningen.

Här är en kort lista över de åtgärder som utvecklare måste vidta vid implementering av AI och maskininlärning.

  • Känna till och förstå var det finns luckor i befintlig data
  • Förstå vilka arbetsflöden som kommer att påverkas av potentiella AI-projekt
  • Säkerställa att hela företaget arbetar mot ett etablerat och kommunicerat slutmål och känna till hur alla deltar i den processen
  • Utnyttja tekniken och möjligheterna snarare än att försöka skära i kostnaderna
  • Börja med datarensning för att detektera, korrigera och avlägsna korrupta och felaktiga poster

Sammanfattning

För AI och maskininlärning krävs det datadrivande algoritmer och beslut av hög kvalitet. Artificiell intelligens, maskininlärning och djupinlärning kommer med största sannolikhet att utgöra en stor påverkan på de flesta företag någon gång i framtiden Maskininlärningsalgoritmer är redan en vanlig metod för detektering av filbaserad skadlig kod och för blockering av skadlig kod. De fastställer också vilka applikationer som är osäkra och isolerar dem från produktionssystem. AI används också inom finansiella tjänster, hälso- och sjukvård samt försäkringsbranschen för skydd av extremt känslig data.

Det är sant att vi är fängslade av själva konceptet AI/maskininlärning. Det kommer att bli ett fantastiskt verktyg när det används med sin fulla potential. Försäkra er bara om att ni har tillräcklig kunskap om ämnet inom företaget eller att ni har en partner inom molntjänster/implementering att luta er mot när det gäller dataintrång.

Disclaimer: The opinions, beliefs, and viewpoints expressed by the various authors and/or forum participants on this website do not necessarily reflect the opinions, beliefs, and viewpoints of Digi-Key Electronics or official policies of Digi-Key Electronics.

Om skribenten

Carolyn Mathas

Carolyn Mathas har burit både redaktörs- och skribenthattar för publikationer som EDN, EE Times Designlines, Light Reading, Lightwave och Electronic Products i mer än 20 år. Hon levererar även anpassat innehåll och marknadsföringstjänster till ett flertal företag.

Om utgivaren

Digi-Keys nordamerikanska redaktörer