Google erbjuder gratis metadatamängder med få-shot Deep Learning AI och maskininlärningsalgoritmer för snabb och effektiv bildklassificering i TensorFlow och PyTorch

Google har meddelat att det finns flera datamängder bestående av olika men begränsade naturliga bilder. Sökjätten är övertygad om att de offentligt tillgängliga uppgifterna kommer att driva tempoet för maskininlärning och artificiell intelligens samtidigt som det minskar den tid det tar att träna AI-modellerna på en minimal mängd data. Google kallar det nya initiativet ”Free Meta-Datasets” som hjälper AI-modeller att ”lära sig” på mindre data. 'Few-Shot AI' från företaget är optimerat för att säkerställa att AI lär sig nya klasser från endast några få representativa bilder.

Förståelse för behovet av att snabbt utbilda AI- och maskininlärningsmodeller med färre datamängder, har Google lanserat 'Meta-Dataset', en liten samling bilder som skulle hjälpa till att minska mängden data som behövs för att förbättra noggrannheten i algoritmer. Företaget hävdar att AI- och ML-modellerna kommer att få samma insikter från mycket färre representativa bilder genom att använda få-bilds bildklassificeringstekniker.

Google AI tillkännager metadatamängden: En datamängd för datamängder för inlärning med få bilder:

Deep Learning för AI och maskininlärning har ökat exponentiellt under ganska lång tid. Kärnkravet är dock tillgången på högkvalitativa data och det också i stora mängder. De stora mängderna av manuellt kommenterade träningsdata är ofta svåra att skaffa och kan ibland vara opålitliga också. Förstå riskerna med stora datamängder har Google meddelat att det finns en samling metadatamängder.

Genom ”Meta-Dataset: A Dataset of Datasets for Learning to Learn from Few Exempler” (presenterad vid ICLR 2020) har Google föreslagit ett storskaligt och mångsidigt riktmärke för att mäta kompetensen hos olika bildklassificeringsmodeller i ett realistiskt och utmanande fåtal. -bild inställning, erbjuder ett ramverk där man kan undersöka flera viktiga aspekter av få-shot klassificering. I huvudsak erbjuder Google 10 allmänt tillgängliga och kostnadsfria datauppsättningar av naturliga bilder. Dessa datamängder består av ImageNet, CUB-200-2011, Fungi, handskrivna karaktärer och klotter. Koden är offentlig och innehåller en anteckningsbok som visar hur Meta-dataset kan användas i TensorFlow och PyTorch.

Få klassificeringar går utöver standardutbildnings- och djupinlärningsmodellerna. Det tar generalisering till helt nya klasser vid testtiden. Med andra ord sågs bilderna som användes under testningen inte under träningen. I ett klassificering med få skott innehåller träningssatsen klasser som är helt oskiljaktiga från de som kommer att visas vid testtiden. Varje testuppgift innehåller en supportuppsättningav några märkta bilder från vilka modellen kan lära sig om de nya klasserna och en ojämnhet frågesetav exempel som modellen sedan ombeds klassificera.

En metadatamängd är en stor komponent där modellen studerar generalisering till helt nya datamängder, från vilka inga bilder från någon klass sågs under träning. Detta är förutom den tuffa generaliseringsutmaningen för nya klasser som är inbyggda i inställningen för inlärning av få bilder.

Hur hjälper metadatauppsättning till djupinlärning för AI och maskininlärningsmodeller?

Meta-dataset representerar det största organiserade riktmärket för klassificering av korsdatauppsättningar med få bilder hittills. Det introducerar också en samplingsalgoritm för att generera uppgifter med olika egenskaper och svårigheter, genom att variera antalet klasser i varje uppgift, antalet tillgängliga exempel per klass, införa klassobalanser och, för vissa datamängder, variera graden av likhet mellan klasser för varje uppgift.

Meta-dataset introducerar nya utmaningar för klassificering med få skott. Googles forskning är fortfarande preliminär och det finns mycket att täcka. Sökjätten har dock hävdat att forskare upplever framgång. Några av de anmärkningsvärda exemplen inkluderar användning av smart designad uppgiftskonditionering, mer sofistikerad hyperparameteravstämning, en 'meta-baslinje' som kombinerar fördelarna med förutbildning och metalärande, och slutligen använder funktionsval för att specialisera en universell representation för varje uppgift .