Parte qualsiasi cosa, recentemente pubblicato da Facebook Research, fa qualcosa che la maggior parte delle persone immerse nella visione artificiale ha trovato scoraggiante: sapere in modo affidabile quali pixel in un’immagine appartengono a un oggetto. Renderlo più semplice è l’obiettivo del Segment Anything Model (SAM), che è stato recentemente rilasciato sotto la licenza Apache 2.0.
I risultati sembrano ottimi e ci sono È disponibile una presentazione interattiva Puoi giocare con i diversi modi in cui funziona SAM. Si possono raccogliere le cose puntando e facendo clic su un’immagine, oppure le immagini possono essere divise automaticamente. Onestamente, è impressionante vedere SAM rendere il mascheramento di vari oggetti in un’immagine così semplice. Ciò che lo rende possibile è l’apprendimento automatico, e parte di ciò è il fatto che il modello alla base del sistema è stato addestrato su un enorme set di dati di immagini e maschere di alta qualità, il che lo rende estremamente efficiente in quello che fa.
Una volta segmentata l’immagine, queste maschere possono essere utilizzate per interagire con altri sistemi come il rilevamento di oggetti (che identifica e classifica cos’è un oggetto) e altre applicazioni di visione artificiale. Questo sistema funziona in modo più potente se sanno davvero dove cercare, dopotutto. Questo Post sul blog di Meta AI Entra in alcuni dettagli aggiuntivi su ciò che è possibile fare con SAM, dettagli completi in documento di ricerca.
Tali sistemi si basano su set di dati di alta qualità. Naturalmente, niente batte un sacco di dati del mondo reale, ma abbiamo anche visto che è possibile generare dati automatizzati che in realtà non esistevano e ottenere risultati utili.
“Esperto di Internet. Lettore. Fanatico della TV. Comunicatore amichevole. Esperto di alcolisti certificato. Appassionato di pancetta. Esploratore. Evil twitteraholic.”