Luglio 1, 2024

GExperience

Se sei interessato alle notizie italiane Today e rimani aggiornato su viaggi, cultura, politica, situazione pandemica e tutto il resto, assicurati di seguire Life in Italy

Secondo quanto riferito, Amazon sta indagando su Perplexity AI dopo essere stata accusata di aver effettuato lo scraping di siti Web senza consenso

Secondo quanto riferito, Amazon sta indagando su Perplexity AI dopo essere stata accusata di aver effettuato lo scraping di siti Web senza consenso

Amazon Web Services ha avviato un’indagine per determinare se Perplexity AI stia violando le sue regole CablatoNello specifico, secondo quanto riferito, la divisione di cloud computing dell’azienda sta esaminando le accuse secondo cui il servizio utilizza un crawler, ospitato sui suoi server, che ignora il protocollo di esclusione della botnet. Questo protocollo è uno standard web, in cui gli sviluppatori inseriscono un file robots.txt su un dominio contenente istruzioni su se i robot possono o meno accedere a una determinata pagina. Il rispetto di queste istruzioni è volontario, ma i crawler di aziende rispettabili le hanno generalmente rispettate da quando gli sviluppatori web hanno iniziato a implementare lo standard negli anni ’90.

In un pezzo precedente, Cablato È stato segnalato Condé Nast ha annunciato la scoperta di una macchina virtuale che aggirava le istruzioni robots.txt del suo sito web. Questa macchina era ospitata su un server Amazon Web Services utilizzando l’indirizzo IP 44.221.181.252 che era “sicuramente gestito da Perplexity”. Si dice che abbia visitato altre proprietà di Condé Nast centinaia di volte negli ultimi tre mesi per raccogliere anche i loro contenuti. IL custode, Forbes E New York Times È stato anche scoperto più volte mentre visitava i loro posti, Cablato Egli ha detto. Per confermare se Perplexity sta davvero eliminando il suo contenuto, Cablato Ha inserito titoli o brevi descrizioni dei suoi articoli nel chatbot dell’azienda. Lo strumento ha poi risposto con risultati che parafrasavano fedelmente i suoi articoli “con un’attribuzione minima”.

recentemente Reuters Il rapporto afferma che Perplexity non è l’unica azienda di intelligenza artificiale ad andare oltre i file robots.txt per raccogliere contenuti utilizzati per addestrare modelli linguistici di grandi dimensioni. Tuttavia, sembra che Cablato Amazon ha fornito solo informazioni sul crawler AI Perplexity. “I Termini di servizio di AWS vietano attività abusive e illegali e i nostri clienti sono responsabili del rispetto di questi termini”, ci ha detto Amazon Web Services in una dichiarazione. “Riceviamo regolarmente segnalazioni di presunti abusi da una varietà di fonti e lavoriamo per coinvolgere i nostri clienti affinché comprendano tali segnalazioni.” Il portavoce ha anche aggiunto che lo ha detto la divisione cloud dell’azienda Cablato Stava indagando sulle informazioni fornite dalla pubblicazione così come fa su tutte le segnalazioni di potenziali violazioni.

READ  238.000 auto Ford Explorer richiamate a causa di un difetto che potrebbe portarle al ribaltamento

La portavoce di Perplexity, Sarah Blatnick, ha detto: Cablato L’azienda ha già risposto alle richieste di Amazon e ha negato che i suoi crawler bypassino il protocollo di esclusione dei robot. “Il nostro PerplexityBot, che viene eseguito su AWS, rispetta il file robots.txt e abbiamo confermato che i servizi controllati da Perplexity non eseguono la scansione in alcun modo che violi i Termini di servizio di AWS”, ha affermato. Blatnick ci ha detto che Amazon ha esaminato la questione Cablato La Società conduce indagini sui media solo come parte del protocollo standard per indagare sulle segnalazioni di uso improprio delle proprie risorse. Sembra che la società non abbia mai sentito parlare di alcun tipo di indagine da parte di Amazon. Cablato Ho chiamato l’azienda. Blatnick lo ha ammesso CablatoTuttavia, PerplexityBot ignorerà il file robots.text quando un utente include un URL specifico nella query del chatbot.

Anche Aravind Srinivas, CEO di Perplexity, aveva precedentemente negato che la sua azienda “ignori il protocollo di eccezione dei bot e poi menta al riguardo”. Srinivas lo ha ammesso Azienda veloce That Perplexity utilizza web crawler di terze parti oltre ai propri web crawler e il bot Cablato Uno di loro è stato identificato.

Aggiornato il 28 giugno 2024 alle 14:20 ET: Abbiamo aggiornato questo post per aggiungere la dichiarazione Perplexity a Engadget.

Aggiornato il 28 giugno 2024 alle 20:27 ET: Abbiamo aggiornato questo post con una dichiarazione di Amazon Web Services.