Cloudflare rivela la scansione segreta di siti Web bloccati da parte di Perplexity, scatenando reazioni negative e sollevando preoccupazioni sull’etica dell’intelligenza artificiale, sulla trasparenza e sullo scraping dei contenuti

Cloudflare rivela la scansione segreta di siti Web bloccati da parte di Perplexity, scatenando reazioni negative e sollevando preoccupazioni sull’etica dell’intelligenza artificiale, sulla trasparenza e sullo scraping dei contenuti

La startup di ricerca basata sull’intelligenza artificiale Perplexity si ritrova al centro di una controversia a seguito di accuse di aver eluso le misure volte a impedire ai suoi web crawler di accedere a determinati siti web protetti. Un recente rapporto di Cloudflare sostiene che Perplexity abbia impiegato tattiche ingannevoli, camuffando la propria identità per aggirare le restrizioni volte a salvaguardare i contenuti dei siti web. Nello specifico, le accuse suggeriscono che l’azienda abbia aggirato le linee guida stabilite nei file robots.txt, che indicano quali sezioni di un sito dovrebbero rimanere off-limits per i bot, utilizzando user agent mascherati e cambiando provider di servizi per evitare di essere rilevata.

La controversia su Perplexity si inasprisce con le accuse di scansione di siti web protetti

Le accuse di Cloudflare derivano da un’indagine approfondita condotta dall’azienda. Nell’ambito di questa indagine, è stata creata una pagina web nascosta con restrizioni per i crawler, che non era né linkata né indicizzata pubblicamente, fungendo da honeypot per testare le capacità di scansione di Perplexity. Secondo Cloudflare, i sistemi di Perplexity sono riusciti ad accedere a questa pagina con restrizioni e ne hanno incluso il contenuto nei risultati di ricerca, sollevando serie preoccupazioni sulle pratiche di raccolta dati dell’azienda.

Cloudflare sostiene che queste azioni non solo violano i suoi termini di servizio, ma sono anche eticamente discutibili. Di conseguenza, Perplexity è stato rimosso dall’elenco dei bot verificati. Cloudflare ha annunciato l’intenzione di inasprire le restrizioni sui crawler AI, a dimostrazione di un approccio proattivo per prevenire lo scraping non autorizzato dei dati. Al contrario, Perplexity nega fermamente le accuse, sostenendo che l’indagine ha trascurato aspetti di trasparenza e non è riuscita a presentare prove convincenti. L’azienda sostiene che Cloudflare abbia esagerato i risultati o abbia completamente interpretato male la situazione.

Le implicazioni di questo incidente sono significative, poiché Cloudflare continua ad adottare una posizione ferma contro Perplexity, il che pone sfide agli sforzi di branding della startup volti a dimostrare trasparenza rispetto ai motori di ricerca tradizionali. Questa situazione evidenzia un problema crescente nel panorama digitale: il conflitto in corso tra l’accesso ai contenuti e la loro monetizzazione.

Inoltre, questo incidente porta alla luce dibattiti più ampi all’interno del settore dell’intelligenza artificiale in merito all’approvvigionamento dei dati e alle pratiche discutibili che possono emergere man mano che le tecnologie di intelligenza artificiale diventano sempre più potenti e commercializzate. Il CEO di Cloudflare, Matthew Prince, ha parlato apertamente dei potenziali rischi che questi modelli di intelligenza artificiale rappresentano per i creatori e gli editori di contenuti. In risposta, Cloudflare offre ora un framework per addebitare alle aziende di intelligenza artificiale l’accesso ai contenuti e ha avviato il blocco automatico dei crawler di intelligenza artificiale sulle sue piattaforme.

Fonte e immagini

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *