Red Hot Cyber
Sicurezza Informatica, Notizie su Cybercrime e Analisi Vulnerabilità
OpenAI rilascia il web crowler GPTBot. Migliorerà la capacità del modello e non violerà il diritto d’autore

OpenAI rilascia il web crowler GPTBot. Migliorerà la capacità del modello e non violerà il diritto d’autore

27 Agosto 2023 16:30

OpenAI ha lanciato il web crawler GPTBot per migliorare i suoi modelli di intelligenza artificiale.

“Le pagine Web sottoposte a scansione con l’agent GPTBot possono potenzialmente essere utilizzate per migliorare i modelli rimuovendo le fonti che richiedono l’accesso tramite paywall“, ha affermato la società con un post sul suo sito web. 

Consentire a GPTBot di accedere al tuo sito può aiutare i modelli AI a diventare più accurati e migliorare le loro capacità generali e la loro sicurezza“, ha scritto OpenAI. 

Advertising

Di solito questa modalità di accesso alle pagine web viene gestita dai motori di ricerca che indicizzano i contenuti affinché i siti appaiano nei risultati di ricerca.

Sono chiamati “web crawler” perché eseguono una scansione delle pagine di un sito Web con lo scopo di ottenere dei dati.

OpenAI ha anche fornito istruzioni su come impedire a GPTBot di accedere a un sito Web, parzialmente o completamente. 

I siti web possono bloccare l’indirizzo IP del crawler o aggiungere il GPTBot al file robots.txt del sito. Il file essenzialmente istruisce i web crawler su ciò che è accessibile su un determinato sito.

“Per consentire a GPTBot di accedere ad alcune parti del tuo sito, puoi aggiungere il token GPTBot al robots.txt del tuo sito”, ha spiegato. 

“Per il crawler di OpenAI, le chiamate ai siti Web verranno effettuate dal blocco dell’indirizzo IP documentato sul sito Web di OpenAI”, ha concluso OpenAI. 


📢 Resta aggiornatoTi è piaciuto questo articolo? Rimani sempre informato seguendoci su 🔔 Google News.
Ne stiamo anche discutendo sui nostri social: 💼 LinkedIn, 📘 Facebook e 📸 Instagram.
Hai una notizia o un approfondimento da segnalarci? ✉️ Scrivici


Cropped RHC 3d Transp2 1766828557 300x300
La Redazione di Red Hot Cyber fornisce aggiornamenti quotidiani su bug, data breach e minacce globali. Ogni contenuto è validato dalla nostra community di esperti come Pietro Melillo, Massimiliano Brolli, Sandro Sana, Olivia Terragni e Stefano Gazzella. Grazie alla sinergia con i nostri Partner leader nel settore (tra cui Accenture, CrowdStrike, Trend Micro e Fortinet), trasformiamo la complessità tecnica in consapevolezza collettiva, garantendo un'informazione accurata basata sull'analisi di fonti primarie e su una rigorosa peer-review tecnica.