• Il Garante della Privacy ha pubblicato una nota dedicata proprio a web scraping e IA generativa, fornendo alcune indicazioni per difendersi dalla raccolta di dati personali dal web per finalità di addestramento dei modelli di IA.
• Il Garante suggerisce agli operatori pubblici o privati che gestiscono piattaforme o siti web di creare aree riservate a cui poter accedere solo previa registrazione, in modo da sottrarre certi dati dalla disponibilità pubblica.
• Inoltre, il Garante consiglia di inserire nei termini di servizio del proprio sito l'espresso divieto di utilizzare tecniche di web scraping e di monitorare le richieste Http ricevute dal sito, per individuare flussi anomali di dati in ingresso e uscita.
• L'utilizzo del web scraping per l'addestramento di sistemi di IA pone rilevanti sfide, sia per le imprese, sia per i soggetti pubblici e privati che pubblicano dati personali online. Sarà sempre più importante per sviluppare sistemi di IA, ma le regole del gioco cambieranno: i dati non saranno più liberi come oggi, e nemmeno gratuiti.