← Torna al glossario
S · Glossario Muza
scràpìng
Scraping
s. m. inv. [dall'ingl. to scrape «raschiare»; tecnica automatizzata di estrazione di dati da siti web o fonti digitali]
Definizioni
1
Raccogliere dati da siti web in modo automatico.
Tecnica che utilizza software o script per estrarre automaticamente dati strutturati da pagine web: prezzi, descrizioni prodotto, contatti, recensioni, titoli, articoli. Il programma simula la navigazione di un browser, legge il codice HTML della pagina e ne estrae le informazioni rilevanti. Usato per analisi di mercato, monitoraggio della concorrenza e raccolta di dati su scala.
Esempi
- «Abbiamo usato lo scraping per monitorare i prezzi dei competitor ogni giorno. In automatico, senza aprire 50 siti a mano.»
2
Non è sempre legale. Dipende da cosa raccogli e come.
Lo scraping di dati pubblici è generalmente tollerato se non viola i Termini di Servizio del sito. Diventa illegale se raccoglie dati personali senza consenso (violazione GDPR), bypassa sistemi di protezione (violazione del Computer Fraud and Abuse Act) o copia contenuti protetti da copyright.
Esempi
- «LinkedIn ha vinto cause contro aziende che scraperevano profili utente senza autorizzazione. I dati pubblici non sono dati liberi.»
Etimologia
Il termine web scraping nasce con la diffusione del web negli anni '90. I primi spider e crawler di Google (1998) ne sono una forma. Il web scraping come pratica autonoma si afferma nei primi anni 2000 con la crescita dei dati pubblici online. È legalmente ambiguo: lecito su dati pubblici non protetti da copyright, illecito se viola i Termini di Servizio del sito o raccoglie dati personali in violazione del GDPR.
LE NOSTRE CERTIFICAZIONI



ISO 9001 — Gestione della Qualità

ISO IEC 27001 — Sicurezza delle Informazioni

ISO IEC 27017 — Sicurezza Cloud