Deep web
È l’insieme delle risorse informatiche del WWW (World Wide Web) non indicizzate dai normali motori di ricerca.
I documenti che si possono reperire al suo interno possono essere suddivisi nelle seguenti categorie:
- contenuti dinamici (pagine web dinamiche): pagine il cui contenuto viene generato sul momento dal server, che possono essere richiamate solo compilando un formulario o a risposta di una particolare richiesta;
- pagine non collegate: pagine che non sono collegate a nessun’altra pagina;
- pagine ad accesso ristretto: pagine che richiedono una registrazione o comunque limitano l’accesso ai loro contenuti impedendo che i motori di ricerca possano accedervi;
- script: pagine che possono essere raggiunte solo attraverso link realizzati tramite procedure particolari;
- contenuti non di testo: file multimediali, archivi Usenet, documenti scritti in linguaggio non HTML, in particolare non collegati a tag testuali;
- banditi dai comuni motori di ricerca perché illegali: siti pedo-pornografici o snuff, commercio e produzione illegale di droghe e armi, siti sottoposti a censure governative, siti di warez e malware;
- nuovi siti non ancora indicizzati: pagine web a contenuto dinamico, web software e siti privati aziendali.
I contenuti sono ospitati in siti web il cui indirizzo IP (Internet Protocol) è nascosto ma, solitamente, raggiungibili attraverso software particolari perché giacenti su reti sovrapposte chiamate darknet che garantiscono l’anonimato all’utente.
Approfittano dell’anonimato, l’utente può commettere attività illecite, come la vendita di merce illegale.