Τί ξέρετε για το Deep Web

Το Deep Web (γνωστό ακόμα και ως Dark Net, Under Net, Hidden Web, αόρατο ή κρυμμένο Web) είναι το περιεχόμενο που βρίσκεται αποθηκευμένο στο Διαδίκτυο (Wolrd Wide Web) και συνήθως δεν εμφανίζεται μέσω των συνηθισμένων μηχανών αναζήτησης όπως του  Google, του Yahoo, του Bing, του Ask κλπ. από τους γνωστούς browsers όπως είναι ο Firefox, ο Internet Explorer ή ο Chrome.deepweb
Ψάχνοντας λοιπόν για μια πληροφορία σε κάποια μηχανή αναζήτησης ουσιαστικά αναζητάτε πληροφορίες που βρίσκονται στην επιφάνεια του διαδικτύου και αντιστοιχούν μόλις στο 6-8% του  πραγματικού όγκου του διαδικτύου. Το υπόλοιπο 92-94% βρίσκεται αποθηκευμένο πιο βαθιά στο διαδίκτυο όπου οι γνωστές μηχανές αναζήτησης δεν έχουν πρόσβαση.
Μέγεθος του  Deep Web

Ουσιαστικά κάνεις δε μπορεί να μιλήσει με ακριβείς νούμερα για τον όγκο πληροφοριών του Deep Web και όλες οι αναφορές γίνονται βάση κάποιον εκτιμήσεων που έγιναν από μία μελέτη του Πανεπιστημίου της Καλιφόρνιας στο Berkeley (University of California, Berkeley) το έτος 2001. Βάση της μελέτης το Deep Web αποτελείται περίπου από 91.000 terabytes σε αντίθεση με το Surface Web (Επιφανειακό Διαδίκτυο) που υπολογίζεται περίπου σε 167 terabytes.
Αξίζει να σημειωθεί πως εξήντα από τους μεγαλύτερους ιστότοπους του Deep Web περιέχουν 750 terabytes υπερβαίνοντας κατά πολύ τον όγκο των δεδομένων ολόκληρου του Επιφανειακού Διαδικτύου.
Τι υπάρχει στο Deep Web;

Μπορεί να είναι δύσκολο να κατανοήσετε πως πολλά εκατομμύρια ιστοσελίδες με τεράστιο όγκο δεδομένων παραμένουν “κρυμμένες” από τις μηχανές αναζήτησης και όμως υπάρχουν. Αρκεί να σκεφτείτε πως πολλές από αυτές είναι βάσεις δεδομένων που εξυπηρετούν κυβερνητικούς σκοπούς όπως φορολογικά στοιχεία πολιτών ή στρατιωτικούς σκοπούς με απόρρητα στοιχεία και αρχεία όπως χάρτες, σχέδια αεροσκαφών ή πυραυλικών συστημάτων.
Οι πληροφορίες που βρίσκονται στο  Deep Web είναι αναρίθμητες και αφορούν τους πάντες. Όλα τα παρακάτω προσωπικά στοιχεία βρίσκονται αποθηκευμένα σε βάσεις δεδομένων του Deep Web και σίγουρα δεν θα θέλατε να τα δείτε δημόσια αποθηκευμένα σε  ιστοσελίδες στις οποίες ο καθένας ανεξέλεγκτα θα μπορούσε να έχει πρόσβαση:

•    Πιστοποιητικά γεννήσεως και πιστοποιητικά οικογενειακής κατάστασης.
•    Στοιχεία αστυνομικής ταυτότητας, διαβατηρίου, διπλώματος οδήγησης, παραβάσεων τροχαίας.
•    Στοιχεία αποφοίτησης από σχολεία και τίτλοι πανεπιστημιακών σπουδών.
•    Τίτλοι ιδιοκτησίας σπιτιού, αυτοκίνητου, μοτοσυκλέτας καθώς και η ασφάλεια που πληρώνουμε γι αυτά.
•    Φορολογικά στοιχεία όπως ΑΦΜ, ΑΜΚΑ, φορολογικές δηλώσεις καθώς και το ιστορικό της ιατροφαρμακευτικής και νοσοκομειακής μας περίθαλψης.
•    Λογαριασμοί μισθοδοσίας, βεβαιώσεις αποδοχών, οι καταβολές ασφαλιστικών εισφορών και η συντάξιμη προϋπηρεσία μας, λογαριασμοί για υπηρεσίες όπως φως, νερό, τηλέφωνο, ίντερνετ.
•    Στοιχεία και κινήσεις τραπεζικών λογαριασμών και πάσης φύσεως δοσοληψιών.
•    Στοιχεία των διαδικτυακών μας κινήσεων όπως ιστοσελίδες που επισκεπτόμαστε και διαδικτυακές αγορές.

Γενικά οι πόροι του Deep Web μπορούν να ταξινομηθούν σε μία ή περισσότερες από τις ακόλουθες κατηγορίες:

•    Δυναμικού περιεχομένου: Είναι δυναμικές ιστοσελίδες που χρησιμοποιούν ένα συνδυασμό από βάσεις δεδομένων για την δημιουργία μίας προσωρινής σελίδας ως απάντηση σε κάποιο υποβληθέν ερώτημα ή στις οποίες έχει κάποιος πρόσβαση μόνο μέσα από φόρμες στις οποίες πρέπει να συμπληρωθούν κάποια στοιχεία και είναι δύσκολο να περιηγηθείτε σε αυτές χωρίς τη γνώση της διεύθυνσης (Domain) που θέλετε.
•    Ιστοσελίδες  μη συνδεδεμένου περιεχομένου: Είναι ιστοσελίδες που δεν συνδέονται με άλλες ιστοσελίδες εμποδίζοντας τις μηχανές αναζήτησης να έχουν πρόσβαση στο περιεχόμενό τους.
•    Private Web: Ιστοσελίδες με ιδιωτικό περιεχόμενο στις οποίες για να έχετε πρόσβαση χρειάζεται να κάνετε login με username και password. Αυτές μπορεί για παράδειγμα να είναι εταιρικές ιστοσελίδες που έχουν πρόσβαση μόνο οι υπάλληλοι των συγκεκριμένων εταιρειών.
•    Contextual Web: Είναι ιστοσελίδες το περιεχόμενο των οποίων προσαρμόζεται ανάλογα με τον τρόπο που έχει κανείς πρόσβαση σε αυτές. Έτσι σε μια τέτοια ιστοσελίδα θα δείτε διαφορετικό περιεχόμενο αν έχετε πρόσβαση μέσω μιας διεύθυνσης ΙP από την Ελλάδα και διαφορετικό περιεχόμενο απ’ ό,τι αν θα επισκεπτόσασταν την ίδια ιστοσελίδα μέσω μίας διεύθυνσης IP από την Αμερική.
•    Περιεχόμενο περιορισμένης πρόσβασης: Είναι ιστοσελίδες που περιορίζουν την πρόσβαση στο περιεχόμενό τους με τεχνικούς τρόπους (χρησιμοποιώντας για παράδειγμα Robots Exclusion Standards, CAPTCHAS και άλλα).
•    Scripted content: Ιστοσελίδες που είναι διαθέσιμες μόνο από συνδέσμους που παράγονται από JavaScript καθώς και περιεχόμενο που κατεβάζεται από Web servers μέσω Flash ή Ajax.
•    Non-HTML/text content: περιεχόμενο κειμένου που είναι κωδικοποιημένο σε αρχεία multimedia (εικόνας ή ήχου) ή ειδικά formats που δεν μπορούν να διαβάσουν οι μηχανές αναζήτησης.

H επαφή μας με το Deep Web είναι καθημερινή.

Αν νομίζετε πως εσείς δεν έχετε έρθει ποτέ σε επαφή με το Deep Web μάλλον κάνετε λάθος. Έστω και έμμεσα από τη στιγμή που κάνετε χρήση του Διαδικτύου έρχεστε σε επαφή με δεδομένα που βρίσκονται βαθιά αποθηκευμένα στο Deep Web. Όλες οι ιστοσελίδες, οι εφαρμογές, οι φωτογραφίες ή τα βίντεο που παρακολουθείτε καθημερινά στον υπολογιστή σας είναι το αποτέλεσμα κάποιας υποδομής που δημιουργήθηκε και διαχειρίζεται μέσω του Deep Web.
Κοινώς το Administration Panel ή το cPanel (πίνακες ελέγχου) μέσω των οποίων ο εκάστοτε διαχειριστής (admin) ελέγχει και διαχειρίζεται τον server στον οποίο βρίσκετε αποθηκευμένη η ιστοσελίδα του ανήκει στο  Deep Web. Επομένως η υποδομή που υπάρχει πίσω από κάθε ιστοσελίδα είναι μη ανιχνεύσιμη από τις μηχανές αναζήτησης. Είναι δυναμικά παραγόμενη καθώς δεν υπάρχει μέχρι τη στιγμή που θα ζητήσουμε να παραχθεί και μόνο για όσο χρόνο γίνετε χρήση της και φυσικά δεν είναι δημόσια προσβάσιμη αφού χρειάζεται username και password για να παραχθεί.

Γενικά όπου χρησιμοποιούμε ατομικούς κωδικούς ώστε να έχουμε μόνο εμείς πρόσβαση
όπως για παράδειγμα λογαριασμοί  στα μέσα κοινωνικής δικτύωσης, λογαριασμοί e-mail, λογαριασμοί στο gsis.gr, λογαριασμοί e-banking κλπ. ανήκουν ήδη στο Deep Web.

Ιστοσελίδες του DeepWeb που αξίζουν μιας ματιάς.

Υπάρχουν πάρα πολλές αξιόλογες ιστοσελίδες στις οποίες μπορείτε να βρείτε οποιαδήποτε πληροφορία αναζητάτε. Ενδεικτικά παραθέτουμε παρακάτω κάποιες από αυτές :

https://www.wikileaks.org/
Το WikiLeaks (από τα πλέον πιο γνωστά τα τελευταία χρόνια) είναι ένας μη-κερδοσκοπικός οργανισμός ενημέρωσης όπου επίσημα ξεκίνησε το 2007 και έχει ως στόχο να φέρει στο κοινό σημαντικές ειδήσεις και πληροφορίες. Παρέχουν ασφάλεια και ανωνυμία στις πηγές τους ως προς τον τρόπο με τον οποίο διαρρέουν οι πληροφορίες προς τους δημοσιογράφους. Οι αρχές στις οποίες βασίζεται η δουλειά του WikiLeaks είναι η υπεράσπιση της ελευθερίας του λόγου και των εκδόσεων των μέσων ενημέρωσης. Αναφέρει ότι ο καθένας έχει το δικαίωμα στην ελευθερία της γνώμης (χωρίς παρεμβάσεις) και της έκφρασης και σκοπός του είναι να αναζητεί, να λαμβάνει και να διαδίδει πληροφορίες και ιδέες με οποιοδήποτε μέσο και ανεξαρτήτως συνόρων. Η πρόσβαση προς το WikiLeaks σtο αρχικό του στάδιο ήταν περιορισμένη καθώς ήταν απαγορευμένο σε αρκετές χώρες.

http://infomine.ucr.edu/
Το Infomine είναι μια ολοκληρωμένη εικονική βιβλιοθήκη με πηγές από το διαδίκτυο που αφορούν  καθηγητές, φοιτητές και ερευνητικό προσωπικό σε πανεπιστημιακό επίπεδο. Παρέχει πρόσβαση σε  διαδικτυακές βάσεις δεδομένων, ηλεκτρονικά περιοδικά, ηλεκτρονικά βιβλία, άρθρα, καταλόγους ερευνητών και πολλά άλλα είδη πληροφοριών. Για την ύπαρξη του Infomine έχουν συμβάλει πολλά πανεπιστήμια και κολέγια όπως το Πανεπιστήμιο της Καλιφόρνια, το Πανεπιστήμιο Wake Forest,  το Πανεπιστήμιο California State και το Πανεπιστήμιο του Ντιτρόιτ.

http://vlib.org/
Το Virtual Library (VL) είναι o παλαιότερος κατάλογος του Web και ξεκίνησε από τον Tim Berners-Lee, δημιουργό του HTML και του ίδιου του Web, το 1991 στο CERN στη Γενεύη. Οι σελίδες του Virtual Library αναγνωρίζονται ευρέως ως μεταξύ των οδηγών υψηλότερης ποιότητας σε συγκεκριμένα τμήματα του Web.

http://www.infoplease.com/index.html
Το Information Please παρέχει έγκυρες απαντήσεις σε όλα τα είδη των πραγματικών ζητημάτων από το 1938, αρχικά ως ένα δημοφιλές ραδιοφωνικό κουίζ σόου, στη συνέχεια από το 1947 συνέχισε ως ετήσιο ημερολόγιο περιείχε σημαντικές ημερομηνίες και στατιστικά στοιχεία και το 1998 έκανε την εμφάνισή του στο διαδίκτυο.

http://www.science.gov/
Το Science.gov ψάχνει σε πάνω από 60 βάσεις δεδομένων και πάνω από 2200 επιλεγμένες ιστοσελίδες από 15 ομοσπονδιακές υπηρεσίες, προσφέροντας 200 εκατομμύρια αποτελέσματα  σελίδων με έγκυρες πληροφορίες επιστήμης, έρευνας και ανάπτυξης από την κυβέρνηση των ΗΠΑ.

http://www.sciencedirect.com/
Είναι μια κορυφαία επιστημονική βάση δεδομένων που προσφέρει 12.609.638 άρθρα από περίπου 2.500 περιοδικά και 26.000 βιβλία.

http://scholar.google.gr
Το Schoolar της Google σάς παρέχει έναν απλό τρόπο ευρείας αναζήτησης στην ακαδημαϊκή βιβλιογραφία. Από ένα σημείο, μπορείτε να κάνετε αναζήτηση σε πολλά πεδία ερευνητικά πεδία και πηγές: εργασίες που έχουν αξιολογηθεί από ομότιμους επιστήμονες, διατριβές, βιβλία, περιλήψεις και άρθρα, από ακαδημαϊκούς εκδότες, επαγγελματικές ενώσεις, πηγές προδημοσιεύσεων, πανεπιστήμια και άλλους ακαδημαϊκούς οργανισμούς.

https://arcive.org/
Μια πολύ καλή ιστοσελίδα των μέσων ενημέρωσης που αξίζει να επισκεφθείτε. Προσφέρει κείμενα, σπάνια βιβλία, ηχογραφήσεις, δωρεάν βιβλία ήχου, βίντεο, κινούμενες εικόνες, 20 χρόνων αρχειοθετημένες εικόνες από όλες τις παλιές ιστοσελίδες, καθώς και αρχειοθετημένες ιστοσελίδες. Παρέχει ακόμα εξειδικευμένες υπηρεσίες για την προσαρμοστική ανάγνωση και πρόσβαση σε πληροφορίες για τους τυφλούς και άλλα άτομα με ειδικές ανάγκες.

http://vos.ucsb.edu/
Το Voice of the Shuttle  ξεκίνησε στα τέλη 1994 ως μια εισαγωγή στο διαδίκτυο για ανθρωπιστές στο Πανεπιστήμιο της Καλιφόρνιας στη Σάντα Μπάρμπαρα και είναι μια από τις παλαιότερες και μεγαλύτερες βάσεις ανθρωπιστικών δεδομένων στο διαδίκτυο.

http://www.lib.umich.edu/
Το University of Michigan Government Documents Center προσφέρει βάσεις δεδομένων, που αφορούν κλάδους όπως της Μηχανικής, των Τεχνών, των Πολιτικών Επιστημών, των Επιστημών Υγείας, των Κοινωνικών Επιστημών και των Διεθνών Σπουδών, όπου θα βρείτε ένα τεράστιο όγκο με δεδομένα, έρευνες και στατιστικά στοιχεία.

http://www.usa.gov/
Το USA.gov είναι το επίσημο διαδικτυακό portal της κυβέρνησης των Ηνωμένων Πολιτειών όπου κάποιος μπορεί να βρει πληροφορίες και υπηρεσίες.

http://psycnet.apa.org
Το American Psychological Association είναι η μεγαλύτερη επιστημονική και επαγγελματική οργάνωση που εκπροσωπεί τον κλάδο της ψυχολογίας στις Ηνωμένες Πολιτείες. Στη βάση δεδομένων τους μπορείτε να βρείτε ένα μεγάλο όγκο πληροφοριών, αποσπάσματα και ολόκληρα περιοδικά για διάφορα θέματα που αφορούν την ψυχολογία.

http://www.healthfinder.gov/
Το Healthfinder σας παρέχει πληροφορίες σε ένα ευρύ φάσμα θεμάτων υγείας από 1400 βάσεις δεδομένων από κυβερνητικούς και μη κερδοσκοπικούς οργανισμούς για να σας φέρει τις καλύτερες και πιο αξιόπιστες πληροφορίες από το διαδίκτυο.

http://www.rxlist.com/script/main/hp.asp
Το RxList είναι ένα κορυφαίο διαδικτυακό ευρετήριο φαρμάκων το οποίο ιδρύθηκε από τους φαρμακοποιούς το 1995. Περιέχει πάρα πολλές πληροφορίες ιατρικού και φαρμακευτικού ενδιαφέροντος καθώς και αλφαβητικές λίστες όλων των φαρμάκων, βιταμινών, βοτάνων, συμπληρωμάτων διατροφής, συμπτωμάτων και ασθενειών που υπάρχουν καθώς και πληροφορίες γύρω από το κάθε ένα.

Όπως καταλαβαίνετε η λίστα θα μπορούσε να συνεχιστεί για πολύ ακόμα καθώς υπάρχουν πάρα πολλές ιστοσελίδες, που έχουν συσταθεί για να φέρνουν στην επιφάνεια δεδομένα από το Deep Web, με την πλειοψηφία αυτών να ανήκει σε ακαδημαϊκά ιδρύματα, οργανισμούς και κυβερνητικούς φορείς.