Κεφάλαιο 7: Προσθέτοντας το κοινό των υπολογιστών στο ανθρώπινο κοινό
Οι διερευνητικοί δημοσιογράφοι στις έρευνές τους και οι ενασχολούμενοι με τα ανθρώπινα δικαιώματα έχουν χρησιμοποιήσει για δεκαετίες ένα μείγμα στρατηγικών για την επαλήθευση των πληροφοριών σε καταστάσεις ανάγκης και εκτάκτων γεγονότων. Η εμπειρία αυτή απαιτείται ολοένα και περισσότερο με την αύξηση του περιεχομένου από χρήστες.
Έτσι, συνεχώς αυξανόμενος αριθμός ατόμων στρέφεται στην «προηγμένη υπολογιστική» (advanced computing), ώστε να επιταχύνει και πιθανόν να αυτοματοποιήσει τη διαδικασία επαλήθευσης. Όπως και κάθε άλλη τεχνική, η χρήση προηγμένης υπολογιστικής για την επαλήθευση περιεχομένου μέσων κοινωνικής δικτύωσης σε σχεδόν πραγματικό χρόνο είναι πολλά υποσχόμενη, αλλά κρύβει και παγίδες.
Η προηγμένη υπολογιστική αποτελείται από δύο στοιχεία: τη υπολογιστική μηχανική και την υπολογιστική κοινού (human computing). Στην πρώτη χρησιμοποιούνται τεχνικές επεξεργασίας φυσικών γλωσσών και μηχανικής μάθησης, ενώ η δεύτερη βασίζεται σε μεθόδους συλλογής πληροφοριών από το κοινό και διαχείρισης μικρών εργασιών.
Η εφαρμογή προηγμένης υπολογιστικής για την επαλήθευση περιεχομένου προερχόμενου από χρήστες είναι περιορισμένη σε αυτή τη φάση, γιατί ο ερευνητικός αυτός τομέας είναι ακόμη καινούριος και οι πλατφόρμες επαλήθευσης και οι τεχνικές που περιγράφονται στη συνέχεια είναι ακόμη υπό ανάπτυξη και δοκιμή. Ως εκ τούτου, αναμένεται να φανεί πόση αξία θα προσθέσουν στη διαδικασία επαλήθευσης, όμως οι εξελίξεις στην τεχνολογία προβλέπεται να συνεχίσουν να φέρνουν νέους τρόπους υποβοήθησης της αυτοματοποίησης κάποιων σταδίων της διαδικασίας επαλήθευσης.
Αυτό είναι μια σημαντική στιγμή στην εφαρμογή προηγμένης υπολογιστικής για την επαλήθευση περιεχομένου προερχόμενου από χρήστες: Τρεις νέες δράσεις στον τομέα αυτό είναι σε εξέλιξη. Το κεφάλαιο αυτό παρέχει μια επισκόπηση των δράσεων αυτών καθώς και το παρασκήνιο για το πώς χρησιμοποιούνται (και συνδυάζονται) η υπολογιστική μηχανική και η υπολογιστική κοινού στη διαδικασία επαλήθευσης. Πριν προχωρήσουμε, επιτρέψετε μου να προσθέσω μια σημείωση: Έχω διατελέσει επικεφαλής των ψηφιακών ανταποκρίσεων σε περιπτώσεις ανάγκης που περιγράφονται στη συνέχεια –για την Αϊτή, τις Φιλιππίνες και το Πακιστάν. Επιπροσθέτως, ασχολούμαι με τη δράση Verily και με τη δημιουργία τού Πρόσθετου Αξιοπιστίας του Twitter, τα οποία και τα δύο αναφέρονται παρακάτω.
Υπολογιστική κοινού
Στην υπολογιστική κοινού, γνωστή και ως υπολογιστική πλήθους, μια μηχανή αναθέτει ορισμένες εργασίες σε έναν άνθρωπο ή σε μια κοινότητα. Η μηχανή έπειτα, συλλέγει και αναλύει τις ολοκληρωμένες εργασίες.
Μια πρώιμη χρήση της υπολογιστικής κοινού για μια έκτακτη ανάγκη έγινε στο σεισμό της Αϊτής το 2010. Η εταιρεία UshahidiInc. εγκατέστησε μια διαδικτυακή πλατφόρμα υπολογιστικής κοινού για να διαχειρίζεται τις μικρές εργασίες μετάφρασης επειγόντων γραπτών μηνυμάτων από την Αϊτινή Κρεολή στα αγγλικά. Τα μηνύματα αυτά προέρχονταν από πληγείσες κοινότητες μέσα και γύρω από το Port-au-Prince. Τα μεταφρασμένα μηνύματα, εν συνεχεία, διαχωρίστηκαν και χαρτογραφήθηκαν στον Χάρτη Κρίσης για Αϊτή της Ushahidi. Ενώ η μετάφραση των κειμένων ήταν η πρώτη και η μοναδική φορά που η Ushahidi χρησιμοποίησε μια πλατφόρμα υπολογιστικής κοινού για τη διαχείριση μικρών εργασιών σχετικών με τις πληροφορίες της κρίσης, η επιτυχία της τεχνικής αυτής της επιστήμης των υπολογιστών υπογράμμιζε την αξία που μπορεί να προσθέσει στην ανταπόκριση καταστροφών.
Η υπολογιστική κοινού χρησιμοποιήθηκε μετέπειτα το 2012 στην αντιμετώπιση του τυφώνα Pablo στις Φιλιππίνες. Μετά από αίτημα των Ηνωμένων Εθνών, το Ψηφιακό Ανθρωπιστικό Δίκτυο (DHN) συγκέντρωσε και ανέλυσε όλα τα tweets που δημοσιεύτηκαν τις πρώτες 48 ώρες μετά την άφιξη του τυφώνα. Πιο συγκεκριμένα, ζητήθηκε από τους εθελοντές του DHN να εντοπίσουν όλες τις εικόνες και τα βίντεο που δημοσιεύτηκαν στο Twitter και απεικόνιζαν καταστροφές από δυνατούς ανέμους και βροχές. Για την επίτευξη αυτού του έργου, το DHN χρησιμοποίησε την ελεύθερη πλατφόρμα διαχείρισης ενεργειών ανοικτού κώδικα CrowdCrafting ώστε να επισημάνει τα μεμονωμένα tweets και τις εικόνες. Τα επεξεργασμένα δεδομένα χρησιμοποιήθηκαν στη συνέχεια για τη δημιουργία ενός χάρτη κρίσης με τις ζημιές της καταστροφής.
Η επιτυχημένη απόκριση της υπολογιστικής κοινού στον τυφώνα Pablo έδωσε ώθηση στη δημιουργία μια νέας, ευέλικτης πλατφόρμας διαχείρισης μικρών ενεργειών επονομαζόμενη Micro MappersΈχοντας αναπτυχθεί με τη χρήση του λογισμικού Crowd Crafting, το Micro Mappers πρώτο-χρησιμοποιήθηκε το Σεπτέμβριο του 2013 για τη σήμανση των tweets και των φωτογραφιών που δημοσιεύτηκαν διαδικτυακά μετά από το σεισμό στην περιοχή Baluchistan. Η επιχείρηση εκτελέστηκε από το DHN μετά από αίτημα των Ηνωμένων Εθνών στο Πακιστάν.
Εν ολίγοις, η υπολογιστική κοινού έχει μόλις ξεκινήσει να κερδίζει έδαφος στην ανθρωπιστική κοινότητα. Ωστόσο, δεν έχει χρησιμοποιηθεί ακόμα για την επαλήθευση περιεχομένου των μέσων κοινωνικής δικτύωσης.
Πλατφόρμα Επαλήθευσης
Η πλατφόρμα Verily, στην ανάπτυξη της οποίας βοηθάω, χρησιμοποιεί την υπολογιστική κοινού, για να συγκεντρώσει ταχύτατα από το κοινό στοιχεία που υποστηρίζουν ή καταρρίπτουν πληροφορίες που δημοσιεύονται στα μέσα κοινωνικής δικτύωσης. Αναμένουμε το Verily να χρησιμοποιηθεί για την υποβοήθηση του διαχωρισμού αντικρουόμενων αναφορών για ζημιές καταστροφών, που συνήθως εμφανίζονται μετά από μεγάλες καταστροφές. Φυσικά, η πλατφόρμα μπορεί να χρησιμοποιηθεί και για την επαλήθευση εικόνων και βίντεο.
Το Verily το εμπνεύστηκαν από το διαγωνισμό Red Balloon, ο οποίος διεξήχθη το 2009 από την Αμυντική Αρχή Προηγμένων Ερευνητικών Δράσεων (DARPA). Ο διαγωνισμός απαιτούσε από τους συμμετέχοντες να εντοπίσουν την τοποθεσία 10 κόκκινων αερόστατων για τον καιρό που είχαν τοποθετηθεί σε όλη την επικράτεια των Η.Π.Α.
Η νικήτρια ομάδα, από το MIT, βρήκε τα 10 αερόστατα σε λιγότερες από εννέα ώρες χωρίς να σηκωθεί από τους υπολογιστές της. Στην πραγματικότητα, τα μέλη της στράφηκαν στα μέσα κοινωνικής δικτύωσης, και συγκεκριμένα στο Twitter, για να κινητοποιήσουν το κοινό. Κατά την έναρξη του διαγωνισμού η ομάδα ανακοίνωσε ότι αντί να κρατήσει το έπαθλο των $40000 μετρητών, εφόσον κέρδιζε, θα μοιραζόταν τα κέρδη με άτομα από το κοινό που θα τη βοηθούσαν στην αναζήτηση των αερόστατων. Αξίζει να σημειωθεί, ότι έδωσαν κίνητρο στους ανθρώπους να καλέσουν τα μέλη του κοινωνικού δικτύου τους να ενταχθούν στο κυνήγι, αναρτώντας: «Προσφέρουμε $2000 ανά αερόστατο στο πρώτο άτομο που θα μας στείλει τις σωστές συντεταγμένες, αλλά αυτό δεν είναι όλο -προσφέρουμε επίσης $1000 στο άτομο που το κάλεσε. Στη συνέχεια, προσφέρουμε $500 σε όποιον κάλεσε τον προσκαλόντα, και $250 σε όποιον τον κάλεσε, και ούτω καθεξής».
Η πλατφόρμα Verily χρησιμοποιεί τον ίδιο μηχανισμό κινήτρων με τη μορφή πόντων. Αντί να αναζητάει αερόστατα σε μια ολόκληρη χώρα, ωστόσο, η πλατφόρμα διευκολύνει την επαλήθευση των αναφορών των μέσων κοινωνικής δικτύωσης που δημοσιεύονται κατά τη διάρκεια καταστροφών με στόχο την κάλυψη μιας μακράν μικρότερης γεωγραφικής περιοχής –συνήθως μιας πόλης.
Σκεφτείτε το Verily σαν έναν πίνακα του Pinterest με καρφιτσωμένα αντικείμενα που εγείρουν ερωτήσεις που απαντώνται με ναι ή όχι. Για παράδειγμα: «Είναι κλειστή η γέφυρα του Brooklyn λόγω του τυφώνα Sandy;» Οι χρήστες του Verily μπορούν να μοιραστούν την αίτηση επαλήθευσής τους στο Twitter ή το Facebook ή να στείλουν email σε ανθρώπους που γνωρίζουν ότι μένουν κοντά.
Αυτοί που έχουν αποδείξεις ώστε να απαντήσουν στο ερώτημα, δημοσιεύουν στον πίνακα του Verily, ο οποίος έχει δύο ενότητες: Η πρώτη αφορά στις αποδείξεις που επαληθεύουν το ερώτημα καταφατικά ενώ η δεύτερη σε αυτές που δίνουν αρνητική απάντηση.
Οι τύποι αποδείξεων που μπορούν να δημοσιευτούν περιλαμβάνουν κείμενο, φωτογραφίες και βίντεο. Κάθε απόδειξη που δημοσιεύεται στο Verily πρέπει να συνοδεύεται από μια εξήγηση από το άτομο που τη δημοσιεύει σχετικά με το γιατί η απόδειξη είναι σχετική και αξιόπιστη.
Ως εκ τούτου, ένας παράλληλος στόχος της δράσης του Verily είναι η συγκέντρωση από κοινού κριτικής σκέψης. Η πλατφόρμα Verily αναμένεται να λειτουργήσει στο www.Veri.ly στις αρχές του2014.
Υπολογιστική μηχανική
Ο σεισμός των 8.8 βαθμών που έπληξε τη Χιλή το 2010 αναφέρθηκε ευρέως στο Twitter. Όπως συμβαίνει σχεδόν πάντοτε, μαζί με αυτό το κύμα των σχετικών με την κρίση tweets προέκυψε και μια έξαρση φημών και πλαστών πληροφοριών.
Μια τέτοια φήμη αφορούσε ένα παλιρροϊκό κύμα στο Valparaiso. Μια άλλη αφορούσε αναφορές λεηλασιών σε κάποιες περιοχές τουSantiago. Ενώ τέτοιου είδους φήμες εξαπλώνονται, πρόσφατες εμπειρικές μελέτες υποδεικνύουν ότι το Twitter έχει ένα μηχανισμό αυτό-διόρθωσης. Μια μελέτη των tweets που δημοσιεύτηκαν στον απόηχο του σεισμού της Χιλής απέδειξε ότι οι χρήστες του Twitter συνήθως αντιδρούν απέναντι σε μη αξιόπιστα tweets, αμφισβητώντας την αξιοπιστία τους.
Με την ανάλυση των αντιδράσεων αυτών, οι ερευνητές απέδειξαν ότι η αξιοπιστία των tweets μπορεί να προβλεφθεί. Σχετική ανάλυση δεδομένων έχει αποδείξει επίσης ότι τα tweets με συγκεκριμένα χαρακτηριστικά είναι συνήθως εσφαλμένα. Για παράδειγμα, το μήκος των tweets, το ύφος των λέξεων που χρησιμοποιούνται και ο αριθμός των εικονιδίων και των hashtags που χρησιμοποιούνται συνθέτουν δείκτες πιθανότητας αξιοπιστίας για το μήνυμα των tweets. Το ίδιο συμβαίνει και για τα tweets που περιέχουν συνδέσμους σε εικόνες και βίντεο — η γλώσσα που χρησιμοποιείται στα tweets με συνδέσμους σε πολυμεσικό υλικό μπορεί να αποτελέσει δείκτη της αξιοπιστίας ή μη του υλικού αυτού.
Εάν συνδυαστούν, τα δεδομένα αυτά παρέχουν στις μηχανές τις παραμέτρους και τη νοημοσύνη που χρειάζονται για να ξεκινήσουν την πρόβλεψη αξιοπιστίας των tweets και άλλου περιεχομένου των μέσων κοινωνικής δικτύωσης. Αυτό ανοίγει το δρόμο για ένα μεγαλύτερο ρόλο της αυτοματοποίησης στη διαδικασία επαλήθευσης κατά τη διάρκεια καταστροφών, έκτακτων γεγονότων και καταστάσεων ανάγκης.
Όσον αφορά στις πρακτικές εφαρμογές, τα πορίσματα αυτά χρησιμοποιήθηκαν για την ανάπτυξη ενός «Πρόσθετου Αξιοπιστίας» για το Twitter. Στην ανάπτυξη εμπλέκεται μια ομάδα του Ινστιτούτου Έρευνας Πληροφορικής του Ιδρύματος του Κατάρ το οποίο εργάζεται σε συνεργασία με το Ινστιτούτο Τεχνολογίας της Πληροφορίας Indraprastha στο Νέο Δελχί, στην Ινδία.
Το πρόσθετο αυτό θα αξιολογεί τα μεμονωμένα tweets με μια κλίμακα από το 0 έως το 100 με βάση την πιθανότητα το περιεχόμενο του εκάστοτε tweet να είναι αξιόπιστο. Το πρόσθετο αυτό αναμένεται να διατεθεί στις αρχές του 2014. Το κύριο πλεονέκτημα αυτής της καινοτομίας της μηχανικής πληροφορικής είναι το ότι είναι πλήρως αυτοματοποιημένη και επομένως πιο επεκτάσιμη από την πλατφόρμα της ανθρώπινης πληροφορικής Verily.
Υβριδική υπολογιστική
Η πλατφόρμα Τεχνητής Νοημοσύνης για Ανταπόκριση Καταστροφών (AIDR) αποτελεί συνδυασμό των μοντέλων υπολογιστικής μηχανικής και υπολογιστικής κοινού.
Η πλατφόρμα συνδυάζει την υπολογιστική κοινού (διαχείριση μικρών ενεργειών) με τη υπολογιστική μηχανική (μηχανική μάθηση). Η διαχείριση μικρών ενεργειών είναι πρακτικά ο χωρισμός μιας εκτενούς εργασίας σε μια σειρά από μικρές ενέργειες. Η μηχανική μάθηση περιλαμβάνει την εκμάθηση σε έναν Η/Υ να εκτελεί μια συγκεκριμένη διεργασία.
Το AIDR επιτρέπει στους χρήστες την εκμάθηση ενός αλγορίθμου εύρεσης πληροφοριών του ενδιαφέροντός τους στο Twitter. Η διαδικασία της εκμάθησης γίνεται με τη χρήση της διαχείρισης μικρών ενεργειών. Για παράδειγμα, εάν ο Ερυθρός Σταυρός ενδιαφερόταν να παρακολουθήσει το Twitter για ζημιές υποδομών κατόπιν μιας καταστροφής, τότε το προσωπικό του θα χρησιμοποιούσε τη διεπιφάνεια διαχείρισης του AIDR, για να σημάνει (επιλέξει) μεμονωμένα tweets που αναφέρονται στη ζημιά. Έπειτα, ο αλγόριθμος θα μάθαινε από αυτή τη διαδικασία και αυτόματα θα έβρισκε επιπρόσθετα tweets τα οποία αναφέρονται στη ζημιά.
Η προσέγγιση της υβριδικής υπολογιστικής μπορεί να χρησιμοποιηθεί στον αυτόματο εντοπισμό φημών με βάση ενός συνόλου tweetsτα οποία αναφέρονται σε αυτές τις φήμες. Η ταχεία αναγνώριση των φημών και των πηγών τους είναι ένας σημαντικός παράγοντας για την επαλήθευση του περιεχομένου από χρήστες. Επιτρέπει στους δημοσιογράφους και στους επαγγελματίες των ανθρωπιστικών οργανώσεων να ακολουθούν προς τα πίσω την πληροφορία ως την πηγή της και να γνωρίζουν με ποιον να επικοινωνήσουν, για να προχωρήσουν στο επόμενο κρίσιμο βήμα προς την επαλήθευση της πληροφορίας.
Για να είμαστε σίγουροι, ο στόχος δεν θα πρέπει να είναι η αναγνώριση εσφαλμένων ή παραπλανητικών πληροφοριών στα μέσα κοινωνικής δικτύωσης, αλλά η απαρίθμηση και η διόρθωση των πληροφοριών αυτών σε πραγματικό χρόνο. Μια πρώτη έκδοση του AIDR κυκλοφόρησε το Νοέμβριο του 2013.
Επιταχύνοντας τη διαδικασία επαλήθευσης
Όπως σημειώθηκε νωρίτερα, τα αρχικά ακόμη στάδια των πλατφόρμων επαλήθευσης με τη χρήση προηγμένης υπολογιστικής υποδεικνύουν ότι η αξία τους στην επαλήθευση του περιεχομένου από χρήστες αναμένεται να φανεί στο μέλλον. Ακόμη και αν αυτές οι πλατφόρμες αποβούν καρποφόρες, οι πρώτες χρήσεις τους θα συναντήσουν εμπόδια. Ωστόσο, αυτή η πρώιμη δουλειά είναι κρίσιμη για τη μετάβαση σε σημαντικές εφαρμογές προηγμένης υπολογιστικής στη διαδικασία επαλήθευσης.
Ένας τρέχων περιορισμός είναι ότι το AIDR και το επερχόμενο Πρόσθετο Αξιοπιστίας, τα οποία περιγράφηκαν παραπάνω, βασίζονται εξ ολοκλήρου μόνο σε μία πηγή: το Twitter. Η ύπαρξη πλατφόρμων επαλήθευσης ανεξάρτητων από το μέσο επικοινωνίας είναι αναγκαία για τον διαχωρισμό αναφορών χωρίς περιορισμούς πηγών, μέσων και γλώσσας. Ενώ το Veri.ly πλησιάζει την ικανοποίηση αυτής της ανάγκης, βασίζεται εξ ολοκλήρου στον ανθρώπινο παράγοντα, ο οποίος δεν επεκτείνεται εύκολα.
Σε κάθε περίπτωση, οι καινοτομίες αυτές απέχουν αρκετά από τη μαγική λύση για την επαλήθευση που πολλοί αναζητούν. Όπως άλλες πλατφόρμες πληροφοριών, μπορούν να ξεγελαστούν ή να σαμποταριστούν με επαρκή χρόνο και προσπάθεια. Όμως και πάλι, τα εργαλεία αυτά διατηρούν την πιθανότητα επιτάχυνσης της διαδικασίας επαλήθευσης και προβλέπεται μόνο η ανάπτυξή τους, καθώς γίνονται περισσότερες προσπάθειες και επενδύσεις στον τομέα.