Logo Cover

7: Ajouter la foule des ordinateurs à la foule des utilisateurs

Patrick Meier (Ph.D.) est un leader d'opinion reconnu internationalement sur l'application de nouvelles technologies dans les interventions humanitaires. Il est actuellement directeur de l'innovation sociale à l'Institut de la Fondation du Qatar Computing Research (qcri) où il travaille sur les prototypes detechnologies humanitaires de nouvelle génération. Patrick a, précédemment, co-fondé et co-dirigé le Programme de HHI sur l’alerte précoce et la cartographie en contexte de crise et a également travaillé comme directeur de la cartographie de crise à Ushahidi. Son très influent blog iRevolution a reçu plus d’un million de visites. Patrick tweete sous le nom:@patrickmeier.

Les journalistes d'investigation et les praticiens des droit humain ont utilisé pendant des décennies un ensemble de stratégies pour vérifier les informations en cas d'urgence et d’événements de dernière minute. Cette expertise est encore plus demandée avec la croissance du contenu généré par l'utilisateur.

Nombreux sont ceux qui sont de plus en plus à la recherche de «systèmes informatiques avancés» (advanced computing) pour accélérer et éventuellement automatiser le processus de vérification. Comme avec toute autre technique, utiliser l'informatique pour vérifier le contenu des réseaux sociaux en temps quasi réel a ses avantages et ses écueils.

L’"Advanced Computing" se compose de deux éléments: le calcul par la machine (machine computing) et le calcul par l'humain (human computing). Le premier utilise des techniques de traitement du langage naturel (NLP) et le machine learning (ML), tandis que le second s’appuie sur des méthodes de crowdsourcing et de microtasking.

L'application de systèmes informatiques avancés afin de vérifier le contenu généré par l'utilisateur est limitée en ce moment parce que le domaine de la recherche est encore nouveau; les plates-formes et les techniques de vérification décrites ci-dessous sont encore en cours de développement et de contrôle. En conséquence, la valeur qu'ils ajoutent au processus de vérification reste encore à voir, mais les progrès de la technologie est encore susceptible de continuer à apporter de nouvelles façons d'aider à automatiser les éléments du processus de vérification.

C’est un moment important dans l'application de l'informatique avancée pour vérifier le contenu généré par l'utilisateur: Trois nouveaux projets dans ce domaine sont en cours d'élaboration. Ce chapitre donne un aperçu ainsi que des renseignements généraux sur la façon dont l'homme et la machine informatique sont utilisés (et combinés) dans le processus de vérification. Tout d’abord, laissez-moi ajouter un avertissement: J’ai dirigé le lancement des efforts numériques d'intervention humanitaire décrits ci-dessous - pour Haïti, les Philippines et le Pakistan. En outre, je suis également engagé dans le projet Verily et dans la création du Plugin Twitter de crédibilité (Twitter Credibility Plugin), qui seront mentionnés.

Informatique humaine

En informatique humaine, aussi appelé « foule informatique » (crowd computing), une machine sous-traite certaines tâches à un humain ou à un groupe. La machine recueille et analyse ensuite les tâches traitées.

Un exemple d’utilisation précoce de l'informatique humaine en cas d'urgence a été le séisme en Haïti en 2010. Quand Ushahidi Inc. a lancé une plateforme web basée sur le human computing pour la répartition des tâches pour traduire des messages de texte urgents du créole haïtien à l’anglais. Ces messages provenaient de communautés sinistrées dans et autour de Port-au-Prince. Les textes traduits ont ensuite été triés et cartographiés sur l'Ushahidi Haïti Crisis Plan. Bien que la traduction des textes était la première et seule fois que Ushahidi avait utilisé une plate-forme de crowd computing, le succès de cette technique en cas de catastrophe a mis en évidence sa valeur ajoutée.

Le crowd computing a ensuite été utilisé en 2012 en réponse au Typhoon Pablo aux Philippines. À la demande des Nations Unies, le Réseau humanitaire numérique (DHN)a collecté et analysé tous les tweets postés au cours des premières 48 heures du typhon. Plus précisément, on a demandé à des volontaires de DHN d’identifier toutes les photos et vidéos postées sur Twitter qui ont révélé les dommages causés. Pour mener à bien cette opération, le DHN a utilisé la plate-forme de microtasking libre et open-source CrowdCrafting pour identifier des tweets et des images individuelles. Les données traitées ont ensuite été utilisées pour créer une carte des dommages en cas de catastrophe.

La réponse réussite de calcul humain au Typhoon Pablo a incité le lancement d'une nouvelle plate-forme de microtasking simplifié appelé MicroMappers. Développé à l'aide de logiciels CrowdCrafting, MicroMappersa été utilisé la première fois en Septembre 2013 pour identifier des tweets et des images mises en ligne après le séisme au Baloutchistan. Cette opération a été réalisée par le DHN en réponse à une demande de l'ONU au Pakistan.

En somme, le crowd computing commence tout juste à gagner du terrain dans la communauté humanitaire. Mais l'informatique humaine n’a jusqu'à présent pas été utilisée pour vérifier le contenu des réseaux sociaux.

La plateforme Verily

La plateforme Verily aide à développer l'informatique humaine pour crowdsourcer rapidement des preuves qui corroborent ou discréditent l'information affichée sur les réseaux sociaux . Nous attendons que la plateforme soit utilisée pour aider à régler des informations contradictoires en cas d’urgence qui emergent souvent pendant et après une catastrophe majeure. Bien sûr, la plateforme pourrait être utilisée pour vérifier également des images et des séquences vidéo.

Verily a été inspirée par le Red Balloon Challenge, qui a été lancé en 2009 par l’Agence pour les projets de recherche avancée de défense (DARPA). Le défi demande aux participants d'identifier correctement l'emplacement de 10 ballons météorologiques rouges plantés à travers les États-Unis.

p>L’équipe gagnante, du MIT, a trouvé les 10 ballons en moins de neuf heures sans besoin de s’éloigner de leurs ordinateurs. En effet, ils se sont tournés vers les réseaux sociaux, et Twitter en particulier, pour mobiliser la foule. Au début de la compétition, l'équipe a annoncé que, plutôt que de garder le prix $ 40,000 s’ils gagnaient, ils partageraient les gains avec les membres du public qui les aideraient à chercher les ballons. Pour avoir un grand groupe de personnes à la recherche ils ont incité leur communauté à participer avec ce message: « Nous allons donner 2000 $ par ballon pour la première personne qui nous envoie les coordonnées correctes, mais ce n’est pas tout - nous allons également donner 1000 $ à la personne qui les a invité à participer de la recherche. Ensuite, nous allons donner $ 500 a quiconque qui a invité la personne qui invité à ce dernier, et de 250 $ à celui qui à invité cet autre, et ainsi de suite.»

La plateforme Verily utilise le même mécanisme d'incitation sous la forme de points. Cependant, au lieu de chercher des ballons à travers tout un pays, la plateforme facilite la vérification des informations des réseaux sociaux lors de catastrophes afin de couvrir une zone géographique beaucoup plus petite, généralement une ville.

On peut penser à  Verily comme un board Pinterest avec des éléments épinglés qui se composent de questions oui ou non. Par exemple: "Est-ce que le pont de Brooklyn est fermé en raison de l'ouragan Sandy?" Les utilisateurs peuvent partager cette demande de vérification sur Twitter ou Facebook et l’envoyer à des gens qu'ils connaissent habitant à proximité.

Ceux qui ont des preuves pour répondre à la question peuvent poster la réponse sur le board qui comporte deux sections: l'une est la preuve que répond à la question de vérification par l'affirmative; l'autre est la preuve que fournit une réponse négative.

Le type de preuve qui peut être affiché inclut un texte, des photos et des vidéos. Chaque élément de preuve posté dans le board doit être accompagnée d'une description de la personne qui a posté la réponse et doit inclure la raison pour laquelle la preuve est pertinente et crédible.

En tant que tel, un objectif parallèle du projet est de crowdsourcer la pensée critique. La plateforme Verily sera lancée au début du 2014 sur www.Veri.ly.

Machine computing

Le tremblement de terre de magnitude 8,8 qui a frappé le Chili en 2010 a été largement couvert sur Twitter. Comme c’est presque toujours le cas, avec cette vague de tweets pendant une crise, une houle de rumeurs et de fausses informations ont été également diffusées.

Une des rumeur était une alerte de tsunami à Valparaiso. Un autre était la déclaration de pillages dans certains quartiers de Santiago. Ces types de rumeurs ne se sont pas répandus: les recherches empiriques récentes ont démontré que Twitter a un mécanisme auto-correcteur. Une étude des tweets à la suite du tremblement de terre du Chili a constaté que les utilisateurs de Twitter ont généralement réprimé les tweets non crédibles en interrogeant sur leur véracité.

En analysant ce rejet des tweets suspects, les chercheurs ont montré que la crédibilité de tweets pourrait être prédite. Une analyse des données a également révélé que les tweets avec certaines caractéristiques sont souvent faux . Par exemple, la longueur de tweets, le ton des mots utilisés et le nombre de hashtags et des émoticônes utilisés fournissent des indicateurs de crédibilité des messages du tweet. La même chose vaut pour les tweets qui incluent des images et des vidéos,le texte contenu dans les tweets qui pointent vers du contenu multimédia peut être utilisée pour déterminer si ce contenu multimédia est crédible ou non.

Prises ensembles, ces données fournissent aux machines les paramètres et l'intelligence dont elles ont besoin pour commencer à prédire l'exactitude des tweets et d’autres contenus des réseaux sociaux. Cela ouvre la porte à un plus grand rôle pour l'automatisation dans le processus de vérification lors des catastrophes et d'autres situations d’urgence.

En termes d'applications pratiques, ces résultats sont utilisés pourdévelopper un "Credibility Plugin" pour Twitter. Ce travail concerne mon équipe à l'Institut de recherche d’informatique du Qatar qui travaille en partenariat avec l'Institut de technologie de l'information de Indraprastha à Delhi, en Inde pour son développement.

Ce plugin notera les tweets individuels sur une échelle de 0 à 100 en fonction de la probabilité que le contenu d'un tweet donné puisse être considéré comme crédible. Le lancement du plugin est prévu début de 2014. Le principal avantage de cette solution c’est qu’elle est entièrement automatisé, et donc plus évolutive que la plateforme de calcul humaine verily.

Informatique hybride

La plateforme d’intelligence artificielle pour la réponse aux urgences (AIDR) est un model hybride entre humaine et machine computing.

La plate-forme combine l'informatique humaine (microtasking) avec le machine learning. Le Microtasking (ou la répartition des tâches) prend une grande tâche pour la diviser en une série de petites tâches. Le machine learning consiste à enseigner à un ordinateur à effectuer une tâche précise.

AIDR permet aux utilisateurs d'enseigner à un algorithme à trouver une information d'intérêt sur Twitter. Le processus d'enseignement se fait en utilisant le microtasking. Par exemple, si la Croix-Rouge est intéressé par le suivi sur Twitter des références aux dégats faits aux infrastructures après une catastrophe, le personnel Croix-Rouge utilisera l'interface de microtasking AIDR pour marquer (sélectionner) les tweets individuels qui parlent de « endommager ». L'algorithme sera alors en mesure d’apprendre de ce processus et de trouver automatiquement tweets supplémentaires qui parlent des dégâts.

Cette approche de calcul hybride peut être utilisée pour identifier automatiquement les rumeurs fondées sur une première série de tweets faisant référence à ces rumeurs. Identifier rapidement les rumeurs et la source est un élément important de la vérification du contenu généré par l'utilisateur. Cela permet aux journalistes et professionnels de l'humanitaire de suivre les informations à sa source, et de savoir à qui s’adresser pour prendre la prochaine étape essentielle dans la vérification de l'information.

Pour être sûr, l'objectif ne doit pas seulement être d'identifier les informations fausses ou trompeuses sur les réseaux sociaux, mais de contester et corriger ces informations en temps quasi réel. Une première version de AIDR a été publié en Novembre 2013.

Accélérer le processus de vérification

Comme indiqué précédemment, les plateformes de vérification alimentées par l'informatique avancée sont encore au début de leur phase de développement et c’est pour cela que leur valeur ultime à la vérification du contenu généré par l'utilisateur reste à prouver. Même si ces plateformes portent leurs fruits, leurs premières itérations devront faire face à des contraintes importantes. Ce travail précoce est donc essentiel à la progression des applications d'informatique avancée pour une contribution significative dans le processus de vérification.

Une limitation actuelle est que l’AIDR et le plug-in de crédibilité précédemment sont entièrement dépendants d’une seule source: Twitter. Une vérification cross-média serait nécessaire pour trianguler des rapports entre les sources, les médias et la langue. Alors que Veri.ly se rapproche à répondre à ce besoin, elle repose entièrement sur une intervention humaine, ce qui n’évolue pas facilement.

En tout état de cause, ces solutions sont loin d'être la solution miracle de la vérification qui beaucoup de gens cherchent. Comme d'autres plateformes d'information, elles peuvent elles aussi être bernées et sabotées avec le temps et les efforts nécessaires pour le faire. Cependant, ces outils possèdent la possibilité d'accélérer le processus de vérification et sont susceptibles de seulement avancer si plus d'efforts et d’investissement sont faites dans le domaine.



Creative Commons License
Ce travail a une licence Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.