Notre activité sur Internet analysée par l'Europe
Publié par Isabelle le 09/02/2015 à 12:00
Source: Europa

Visualisation des multiples chemins à travers une portion d'Internet.
Les liens entre pages web révèlent des caractéristiques de nos interactions

Comment est-il possible de prédire les actions des internautes à partir de liens Internet (Internet est le réseau informatique mondial qui rend accessibles au public des services variés comme le courrier électronique, la messagerie...) ? Que nous enseigne la façon dont les utilisateurs exploitent Internet ? Le projet (Un projet est un engagement irréversible de résultat incertain, non reproductible a priori à l’identique, nécessitant le concours et l’intégration d’une grande...) de l'UE NADINE développe des algorithmes et des méthodes d'analyse de l'activité (Le terme d'activité peut désigner une profession.) en ligne, qui dévoileront comment les personnes, les pays (Pays vient du latin pagus qui désignait une subdivision territoriale et tribale d'étendue restreinte (de l'ordre de quelques centaines de km²), subdivision de la civitas gallo-romaine. Comme la civitas qui subsiste le...) et même les échanges commerciaux sont liés.

Internet regroupe actuellement 50 milliards de pages reliées entre elles, et qui forment un immense environnement (L'environnement est tout ce qui nous entoure. C'est l'ensemble des éléments naturels et artificiels au sein duquel se déroule la vie humaine. Avec les enjeux écologiques actuels, le terme environnement tend actuellement à prendre une...) virtuel. Nos interactions fournissent des données (Dans les technologies de l'information (TI), une donnée est une description élémentaire, souvent codée, d'une chose, d'une transaction d'affaire, d'un événement, etc.) qui, une fois analysées, peuvent nous aider à comprendre un large éventail de nos activités, d'activités culturelles jusqu'à des activités économiques.

Financé par l'initiative Technologies futures et émergentes du 7e PC de l'UE, le projet NADINE ("New tools and Algorithms for DIrected NEtwork analysis") contribue au développement d'une nouvelle génération de moteurs (Un moteur est un dispositif transformant une énergie non-mécanique (éolienne, chimique, électrique, thermique par exemple) en une énergie mécanique ou travail.[réf. nécessaire]) de recherche (La recherche scientifique désigne en premier lieu l’ensemble des actions entreprises en vue de produire et de développer les connaissances scientifiques. Par extension métonymique, la...) et permet à l'Europe (L’Europe est une région terrestre qui peut être considérée comme un continent à part entière, mais aussi comme l’extrémité...) de se positionner à la pointe de ce domaine important.

"Nous tentons d'établir une carte d'Internet afin de découvrir de quelle façon les pages sont reliées et comment les internautes utilisent ces liens lorsqu'ils parcourent la toile", indique le coordinateur du projet NADINE, Dima Shepelyansky, directeur de recherche au laboratoire de physique théorique (La physique théorique est la branche de la physique qui étudie l’aspect théorique des lois physiques et en développe le formalisme mathématique.) du CNRS (Le Centre national de la recherche scientifique, plus connu sous son sigle CNRS, est le plus grand organisme de recherche scientifique public français (EPST).) à Toulouse.

Le projet repose sur l'utilisation, entre autres, d'outils mis à disposition par Google (Google, Inc. est une société fondée le 7 septembre 1998 dans la Silicon Valley en Californie par Larry Page et Sergey Brin, auteurs du moteur de recherche Google. Depuis 2001, Eric Schmidt...) et qui permettent de voir comment les pages sont reliées entre elles. Ces observations peuvent, par exemple, amener à établir la probabilité (La probabilité (du latin probabilitas) est une évaluation du caractère probable d'un évènement. En mathématiques, l'étude des...) que les internautes visitent certains sites, fassent certains choix, achètent des produits ou votent d'une certaine façon.

Perfectionner les moyens de suivi des transactions en ligne


Pour développer et tester leurs méthodologies, les chercheurs ont essayé de classer des personnalités selon leur influence, à partir de leurs biographies disponibles sur Wikipédia (Wikipédia (prononcé /wi.ki.pe.dja/) est une encyclopédie, multilingue, universelle, librement diffusable, disponible sur le Web et écrite par les internautes grâce à la technologie wiki. Elle a...). Ils ont pris en compte les 24 langues principales et le nombre (La notion de nombre en linguistique est traitée à l’article « Nombre grammatical ».) de pages qui pointent vers la biographie de chaque personnalité, grâce à l'outil (Un outil est un objet finalisé utilisé par un être vivant dans le but d'augmenter son efficacité naturelle dans l'action. Cette augmentation se traduit par la simplification des...) PageRank (Le PageRank (terme anglais signifiant « classement d'une page ») ou PR désigne le système de classement des pages Web utilisé par le moteur de recherche...) de Google, qui mesure l'importance d'une page au nombre de liens qui pointent vers elle.

Les résultats obtenus posèrent pourtant problème à l'équipe: la personnalité déterminée comme étant la plus influente était le scientifique (Un scientifique est une personne qui se consacre à l'étude d'une science ou des sciences et qui se consacre à l'étude d'un domaine avec la rigueur et les méthodes scientifiques.) Carl Linnaeus. En effet, puisqu'il a proposé une classification des êtres vivants, toutes les pages Wikipédia sur les animaux et les plantes contiennent un lien vers sa biographie, ce qui a faussé les résultats.

Les chercheurs ont donc décidé d'utiliser également CheiRank, qui établit l'importance d'une page web (Une page Web est une ressource du World Wide Web conçue pour être consultée par des visiteurs à l'aide d'un navigateur Web. Elle a...) en fonction des liens sortants qu'elle contient. En combinant les données obtenues avec ces deux outils, les chercheurs ont pu définir une méthode fiable de mesure de l'importance d'une page web. Les communautés auto-organisées, créées en ligne, peuvent également être détectées avec les outils développés par le projet.

L'information sur Internet circule de manière similaire aux échanges commerciaux


L'équipe a appliqué ses résultats à l'analyse des flux (Le mot flux (du latin fluxus, écoulement) désigne en général un ensemble d'éléments (informations / données, énergie, matière, ...) évoluant dans un sens commun. Plus précisément le terme est...) commerciaux, en se basant sur l'observation (L’observation est l’action de suivi attentif des phénomènes, sans volonté de les modifier, à l’aide de moyens d’enquête et d’étude appropriés. Le plaisir procuré...) que les liens qui pointent vers une page web et les liens qui en sortent peuvent montrer comment se font les échanges d'information. Pour cela, les chercheurs ont exploité la base de données (En informatique, une base de données (Abr. : « BD » ou « BDD ») est un lot d'informations stockées dans un dispositif informatique. Les technologies existantes...) commerciale des Nations Unies qui contient des données sur les 50 dernières années. "Nous avons développé une nouvelle façon d'analyser les échanges commerciaux de 61 produits entre les pays des Nations Unies, et nous avons déterminé comment les variations de prix influencent la balance commerciale", explique le Professeur Shepelyansky.

NADINE est un partenariat entre des physiciens théoriciens, des mathématiciens et des informaticiens français, néerlandais, hongrois et italiens. "Un financement européen est indispensable afin de mettre sur pied une équipe qui regroupe des disciplines aussi variées", ajoute M. Shepelyansky.

Le projet dure depuis trois ans et se terminera en avril 2015. Il est financé par l'UE à hauteur (La hauteur a plusieurs significations suivant le domaine abordé.) de 1,223 million (Un million (1 000 000) est l'entier naturel qui suit neuf cent quatre-vingt-dix-neuf mille neuf cent quatre-vingt-dix-neuf (999 999) et qui précède un...) d'euros. Maintenant que la méthodologie est clairement définie, les chercheurs du projet NADINE comptent continuer leurs travaux en collaboration avec plusieurs partenaires, dont l'Organisation (Une organisation est) mondiale du commerce.

Pour plus d'information voir: http://www.quantware.ups-tlse.fr/FETNADINE/
Page générée en 0.366 seconde(s) - site hébergé chez Amen
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
Ce site est édité par Techno-Science.net - A propos - Informations légales
Partenaire: HD-Numérique