Ce n’est un secret pour personne : BitTorrent est loin d’être un réseau anonyme. Les adresses IP des internautes y apparaissent en clair, et c’est justement grâce à cela que l’entreprise TMG pourra bientôt les collecter pour l’Hadopi, dans le cadre du contrôle des téléchargements illicites. Dans une passionnante étude publiée début avril 2010, des chercheurs français de l’Inria sont allés bien plus loin que les techniques de surveillance mises en œuvre par TMG pour traquer les pirates, qui reposent sur une liste de contenus à surveiller. Non pas pour contribuer à la chasse aux « téléchargeurs », mais pour « attirer l’attention sur [les atteintes à la vie privée sur BitTorrent] et de montrer à quel point il serait facile pour un assaillant suffisamment pointu de compromettre la vie privée de la plupart des utilisateurs de BitTorrent », explique l’étude. Durant 103 jours, l’équipe a ainsi récolté, avec l’aide d’un seul ordinateur portable, 148 millions d’adresses IP, responsables du téléchargement de 2 milliards de copies de 1,2 million de contenus uniques ! Les chercheurs ont pour cela fait usage de différentes techniques plus ou moins complexes (lire notre encadré), avec pour ambition de dénicher dans cette masse énorme d’informations les IP des « gros téléchargeurs » et surtout des fournisseurs, les premiers à mettre à disposition les contenus sur le réseau. Lire la suite l’article

70 % des fournisseurs de contenus repérés par BlueBear

Avec un certain succès : l’équipe est ainsi parvenue à retrouver l’adresse IP de 70 % de ces fournisseurs de contenus. Elle a par ailleurs montré que 30 % des fichiers mis à disposition sur BitTorrent étaient le fait d’une petite centaine de fournisseurs, et que 60 % des contenus qu’on y retrouve avaient été mis en ligne par les mille plus gros partageurs seulement. BlueBear n’a pas été conçu pour surveiller les internautes sur BitTorrent, plutôt pour les prévenir des dangers que peut comporter l’utilisation de ce système d’échange de fichiers… Et  aussi pour montrer qu’il est facile de repérer les « vrais » pirates, ceux qui mettent en ligne les contenus, ainsi que les gros téléchargeurs. Dans la conclusion de l’étude, les chercheurs donnent d’ailleurs un petit coup de griffe à la surveillance sauce Hadopi : « Nous avons montré que quelques fournisseurs de contenus injectent la plupart des contenus sur BitTorrent, ce qui nous fais nous demander pourquoi les groupes antipiratages ciblent des utilisateurs aléatoires à la place. »

Comment BlueBear fait la chasse aux pirates

Pour repérer les fournisseurs pirates, l’équipe a fait appel à deux  techniques différentes. D’abord, elle a mis au point un programme qui téléchargeait chaque minute les nouveaux Torrents mis en ligne sur des sites BitTorrent, comme The Pirate Bay ou Isohunt. Il leur a été ainsi facile de dénicher l’uploader originel, vu qu’il était le seul à être connecté au contenu au tout début du partage du fichier. La seconde technique consiste à exploiter en plus les identifiants que les fournisseurs de contenus utilisent sur certains sites pour mettre en ligne leurs différents Torrents, notamment sur les trackers (1) privés. Avantage de cette solution : il est possible de repérer ces internautes bien après qu’ils aient mis à disposition pour la première fois les contenus illicites. Plus inquiétant pour les utilisateurs modérés de BitTorrent, l’équipe française a trouvé un moyen très efficace pour repérer rapidement l’ensemble des internautes qui téléchargent. Pour cela, ils ont tout bonnement demandé aux huit trackers de The Pirate Bay (qui a abandonné cette activité depuis) l’intégralité des identifiants de fichiers partagés par l’intermédiaire du site, grâce à une fonction classique employée par les trackers.   Munis de ces identifiants uniques, soit la totalité du catalogue actif de The Pirate Bay, ils ont ensuite envoyé à son tracker des requêtes de lancement et d’arrêt de partage sur tous les identifiants de fichiers qu’ils avaient précédemment collectés. Or à chaque nouvelle requête, le tracker réagit en fournissant à chaque fois des adresses IP d’internautes partageurs différents à l’équipe de faux pirates : « Nous envoyons des requêtes de démarrage et d’arrêt jusqu’à ce que nous ayons atteint un nombre d’adresses IP uniques égal à 90 % du nombre total de seeders et de leechers indiqués par le tracker. Cette procédure prend aux alentours de 30 minutes pour entre 500 000 et 750 000 contenus », précise l’étude. Voilà de quoi surveiller vite et efficacement tous les contenus qui s’échangent… Sans compter qu’il est également très facile, par le biais de cette technique, de dénicher les « gros téléchargeurs » qui récupèrent des dizaines de contenus en même temps avec la même IP. (1) Le tracker sert à initier le téléchargement en reliant le nouveau venu aux internautes déjà en train de récupérer un contenu (les leechers) ainsi qu’à ceux qui disposent déjà d’une copie complète, les seeders.