Apr
29
OFFSHORE LEAKS - ICIJ - ILE CAIMAN - EVASION FISCALE

Source: http://sciencesetavenir.nouvelobs.com/decryptage

/20130423.OBS6749/offshore-leaks-quels-outils-informatiques

-pour-traiter-les-donnees.html

Offshore Leaks: quels outils informatiques pour traiter les données ?

Créé le 23-04-2013 à 16h39 - Mis à jour à 16h47

Par Arnaud Devillard

Sciences et Avenir

L'opération Offshore Leaks, c'est l'analyse de 2,5 millions

de documents numériques.

Emails, PDF, scans de documents...

Comment traiter ces monceaux de données ?

TURPITUDE. Des lettres, des emails, des fichiers PDF,

des passeports scannés, des tableaux...

C'est une masse de 2,5 millions de documents numériques,

de tout type, de tout format, concernant les turpitudes

de l'évasion fiscale et des paradis fiscaux

que la presse a dévoilé dans le monde entier.

La source ? Un disque dur de 260 gigabytes de données

envoyé à un journaliste australien il y a près d'un an et demi.

Celui-ci s'est alors tourné vers l'ICIJ

(Consortium international de journalistes d'investigation),

une organisation fondée en 1997 pour faire travailler ensemble

des journalistes de pays différents sur des sujets aux

ramifications internationales.

Problème : cette manne d'informations, si sensible que

le ministre français du Budget a demandé à la presse

de les transmettre à la justice (ce que Le Monde a refusé

de faire), s'est avérée d'abord très difficile à exploiter,

car trop massive, disparate et pas structurée.

L'ICIJ a donc décidé de s'équiper de plusieurs logiciels,

certains fournis gratuitement par des éditeurs,

d'autres développés en interne spécialement

pour le projet.

Une véritablement machinerie informatique

destinée à traiter et explorer une masse inédite

de documentation.

Les étapes qui ont conduit à la création d... par sciencesetavenir

Étape 1- Il y a plus d'un an, des anciens employés

de 2 sociétés offshore, Portcullis TrustNet, basée à

Singapour, et Commonwealth Trust Limited (CTL),

basée aux îles Vierges britanniques, envoient par

courrier un disque dur contenant 260 Gigabytes de

données sur 30 ans.

C'est 160 fois plus que les câbles diplomatiques

sortis par WikiLeaks en 2010.

Ce disque dur contient 500 000 documents textes,

2 millions d'e-mails remontant à fin des années 90,

des fichiers pdf, des scans de papiers d'identité,

des tableurs.

Le tout concerne 10 paradis fiscaux, 122 000 sociétés offshore,

130 000 noms de personnes de 170 pays.

Étape 2- Gerard Ryle, un journaliste australien qui

vient de travailler 3 ans sur le scandale Firepower

International, une affaire d'escroquerie, reçoit ce disque dur.

Il décide de travailler dessus dans le cadre de l'ICIJ

(Consortium international de journalistes d'investigation),

une organisation fondée en 1997 pour faire travailler

ensemble des journalistes de pays différents sur des

sujets internationaux. Gérard Ryle est aujourd'hui

directeur de l'ICIJ.

Étape 3- En Nouvelle-Zélande, une équipe fait un

premier travail à la main sur les données : elle identifie

les noms de personnes et de sociétés cités et les

associent au pays correspondant.

Les informations sont ensuite vérifiées sur le terrain,

dans chaque pays.

C'est un véritable travail de fourmi, qui a pris des

centaines d'heures, sans utilisation d'aucun logiciel

à part pour quelques documents chiffrés.

Étape 4- L'équipe de l'ICIJ doit ensuite rescanner

des documents qui s'avèrent illisibles ou inanalysables

en l'état (notamment les fichiers images).

Ils utilisent un logiciel de reconnaissance optique de caractères.

Étape 5- Pour pouvoir désormais analyser et traiter

les données, l'ICIJ décide de s'équiper d'outils logiciels puissants :

Ils obtiennent gratuitement des licences pour utiliser 2 programmes

de Free Text Retrieval (FTR) : eDiscovery, de l'éditeur australien

NUIX, et dtSearch Desktop de l'éditeur américain dtSearch.

NUIX fournira même aux journalistes du projet une formation

à l'utilisation de son logiciel.

Ces outils vont servir à analyser tous les documents,

de tous types, de tout format ; ils sont capables d'isoler

des noms et des adresses, de les indexer, afin de créer

une base de données structurée et de permettre ensuite

de faire des recherches.

Cette base de données prend le nom de OMET

(offshore main entity tables).

L'ICIJ se fait développer spécialement pour ce projet 2

autres logiciels, par des développeurs britanniques,

allemands et costaricains.

L'un sert à retrouver et à associer les noms et les

adresses qui vont ensemble.

L'autre est capable d'attribuer un pays à chaque fichier,

y compris quand les données géographiques manquent

ou s'avèrent incomplètes.

Enfin, au fil de ses découvertes, l'organisation contacte

de plus en plus de journalistes.

Elle décide alors de se doter d'interface de consultation

en ligne pour faciliter le travail de tout le monde.

Appelée Interdata, elle est développée en 2 semaines,

fin décembre 2012, par un développeur anglais.

Elle permet de chercher et de télécharger des documents,

sur la base de mots-clefs.

En parallèle à ces développements, et après avoir répertorié

les pays concernés, l'ICIJ propose à des journalistes

du monde entier de participer au projet.

Au final, 86 journalistes de 46 pays sont impliqués :

Le Monde, pour la France, la BBC et The Guardian

pour le Royaume-Uni, la CBC pour la Canada,

la Nacion pour l'Argentine, le Washington Post

pour les Etats-Unis, Le Matin Dimanche pour la Suisse,

l'Asahi Shimbun pour le Japon, etc.

Ils consultent la base de données via Interdata

et échangent entre eux sur un forum dédié.

Ajouter un commentaire

Image CAPTCHA