Hosted by the courtesy of GitHub |
The stars ASAP
Durée du voyage intersidéral Résolutions de l'ONU en HTML Bussard Ramjet |
DWARF : dwarf2xml
ELF : libelf examples Code presentation : ctoohtml |
Home | Table des matières |
Produit le : mar mar 24 22:27:29 CET 2009 | Par : machinman.net |
Assez rapidement, j'ai dut déchanter car
les recherches sur les résolutions ne donnaient rien dans les
moteurs de recherche. Il y avait bien quelque résolutions
éparses sur divers sites, mais rien qui ressemble à
une
base sérieuse de référence. Même
Wikipédia semblait sec sur le sujet : il y avait bien les
listes, mais la plupars de pages n'existaient pas, du moins en
francais, qui est l'une de deux langues officielles.
En revanche, le wiki anglophone possèdait le texte de toutes les
résolutions.
Après un tour sans les méandres du système de documentation de l'ONU,
je me suis rendu compte que les textes étaient disponible sous
forme de scans PDF [1].
Devant un tel dénuement et conscient du gràve manquement
de mon pays dont la langue est une des langues officielle de l'ONU,
et qui offre un tel spectacle de désolation,
je me mis au travail pour transcrire quelques pages
pour le site de Wikipédia france.
Assez rapidement, je me
suis fatigué de dactylographier tout ce texte et j'ai commencer
à utiliser un logiciel de reconnaissance de caractère, de
son petit non OCR [2], pour faire une partie du
travail à ma place. Le processus a alors connu une
accélération fulgurante et j'ai complété 20
ans de résolutions en quelques mois.
Mais la tâche
était toujours immense, et il fallait augmenter le
rendement de manière industrielle pour en venir à bout.
C'est pourquoi j'ai continuer à parier sur l'informatique afin
d'augmenter le rendement.
Entre temps, je me suis demandé
s'il pourrait y avoir un intéret de publier ces textes sur
mon site tout en continuant à contribuer à Wiki, bien
sûr. Après réflexion, j'ai pensé que oui.
Tout d'abord, l'ONU veut que ces documents soient diffusés aussi
largement que possible, D'après Wikisource (sic) :
"
Conformément à ST/AI/189/Add.9/Rev.2 de l’ONU, les documents suivants sont dans le domaine public mondial :
La mission conciste donc à mettre en ligne les résolutions de l'ONU dans leur version française et en HTML basic.
Dans la mesure de mes moyens, je ferais de mon mieux pour maintenir les pages en ligne et de corriger toutes les différences avec le texte d'origine. Cela dit, le service est fourni "comme il est" et aucune garantie ne peut en être attendue, selon la formule consacrée.
Toutes les bonnes volontées sont les bienvenues. Il y en a pour
tout le monde !
- corriger le texte
- corriger la mise en page
- faire du découpage d'images
- squater l'OCR de votre entreprise
- lier le site avec Wiki
- travailler sur l'automatisation
[1] Il s'agit de documents construits à
partir d'une version papier qui a
été photographiée en mise en album. Comme il
s'agit de photographies,
le texte n'est pas compréhensible par les ordinateurs en tant
que
texte, mais en tant que dessin.
Comme les ordinateurs ne comprennent
pas ces documents, ils ne sont pas indéxés par les
moteurs de recherche
(google, altavista, yahoo etc ...). C'est pour cela qu'il n'a a presque
rien lorsqu'on fait une recherche sur internet.
[2] OCR : Optical Character Recognition
Hosted by the courtesy of GitHub |
The stars ASAP
Durée du voyage intersidéral Résolutions de l'ONU en HTML Bussard Ramjet |
DWARF : dwarf2xml
ELF : libelf examples Code presentation : ctoohtml |