sabato 27 marzo 2010

Archivio Vaticano: i guai di OCR

http://www.vatican.va/archive/atti-ufficiali-santa-sede/index_it.htm


Descrizione del meccanismo perverso.

Fase 1: pressioni politico-mediatiche contro il Vaticano: alcuni
giornalisti reclamano l'apertura degli archivi sognando di trovarvi
dentro chissà quali scheletri.

Fase 2: qualche eminenza vaticana decide che bisogna pubblicare al più
presto tutti gli Atti della Santa Sede dal 1867 ad oggi, "tanto con i
computer, oggi, subito si fa tutto".

Fase 3: un giovane aspirante prete, incidentalmente laureato in
informatica e dotato di esperienza nel campo OCR, gli fa notare che
purtroppo non è vero che "subito" si fa tutto, perché è necessario far
rivedere a più persone diverse la scansione di ogni singola pagina per
togliere quei piccoli errori che a prima vista non si notano (ripeto per
chi avesse sottovalutato il problema: "far rivedere a più persone
diverse la scansione di ogni singola pagina").

Fase 4: l'eminenza frettolosa insiste: "ma oggi con i computer si fa
subito tutto!" Prende dalle Pagine Gialle il nome dell'azienda col logo
più grande e colorato che trova, chiedendo un preventivo per portare in
formato elettronico un imprecisata quantità di decine di migliaia di
pagine (per lo più in latino).

Fase 5: l'azienda impiega otto segretarie, un commerciale e tre avvocati
per redigere un'offerta commerciale di centottantuno pagine che si
sintetizza nella somma finale da pagare (composta di varie cifre seguite
da "00.000,00€+IVA"), più un grafico pubblicitario per aggiornare il
depliant e scrivere "lavoriamo anche per il Vaticano".

Fase 6: dieci giorni prima della consegna, l'azienda recupera due
interinali promettendo di pagar loro gli arretrati delle pulizie, purché
passino le nottate sullo scanner (un vecchio Trust su porta parallela,
all'epoca costato trentanovemila lire) e al lavoro sul TextBridge per
Win 3.1 (ventisei megabytes compressi da installare).

Fase 7: trentaquattro giorni dopo la scadenza della consegna, partono i
primi file PDF verso la casella di posta elettronica personale del
webmaster del sito web del Vaticano.

Fase 8: dopo un imprecisato numero di settimane, vengono pubblicati
all'improvviso tutti i file PDF, sperando che la nomenclatura dei files
non contenga errori (per esempio un "8" al posto di un "9"), perché era
sempre mancato il tempo di controllare.


Nota bene: quanto sopra affermato è frutto di fantasia e -si spera- il
più lontano possibile dalla realtà... Intanto, però, come si vede
nell'immagine allegata in questa stessa pagina, gli errori ci sono.

Per esempio la croce è diventata un simbolo di copyright "(C)" e la
lettera "G" è diventata una "O" con umlaut...

;-)

Nessun commento:

Posta un commento