Salta al contenuto principale
Algoritmi di intelligenza artificiale per la post produzione di immagini
Tecnologie
11 Mag 2023

Algoritmi di intelligenza artificiale per la post produzione di immagini

Made In Heritage e la tecnologia OpenCV

Remko Bigai | AI Algorithms Engineer

Quando si avviano grandi campagne di digitalizzazione degli archivi storici si ‘producono’ inevitabilmente una grande quantità di immagini (fotografie, mappe catastali, oggetti materiali) che necessariamente devono essere sottoposte a uno speciale trattamento di post produzione, indispensabile alla loro efficace integrazione all’interno di un apposito data base archivistico.

A questo scopo Made In Heritage, grazie ai tecnici di mind@ware, ha sviluppato delle applicazioni ad hoc basate su piattaforme di intelligenza artificiale tipo Google Vision per l’estrazione di metadati e su librerie open source quali, ad esempio, OpenCV per il processo di post produzione delle immagini.

OpenCV (Open Source Computer Vision Library) è una libreria cosiddetto multipiattaforma (ovvero capace di operare su più sistemi operativi) progettata per lo sviluppo della visione artificiale in tempo reale. Per visione artificiale si intende quell’ambito dell’informatica che permette ai computer di identificare oggetti e persone nelle fotografie e nei video. Come ha dimostrato Daniel Kahneman nel suo celebre libro Thinking, Fast e Slow, riconoscere persone e oggetti è per il cervello umano un’attività piuttosto semplice, anzi addirittura innata. Per le macchine è invece un compito difficilissimo e richiede una notevole potenza di calcolo. Oggi, tuttavia, grazie agli sviluppi dell’AI si stanno ottenendo progressi straordinari in questo campo e le macchine sono sempre più capaci di eguagliare anche questo tipico tratto dell’intelligenza naturale. Nella fattispecie, i software come OpenCV non soltanto insegnano ai computer come guardare il mondo con occhi umani, ma anche come essi comprendono ciò che vedono (ad esempio attribuendo emozioni alle espressioni dei volti). 

Il linguaggio di programmazione principalmente utilizzato per sviluppare con questa libreria è il C++, ma è possibile interfacciarsi anche attraverso il C, Java e Python. Quest'ultimo è quello utilizzato da MIH nei suoi algoritmi di post produzione.

Nell’ambito delle attività Made In Heritage, attraverso OpenCV sono state sviluppate applicazioni funzionali alla post produzione delle immagini acquisite durante le campagne di digitalizzazione dei documenti di archivio. Per post produzione s’intende l'operazione di generazione di immagini derivate che siano per dimensione e formato agevolmente fruibili via internet, a partire da file master in alta definizione prodotti dagli scanner. Questi file master, una volta terminata la fase di post produzione, possono essere archiviati in sistemi di storage per la conservazione a lungo termine. Nella pratica abituale (cioè quella eseguita dall’uomo) eseguire le operazioni di post produzione (ad esempio la misurazione, la conversione formato da nativo a jpeg a massima qualità, oppure la correzione del colore o la calibrazione della luminosità) su quantità elevata di immagini implica dedicare molte di ore di lavoro/uomo. 

Per rendere più accurato ed efficiente tale processo e grazie a strumenti come OpenCV, Made in Heritage ha sviluppato una suite di applicazioni WEB based, di facile utilizzo, dedicate alla post produzione automatica di immagini da scanner. Tali applicazioni risultano particolarmente indicate per:

  1. Post processing grafico

Concretamente si intende l’esecuzione in automatico della conversione formato, correzione inclinazione, ritaglio, bilanciamento del bianco, correzione aberrazione cromatica e applicazione del profilo colore fotocamera delle immagini acquisite dagli scanner. Questo processo permette di ridurre drasticamente i tempi di produzione. Ad esempio, 10.000 immagini richiedono il lavoro di una persona per 15-20 giorni lavorativi; al contrario tramite l’applicazione sono richieste circa 35 ore di calcolo della macchina, raggiungendo un indice di affidabilità del 98% circa.

  1. Estrazione testo

Questo risultato si ottiene dai documenti digitalizzati tramite OCR (Optical Character Recognition) massivo. La procedura permette di arricchire la metadatazione delle immagini che vengono elaborate.

  1. Strutturazione di documenti digitalizzati

Si tratta di un’attività particolarmente importante perché permette la disposizione automatica dei file presenti in singola directory lineare in cartelle e sottocartelle su file system che rispecchiano la struttura archivistica tramite utilizzo di QR Code generati dalla piattaforma di catalogazione.

  1. Misurazione dei documenti automatizzata

Anche in questo caso, tramite l’utilizzo di algoritmi di Computer Vision è possibile semplificare ed efficientare attività essenziali per la gestione informatizzata degli archivi storici come il calcolo automatico della geometria dei documenti.

I progetti Made In Heritage attualmente in corso che già sfruttano le opportunità offerte dalla libreria OpenCV nella post produzione delle immagini acquisite tramite le campagne di scansione digitale dei documenti d’archivio sono #LeviDigiLab della Fondazione Ugo e Olga Levi e #HeritageLab di Italgas. Incontestabilmente due iniziative all’avanguardia nella valorizzazione del proprio patrimonio storico attraverso l’utilizzo di sofisticate e innovative tecnologie informatiche e digitali.