Creazione, Conversione e Gestione dei PDF

Categoria: Tecnologie
Ti trovi in : Home >> Tecnologie >> PDF - Creazione - Conversione - Gestione

Generare e gestire in maniera automatica documenti in formato PDF grazie agli script della piattaforma di gestione documentale Chico

Originariamente nato come formato per gestire comandi di stampa in ambito professionale, il formato PDF si è via via evoluto diventando nel tempo il formato più usato per la generazione e lo scambio di documenti.

L’evoluzione ha riguardato la flessibilità, la dinamicità e la interoperabilità dei contenuti.

Sono state quindi ad esempio via via introdotte funzionalità in grado di rendere dinamici i contenuti del documento e le relative rappresentazioni del contenuto (e.g. la «data corrente» aggiornata nel momento della visualizzazione o stampa del documento) arrivando a poter inserire (dalla versione 7) all’interno del file PDF anche del codice Java Script.

Al tempo stesso queste funzionalità di rendering dinamico sono state invece disattivate nel formato PDF/A concepito espressamente per la conservazione inalterabile dei documenti (es. Conservazione a Norma prevista in Italia dalle direttive Agid).

Quando si rende necessaria la Creazione di PDF?

In massima sintesi due sono i momenti in cui può avvenire la creazione di PDF:

  1. Come risultato di un processi di acquisizione e scansione da scanner (in questo caso il PDF contiene di fatto l’immagine del documento originario; può essere arricchito, contestualmente alla creazione, o successivamente tramite post elaborazioni, di contenuto di tipo testo ottenendo cosi un PDF Searchable, vedi sotto).
  2. Come output di un processo digitale di creazione o conversione documenti: in questo caso il PDF contiene sia immagini che stringhe di testo e comandi secondo la sintassi prevista dal formato PDF.

Un esempio di questo secondo caso sono le stampe in formato PDF generate dai più comuni prodotti di office automation o le conversioni in formato PDF di file originariamente in formati diversi (e.g. Ms Office, EML, ODF, XML, JSON, XPS, etc. etc.) o le creazioni da parte di software gestionale o tecnico (e.g. produzione di pro forma fatture da parte di più comuni software gestionali).

 Il formato PDF Searchable

Una menzione a parte merita il così detto formato PDF Searchable, che è la sintesi di due processi distinti:

  1. Scansione da scanner e produzione di un formato immagine;
  2. Riconoscimento dei caratteri tramite OCR presenti nella immagine;

Il risultato è la produzione di un file PDF che contiene sia l’immagine originaria risultante dalla scansione, sia il testo riconosciuto dal processo OCR.

Di norma, il secondo viene memorizzato come testo non visibile insieme a tutte le informazioni a corredo raccolte durante la fase di OCR (dimensione, posizione etc,) e quindi in fase di riproduzione del documento non viene visualizzato.

Il testo riconosciuto può essere quindi utilizzato nelle successive fasi di elaborazione del documento senza dover riapplicare il processo di OCR sulla immagine rappresentante la copia speculare del documento originario.

I vantaggi della soluzione Chico per la gestione e creazione di PDF

Chico è in grado di:

  • Generare PDF da processi di scansione
  • Generare PDF da processi di elaborazione inserendo Testo, Grafica, Barcode, Immagine o Porzione di immagini
  • Generare PDF Searchable a seguito di processi di OCR
  • Convertire in PDF tutti i più utilizzati formati file
  • Convertire PDF in file immagine
  • Costruire TOC (Table of Contenens)
  • Estrarre Campi e Attributi
  • Verificare Validità Firma
  • Aggiungere Allegati
  • Elaborare i contenuti dei vari formati PDF estraendone i dati e andando ad utilizzarli per post elaborazioni anche complesse (es. alimentare flussi di fatturazione elettronica partendo da fatture in formato proforma PDF)
  • «Navigare» all’interno dei contenuti di un file PDF, per individuare delle informazioni da estrarle, grazie a tecniche proprietarie che permettono di sfruttare logiche di:
    • Labeling
    • Prossimità (near range far range, up down left right,..)
    • Espressioni Regolari (formati carte di credito, nr documento patente, identità, passaporto,date, etc.)
    • Fuzzy Search

    Altre Tecnologie:

    Algoritmo Decision Tree Classifier

    Cos’è l’albero di decisione e come l’algoritmo alla base dei nostri sistemi permette di gestire i flussi di documenti, dati, e-mail, PEC, PDF ed altri allegati

    leggi tutto