Introduzione

Il package LTX (Large Text eXtension) permette l’estrazione avanzata di testo da documenti, di conseguenza la valorizzazione di una corrispondente colonna con il contenuto testuale di un allegato o un file, e la conseguente possibilità di effettuare ricerche su di essa.

Includere il package LTX nel progetto

Il package LTX è incluso nel «gnrextra» di Genropy, e può quindi essere facilmente incluso in tutti i progetti semplicemente modificando il file instanceconfig.xml come segue:

<packages>
     <gnrextra_ltx pkgcode="gnrextra:ltx"/>
</packages>

Dopo aver aggiunto il package all’istanza è necessario specificare almeno una colonna di una tabella come destinataria del contenuto del documento. Si faccia pertanto riferimento alla sezione Configurazione

È a quel punto possibile effettuare una gnr db migrate dell’istanza per allineare il database e creare le colonne necessarie.

Requisiti

Il package ltx richiede le librerie langdetect e mistralai. È possibile installarle automaticamente dopo aver aggiunto il package all’istanza lanciando il comando:

gnr app checkdep <nomeistanza> -i

Autore della sezione: Davide Paci