Introduzione¶
Il package LTX (Large Text eXtension) permette l’estrazione avanzata di testo da documenti, di conseguenza la valorizzazione di una corrispondente colonna con il contenuto testuale di un allegato o un file, e la conseguente possibilità di effettuare ricerche su di essa.
Includere il package LTX nel progetto¶
Il package LTX è incluso nel «gnrextra» di Genropy, e può quindi essere facilmente incluso in tutti i progetti semplicemente modificando il file instanceconfig.xml come segue:
<packages>
<gnrextra_ltx pkgcode="gnrextra:ltx"/>
</packages>
Dopo aver aggiunto il package all’istanza è necessario specificare almeno una colonna di una tabella come destinataria del contenuto del documento. Si faccia pertanto riferimento alla sezione Configurazione
È a quel punto possibile effettuare una gnr db migrate
dell’istanza per allineare il database e creare le colonne necessarie.
Requisiti¶
Il package ltx richiede le librerie langdetect e mistralai. È possibile installarle automaticamente dopo aver aggiunto il package all’istanza lanciando il comando:
gnr app checkdep <nomeistanza> -i
Autore della sezione: Davide Paci