Convertendo documentos “PDF” em formato “TXT” com o Magic xpa

Veja nesta publicação como ler conteúdos de documentos PDF como se fossem simples textos, usando o Magic xpa.

Não é de hoje que temos destacado a integração nativa que o Magic xpa possui com códigos .NET (DLLs) e Java (.JARs) e como isso remove as limitações no desenvolvimento de soluções dos mais variados desafios que se apresentam, dia após dia, no mundo das aplicações corporativas.

 

E agora, vamos revisitar estes recursos e ver como resolver uma situação que pode ocorrer em um processo de negócio:

Ler e processar o conteúdo de um documento que foi disponibilizado em formato PDF.

 

Há um projeto Open Source no GitHub, chamado iText ( https://github.com/itext/itext7-dotnet ) que está na sua versão 7 e disponibiliza uma série de classes .NET para lidar com documentos  PDF.

 

Entre os diversos recursos disponibilizados em suas bibliotecas, está o que vamos precisar neste caso: converter um PDF em TXT.

Iniciamos adicionado as referências a estes módulos do iText 7 em nosso projeto Magic xpa:

 

e em seguida, só o que precisamos é usar o recurso Invoke .NET para instanciar as classes PdfReader(), PdfDocument() e PdfTextExtractor(), assim:

 

Esse pequeno e simples algoritmo abre um documento (arquivo) PDF e analisa suas páginas em um loop, extraindo o conteúdo “textual” de cada uma delas e concatenando-o em um StringBuilder() .NET, que ao final é salvo em disco como um arquivo TXT.

Isso permite que um documento como este:

 

seja transformado em um como este:

 

Ou um como este (um DANFe):

 

em um outro como este:

 

E agora que estão como formato “texto“, podem ser lidos e processados pelo Magic xpa usando Form Input por exemplo.


Baixe deste endereço um projeto exemplo com o Magic xpa 3.3i, e desfrute de mais esta facilidade que está disponível para as suas aplicações.

Tem interesse em conhecer mais sobre o iText 7 ? Acesse sua documentação on-line: https://api.itextpdf.com/iText7/dotnet/7.1.16/index.html

Manoel Frederico Silva – Gerente de Tecnologia e Evangelista MAGIC – Magic Brasil
Manoel Frederico Silva – Evangelista MAGIC – Magic Brasil

 

Para receber os artigos do Blog Magic Brasil em primeira mão no seu email, registre-se aqui

 

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *