blogvaltec

Automatización Inteligente: AWS Textract y Azure Form Recognizer

Escrito por Equipo Valtec Consultores | Jul 25, 2023 4:28:55 PM

OCR con servicios de IA.

En el vertiginoso mundo digital actual, la automatización se ha convertido en el santo grial para muchas empresas que buscan mejorar la eficiencia, reducir costos y optimizar sus operaciones. Dos poderosos aliados en esta búsqueda son AWS Textract y Azure Form Recognizer, servicios de Inteligencia Artificial (IA) que permiten automatizar la extracción y procesamiento de datos en documentos, allanando el camino hacia la verdadera transformación digital.

 

¿Qué es AWS Textract?

 

AWS Textract es un servicio ofrecido por Amazon Web Services (AWS) que utiliza algoritmos avanzados de visión por computadora y aprendizaje profundo para extraer texto, tablas y otros datos estructurados y no estructurados de documentos escaneados o archivos PDF. Esta asombrosa herramienta permite a las empresas digitalizar grandes volúmenes de documentos en papel y automatizar procesos previamente manuales.

Ventajas de AWS Textract:

  1. Precisión y Confianza: AWS Textract ofrece una precisión excepcional en la extracción de datos, incluso en documentos complejos y con diferentes formatos. Su capacidad para identificar y comprender el contexto mejora la fiabilidad y confianza de los resultados obtenidos.

  2. Eficiencia y Ahorro de Tiempo: La automatización de la extracción de datos agiliza los flujos de trabajo, lo que reduce considerablemente el tiempo y esfuerzo que los empleados deben invertir en tareas tediosas y repetitivas.

  3. Escalabilidad y Flexibilidad: AWS Textract es altamente escalable, lo que permite procesar grandes cantidades de documentos en poco tiempo. Además, se puede integrar fácilmente con otras herramientas y servicios de AWS, brindando una solución completa para las necesidades de cada empresa.

 

Aquí te proporcionamos un código en C# para utilizar el API de AWS Textract para analizar gastos (AWS Textract Analyze Expense) utilizando el SDK de AWS para .NET (AWSSDK.Textract). Asegúrate de tener instalado el paquete NuGet "AWSSDK.Textract" antes de ejecutar el código.

using System;
using System.IO;
using System.Collections.Generic;
using Amazon;
using Amazon.Textract;
using Amazon.Textract.Model;

namespace EjemploTextractAnalyzeExpenseCSharp
{
    class Program
    {
        static void Main(string[] args)
        {
            // Configura las credenciales de AWS y la región
            string accessKey = "TU_ACCESS_KEY";
            string secretKey = "TU_SECRET_KEY";
            RegionEndpoint region = RegionEndpoint.USWest2; // Cambia esto a la región de tu preferencia

            // Inicializa el cliente de Textract
            var textractClient = new AmazonTextractClient(accessKey, secretKey, region);

            // Lee una imagen desde un archivo local o URL de imagen
            string filePath = "RUTA_DE_LA_IMAGEN_AQUI"; // Cambia esto con la ruta o URL de tu imagen
            byte[] imageBytes = File.ReadAllBytes(filePath);

            // Realiza la solicitud al API de Textract AnalyzeExpense
            AnalyzeExpenseRequest request = new AnalyzeExpenseRequest
            {
                Document = new Document
                {
                    Bytes = new MemoryStream(imageBytes)
                }
            };

            try
            {
                // Obtiene la respuesta del API
                AnalyzeExpenseResponse response = textractClient.AnalyzeExpense(request);

                // Procesa la respuesta para obtener los resultados del análisis de gastos
                List<ExpenseDocument> expenseDocuments = response.ExpenseDocuments;
                foreach (ExpenseDocument document in expenseDocuments)
                {
                    Console.WriteLine($"Documento: {document.ExpenseIndex}");
                    Console.WriteLine($"Fecha: {document.ExpenseFields.Date?.Text}");
                    Console.WriteLine($"Proveedor: {document.ExpenseFields.Vendor?.Text}");
                    Console.WriteLine($"Total: {document.ExpenseFields.Total?.Text}");
                    Console.WriteLine();
                }
            }
            catch (AmazonTextractException ex)
            {
                Console.WriteLine("Error al analizar los gastos con Textract AnalyzeExpense:");
                Console.WriteLine(ex.Message);
            }
        }
    }
}

 

¿Qué es Azure Form Recognizer?

 

Por su parte, Azure Form Recognizer es un servicio de Microsoft Azure que utiliza la potencia de la IA para analizar y extraer información de formularios, facturas, recibos y otros documentos similares. Al igual que AWS Textract, este servicio facilita la automatización y mejora la eficiencia en el procesamiento de datos.

Ventajas de Azure Form Recognizer:

  1. Detección de Campos Personalizados: Azure Form Recognizer permite a las empresas entrenar modelos para detectar campos específicos en formularios, adaptándose así a sus necesidades y tipos de documentos.

  2. Aprendizaje Activo: Este servicio se adapta y mejora continuamente gracias al aprendizaje activo, lo que garantiza una mayor precisión y eficiencia en la extracción de datos con el tiempo.

  3. Integración con Azure: Azure Form Recognizer es parte de la plataforma de servicios en la nube de Microsoft Azure, lo que facilita su implementación y la integración con otras herramientas y servicios de la suite.

 

Aquí tienes un código en C# para leer el API de Azure Form Recognizer utilizando el SDK de Azure Form Recognizer. Antes de ejecutar el código, asegúrate de haber instalado el paquete NuGet "Microsoft.Azure.CognitiveServices.FormRecognizer".

using System;
using System.IO;
using Microsoft.Azure.CognitiveServices.FormRecognizer;
using Microsoft.Azure.CognitiveServices.FormRecognizer.Models;

namespace EjemploFormRecognizerCSharp
{
    class Program
    {
        static void Main(string[] args)
        {
            // Configura la clave de suscripción y la URL de servicio de Azure Form Recognizer
            string subscriptionKey = "TU_CLAVE_DE_SUSCRIPCION";
            string endpoint = "TU_URL_DE_SERVICIO";

            // Crea un cliente de Form Recognizer
            var formRecognizerClient = new FormRecognizerClient(new ApiKeyServiceClientCredentials(subscriptionKey))
            {
                Endpoint = endpoint
            };

            // Lee una imagen desde un archivo local o URL de imagen
            string filePath = "RUTA_DE_LA_IMAGEN_AQUI"; // Cambia esto con la ruta o URL de tu imagen
            byte[] imageBytes = File.ReadAllBytes(filePath);

            // Realiza la solicitud al API de Form Recognizer
            using (MemoryStream stream = new MemoryStream(imageBytes))
            {
                try
                {
                    // Obtiene la respuesta del API
                    var analyzeResult = formRecognizerClient.AnalyzeWithCustomModel("TU_CUSTOM_MODEL_ID", stream);

                    // Procesa la respuesta para obtener los resultados del análisis
                    foreach (var page in analyzeResult.Pages)
                    {
                        foreach (var field in page.KeyValuePairs)
                        {
                            Console.WriteLine($"Campo: {field.Key}");
                            Console.WriteLine($"Valor: {field.Value.ValueText}");
                            Console.WriteLine();
                        }
                    }
                }
                catch (Exception ex)
                {
                    Console.WriteLine("Error al analizar el formulario con Form Recognizer:");
                    Console.WriteLine(ex.Message);
                }
            }
        }
    }
}

 

Automatización Inteligente: Un Futuro Prometedor

Tanto AWS Textract como Azure Form Recognizer representan un paso significativo hacia la automatización inteligente. Estos servicios no solo agilizan procesos, sino que también liberan recursos y permiten a las empresas centrarse en actividades de mayor valor agregado. Desde la digitalización de documentos hasta la automatización de flujos de trabajo complejos, estas soluciones de IA allanan el camino hacia la transformación digital completa.

 

Si deseas implementar estos servicios en tu organización, ¡contáctanos!

contactenos@valtecconsultores.com.pe