autoclasificación de documentos con athento: buenas prácticas y trucos para obtener el mayor...
DESCRIPTION
En esta presentación aprenderás: * Qué características de los documentos nos ayudarán a obtener mejores resultados de clasificación. * Qué mecanismos de clasificación utiliza Athento para la autoclasificación de documentos. * Qué son modelos de clasificación. * Como utilizar palabras clave para obtener mejores resultados de clasificación.TRANSCRIPT
![Page 1: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento](https://reader034.vdocuments.net/reader034/viewer/2022052507/5584128dd8b42a11168b5071/html5/thumbnails/1.jpg)
Autoclasificación de documentos. Buenas Prácticas y Trucos para Obtener el Mayor Rendimiento
Enero/2014
![Page 2: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento](https://reader034.vdocuments.net/reader034/viewer/2022052507/5584128dd8b42a11168b5071/html5/thumbnails/2.jpg)
Índice
Buenas Prácticas
Método 1: Análisis de Imágenes
Método 2: Expresiones Regulares
Ejemplo práctico
![Page 3: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento](https://reader034.vdocuments.net/reader034/viewer/2022052507/5584128dd8b42a11168b5071/html5/thumbnails/3.jpg)
Buenas Prácticas
Calidad de la imagen: mínimo 300 DPI (puntos por pulgada
![Page 4: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento](https://reader034.vdocuments.net/reader034/viewer/2022052507/5584128dd8b42a11168b5071/html5/thumbnails/4.jpg)
Buenas Prácticas
Calidad de los documentos(manchas, dobleces, mal escaneo)
![Page 5: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento](https://reader034.vdocuments.net/reader034/viewer/2022052507/5584128dd8b42a11168b5071/html5/thumbnails/5.jpg)
Buenas Prácticas
Formatos estándares de ImagenPDF, TIFF, PNG24, JPEG etc.
![Page 6: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento](https://reader034.vdocuments.net/reader034/viewer/2022052507/5584128dd8b42a11168b5071/html5/thumbnails/6.jpg)
Análisis de Imágenes
Utilizando imágenes: Histograma
![Page 7: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento](https://reader034.vdocuments.net/reader034/viewer/2022052507/5584128dd8b42a11168b5071/html5/thumbnails/7.jpg)
Análisis de Imágenes
Histograma de la imagen previa
![Page 8: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento](https://reader034.vdocuments.net/reader034/viewer/2022052507/5584128dd8b42a11168b5071/html5/thumbnails/8.jpg)
Análisis de la Imagen
Usando el tamaño (ancho y alto)
![Page 9: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento](https://reader034.vdocuments.net/reader034/viewer/2022052507/5584128dd8b42a11168b5071/html5/thumbnails/9.jpg)
Análisis de Imágenes
Redes Neuronales
![Page 10: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento](https://reader034.vdocuments.net/reader034/viewer/2022052507/5584128dd8b42a11168b5071/html5/thumbnails/10.jpg)
Expresiones Regulares
Buscamos patrones en el documento(También útil para la keyword extraction)
![Page 11: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento](https://reader034.vdocuments.net/reader034/viewer/2022052507/5584128dd8b42a11168b5071/html5/thumbnails/11.jpg)
Cómo clasificar documentos?
Nombre de Empresa (Telefónica, Walt-Disney)Tipo de Documento (Factura, Contrato)RUT ↔ C.I.F.
![Page 12: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento](https://reader034.vdocuments.net/reader034/viewer/2022052507/5584128dd8b42a11168b5071/html5/thumbnails/12.jpg)
Cómo definir modelos?
Modelo = Plantilla = Tipo de DocumentoEjemplo: Tickets Starbucks, Tarjeta Embarque American Airlines
![Page 13: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento](https://reader034.vdocuments.net/reader034/viewer/2022052507/5584128dd8b42a11168b5071/html5/thumbnails/13.jpg)
Why?
There is a better way to do document
management”
![Page 14: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento](https://reader034.vdocuments.net/reader034/viewer/2022052507/5584128dd8b42a11168b5071/html5/thumbnails/14.jpg)
Gracias
Preguntas?