digitalizacion y captura documental

23
Digitalización y Captura documental 1 de julio de 2014

Upload: adrian-macias

Post on 13-Jun-2015

348 views

Category:

Documents


0 download

DESCRIPTION

Presentación elaborada para mi intervención en el Webinar de Digitalización y Captura de documentos en gestión documental del próximo 1 de julio de 2014 con Tecnowebinars.

TRANSCRIPT

Page 1: Digitalizacion y captura documental

Digitalización y Captura documental1 de julio de 2014

Page 2: Digitalizacion y captura documental

Digitalización vs Captura documental

Definiciones previas Digitalización: Acto o acción de digitalizar documentos mediante el uso de escáneres u

otro tipo de hardware.

Captura documental: Incluye la digitalización de documentos e implica procesos

inteligentes de extracción de metadatos y de clasificación de documentos en el sistema.

Digitalizar documentos no va más allá en la práctica que el hecho de subirlos a un sistema de almacenamiento y dejarlos ahí sin que ello implique por defecto una organización inteligente que facilite su posterior localización.

Page 3: Digitalizacion y captura documental

Conversión de la documentación en papel a su equivalente en registros digitales (oficina

sin papeles).

Ahorro de costes de almacenamiento físico.

Ofrece garantías de preservación a largo plazo por medios digitales.

Accesibilidad universal a la documentación corporativa sin depender de

plataformas tecnológicas (ordenador, smartphone, tablets, etc).

Digitalización vs Captura documental

Aspectos comunes

Page 4: Digitalizacion y captura documental

Digitalización: Almacenamiento de documentos escaneados en una base de datos.

Procesos corporativos de gestión documental: Requiere que la Digitalización vaya

acompañada de acciones que permitan la localización posterior de los documentos en

el sistema y la recuperación de la información que contienen para ser empleada como

base en el desarrollo de otras ideas de negocio y en la resolución de proyectos de la

empresa.

Digitalización vs Captura documental

Digitalización vs Gestión documental

Page 5: Digitalizacion y captura documental

Digitalización vs Captura documental

Integración Digitalización y Gestión documentalUnir la digitalización a un sistema de gestión documental inteligente que abarque la

creación de registros digitales a partir de la documentación original en papel, y

posteriormente permita establecer rutinas de autoclasificación de documentos y de

extracción de metadatos . Con el objetivo de garantizar la máxima accesibilidad a la

documentación en cualquier momento del futuro.

La integración anteriormente descrita se identificaría más propiamente con el término

CAPTURA DOCUMENTAL, la cual es la primera de las fases del CICLO DE VIDA DE LOS

DOCUMENTOS, que constituye la base de la evolución actual de la gestión documental

corporativa, denominada GESTIÓN DE CONTENIDOS EMPRESARIALES (ECM).

Page 6: Digitalizacion y captura documental

Ciclo de vida de los documentos

Page 7: Digitalizacion y captura documental

Digitalización vs Captura documentalCaptura inteligente de documentos Autoclasificación de documentos

Extracción automática de metadatos

Hot Folder: Conectar el sistema con una carpeta local y esta con el escáner. Cada vez

que el escáner incluya un documento en esta carpeta, el sistema tendrá la capacidad de

procesarlo sin necesidad de intervención humana.

Escanear los documentos en forma de lotes y dejar que el sistema los separe

individualmente por diversos métodos.

Un conjunto de tecnologías que permiten a un sistema de gestión documental automatizar los procesos de clasificación y extracción de metadatos de documentos subidos al sistema mediante digitalización.

Page 8: Digitalizacion y captura documental

TECNOLOGÍAS EN CAPTURA INTELIGENTE DE DOCUMENTOS

Page 9: Digitalizacion y captura documental

Mecanismo de inteligencia en captura documental Definición previa de modelo documental: Previamente a la captura masiva de

documentos, un operario humano digitalizará un tipo documental, el cual empleará para

informar al sistema de las características físicas y las expresiones específicas de dicho tipo

documental. A partir de la creación del tipo documental, el sistema actuará de forma

automatizada en lo que se refiere a la clasificación documental y la extracción de

metadatos.

Tecnologías de captura inteligente

Page 10: Digitalizacion y captura documental

Captura inteligente de documentos Tecnologías semánticas.

Tecnologías de reconocimiento óptico de caracteres (OCR) y similares.

Tecnologías de autodetección (códigos de barras).

Tecnologías de captura inteligente

Page 11: Digitalizacion y captura documental

Tecnologías de captura inteligenteReconocimiento óptico de caracteres (OCR) Convertir un documento-imagen digitalizado en un documento-texto.

Autoclasificación documental: Identificación de tipos documentales que se incluyen en

el sistema mediante comparativa de “expresiones regulares” que contienen.

Extracción de metadatos: Extracción de información útil de los documentos una vez

son digitalizados que puede ser procesada informáticamente.

Page 12: Digitalizacion y captura documental

Tecnologías de captura inteligenteTecnologías complementarias a OCR ICR: tecnología con la que los escáneres y sistemas de imágenes pueden convertir

caracteres en letra manuscrita en caracteres capaces de ser interpretados o reconocidos

por un ordenador.

Page 13: Digitalizacion y captura documental

Tecnologías de captura inteligenteTecnologías complementarias a OCR OMR: reconocimiento de marcas ópticas como las que se emplean en un cuestionario

de respuesta múltiple. Procesamiento del tipo documental de las encuestas. Para aplicar

esta tecnología se emplea un tipo de escáner que tiene capacidad para reconocer la

existencia o no de una marca óptica, mientras que no procesa ni la letra manuscrita ni las

imágenes de los formularios.

Page 14: Digitalizacion y captura documental

Tecnologías de captura inteligenteCódigos de barras Forma de captura de datos a través de escáneres o lectores ópticos que captan

imágenes representadas a partir de combinaciones de líneas y espacios paralelos de

distinto grosor y espaciado que contienen una determinada información.

Tipología actual

Lineales de una dimensión

Bidimensionales

QR

PDF-417, variante del código de barras de dos dimensiones

Page 15: Digitalizacion y captura documental

Tecnologías de captura inteligenteCódigos de barras

Page 16: Digitalizacion y captura documental

Tecnologías de captura inteligenteCódigos de barras

Page 17: Digitalizacion y captura documental

Tecnologías de captura inteligenteCódigos de barras

Códigos QR

PDF – 417

Page 18: Digitalizacion y captura documental

Tecnologías de captura inteligenteCódigos de barras

Page 19: Digitalizacion y captura documental

Tecnologías de captura inteligenteCaptura semántica y data mining Su utilización requiere que previamente sea definido un modelo documental en el sistema para compararlo con los documentos del mismo tipo que sean subidos posteriormente al sistema. Criterios de color, brillo y saturación de los documentos (apariencia física) cxon tecnologías como histograma y redes neuronales para que el sistema identifique patrones de color o características físicas de los documentos. Para que resulte efectiva el sistema deberá incluir desde el momento de la digitalización mecanismos de mejora y corrección de imagen como rotación; binarización; umbral dinámico; recorte de bordes; inversión; y suavización de ruido. Expresiones características de un tipo documental: criterio para clasificar documentos que se apoya especialmente en la tecnología OCR. Análisis del texto de los documentos mediante técnicas de data mining como árboles de decisión, Support Vector Machines, algoritmos Bayesianos o técnicas de “el vecino más cercano”, etc., para definir esquemas de clasificación de documentos según las palabras que aparecen en ellos.

Page 20: Digitalizacion y captura documental

PROYECTOS DE CAPTURA DOCUMENTAL

Page 21: Digitalizacion y captura documental

Proyectos de captura de documentos Análisis previo de la documentación a tratar y de su contexto: establecer la metodología más adecuada de captura. Planificación: fase clave de la que dependerá el resto de fases del proyecto. Se irá adaptando a las necesidades del proyecto.

Identificar y analizar las necesidades de la organización respecto a su documentación.

Conocer procesos que actualmente utiliza la organización para gestionar la documentación.

Identificar y definir en detalle los tipos documentales. Determinar metas y objetivos que se pretenden conseguir y los medios para

conseguirlos. Viabilidad: análisis de la viabilidad de los objetivos y metas perseguidos y los planes de actuación respecto a los medios (económicos, técnicos y humanos…) con los que cuenta la organización. La organización decidirá si realiza el proyecto con personal y medios propios o mediante outsourcing.

Page 22: Digitalizacion y captura documental

Proyectos de captura de documentos Diseño: representación de forma diagramada los distintos procesos que se van a llevar a cabo a lo largo de la ejecución del sistema de captura masiva.

Procesos: recepción de la documentación, manipulación, expurgo, digitalización, captura de datos, integración en el Sistema de Gestión Documental, volcado de la información, copias de seguridad y control de calidad en los distintos procesos.

Fase muy productiva: el momento de diseñar los procesos es el idóneo para optimizar y rediseñar algunos de los procesos previos ya existentes en relación al manejo de la documentación.

Fase previa de pruebas: Previo a la puesta en marcha de un proyecto, se pone en práctica el mismo en modo de pruebas para comprobar que realmente funciona como habíamos proyectado. Se probaran en lo posible todas las fases y procesos previstos en el diseño desde la recepción de la documentación hasta su posterior consulta digital a través de la plataforma informática. La duración de esta fase será proporcional a la magnitud del proyecto.

Page 23: Digitalizacion y captura documental

¡GRACIAS POR VUESTRA ATENCIÓN!

http://twitter.com/amaciasalegre

http://es.linkedin.com/in/adrianmaciasalegre

[email protected]

http://www.dokumentalistas.com

http://www.adrianmacias.es

http://www.slideshare.net/adrianmacias/

Seguridad en Gestión Documental: Datos personales e ISO 27001 15 de Julio de 2014 – 17 a 18 horas

http://www.tecnowebinars.com/webinar/920/seguridad-en-gestion-documental-datos-personales-e-iso-27001/dokumentalistas

PRÓXIMO WEBINAR