digitalizacion y captura documental
DESCRIPTION
Presentación elaborada para mi intervención en el Webinar de Digitalización y Captura de documentos en gestión documental del próximo 1 de julio de 2014 con Tecnowebinars.TRANSCRIPT
Digitalización y Captura documental1 de julio de 2014
Digitalización vs Captura documental
Definiciones previas Digitalización: Acto o acción de digitalizar documentos mediante el uso de escáneres u
otro tipo de hardware.
Captura documental: Incluye la digitalización de documentos e implica procesos
inteligentes de extracción de metadatos y de clasificación de documentos en el sistema.
Digitalizar documentos no va más allá en la práctica que el hecho de subirlos a un sistema de almacenamiento y dejarlos ahí sin que ello implique por defecto una organización inteligente que facilite su posterior localización.
Conversión de la documentación en papel a su equivalente en registros digitales (oficina
sin papeles).
Ahorro de costes de almacenamiento físico.
Ofrece garantías de preservación a largo plazo por medios digitales.
Accesibilidad universal a la documentación corporativa sin depender de
plataformas tecnológicas (ordenador, smartphone, tablets, etc).
Digitalización vs Captura documental
Aspectos comunes
Digitalización: Almacenamiento de documentos escaneados en una base de datos.
Procesos corporativos de gestión documental: Requiere que la Digitalización vaya
acompañada de acciones que permitan la localización posterior de los documentos en
el sistema y la recuperación de la información que contienen para ser empleada como
base en el desarrollo de otras ideas de negocio y en la resolución de proyectos de la
empresa.
Digitalización vs Captura documental
Digitalización vs Gestión documental
Digitalización vs Captura documental
Integración Digitalización y Gestión documentalUnir la digitalización a un sistema de gestión documental inteligente que abarque la
creación de registros digitales a partir de la documentación original en papel, y
posteriormente permita establecer rutinas de autoclasificación de documentos y de
extracción de metadatos . Con el objetivo de garantizar la máxima accesibilidad a la
documentación en cualquier momento del futuro.
La integración anteriormente descrita se identificaría más propiamente con el término
CAPTURA DOCUMENTAL, la cual es la primera de las fases del CICLO DE VIDA DE LOS
DOCUMENTOS, que constituye la base de la evolución actual de la gestión documental
corporativa, denominada GESTIÓN DE CONTENIDOS EMPRESARIALES (ECM).
Ciclo de vida de los documentos
Digitalización vs Captura documentalCaptura inteligente de documentos Autoclasificación de documentos
Extracción automática de metadatos
Hot Folder: Conectar el sistema con una carpeta local y esta con el escáner. Cada vez
que el escáner incluya un documento en esta carpeta, el sistema tendrá la capacidad de
procesarlo sin necesidad de intervención humana.
Escanear los documentos en forma de lotes y dejar que el sistema los separe
individualmente por diversos métodos.
Un conjunto de tecnologías que permiten a un sistema de gestión documental automatizar los procesos de clasificación y extracción de metadatos de documentos subidos al sistema mediante digitalización.
TECNOLOGÍAS EN CAPTURA INTELIGENTE DE DOCUMENTOS
Mecanismo de inteligencia en captura documental Definición previa de modelo documental: Previamente a la captura masiva de
documentos, un operario humano digitalizará un tipo documental, el cual empleará para
informar al sistema de las características físicas y las expresiones específicas de dicho tipo
documental. A partir de la creación del tipo documental, el sistema actuará de forma
automatizada en lo que se refiere a la clasificación documental y la extracción de
metadatos.
Tecnologías de captura inteligente
Captura inteligente de documentos Tecnologías semánticas.
Tecnologías de reconocimiento óptico de caracteres (OCR) y similares.
Tecnologías de autodetección (códigos de barras).
Tecnologías de captura inteligente
Tecnologías de captura inteligenteReconocimiento óptico de caracteres (OCR) Convertir un documento-imagen digitalizado en un documento-texto.
Autoclasificación documental: Identificación de tipos documentales que se incluyen en
el sistema mediante comparativa de “expresiones regulares” que contienen.
Extracción de metadatos: Extracción de información útil de los documentos una vez
son digitalizados que puede ser procesada informáticamente.
Tecnologías de captura inteligenteTecnologías complementarias a OCR ICR: tecnología con la que los escáneres y sistemas de imágenes pueden convertir
caracteres en letra manuscrita en caracteres capaces de ser interpretados o reconocidos
por un ordenador.
Tecnologías de captura inteligenteTecnologías complementarias a OCR OMR: reconocimiento de marcas ópticas como las que se emplean en un cuestionario
de respuesta múltiple. Procesamiento del tipo documental de las encuestas. Para aplicar
esta tecnología se emplea un tipo de escáner que tiene capacidad para reconocer la
existencia o no de una marca óptica, mientras que no procesa ni la letra manuscrita ni las
imágenes de los formularios.
Tecnologías de captura inteligenteCódigos de barras Forma de captura de datos a través de escáneres o lectores ópticos que captan
imágenes representadas a partir de combinaciones de líneas y espacios paralelos de
distinto grosor y espaciado que contienen una determinada información.
Tipología actual
Lineales de una dimensión
Bidimensionales
QR
PDF-417, variante del código de barras de dos dimensiones
Tecnologías de captura inteligenteCódigos de barras
Tecnologías de captura inteligenteCódigos de barras
Tecnologías de captura inteligenteCódigos de barras
Códigos QR
PDF – 417
Tecnologías de captura inteligenteCódigos de barras
Tecnologías de captura inteligenteCaptura semántica y data mining Su utilización requiere que previamente sea definido un modelo documental en el sistema para compararlo con los documentos del mismo tipo que sean subidos posteriormente al sistema. Criterios de color, brillo y saturación de los documentos (apariencia física) cxon tecnologías como histograma y redes neuronales para que el sistema identifique patrones de color o características físicas de los documentos. Para que resulte efectiva el sistema deberá incluir desde el momento de la digitalización mecanismos de mejora y corrección de imagen como rotación; binarización; umbral dinámico; recorte de bordes; inversión; y suavización de ruido. Expresiones características de un tipo documental: criterio para clasificar documentos que se apoya especialmente en la tecnología OCR. Análisis del texto de los documentos mediante técnicas de data mining como árboles de decisión, Support Vector Machines, algoritmos Bayesianos o técnicas de “el vecino más cercano”, etc., para definir esquemas de clasificación de documentos según las palabras que aparecen en ellos.
PROYECTOS DE CAPTURA DOCUMENTAL
Proyectos de captura de documentos Análisis previo de la documentación a tratar y de su contexto: establecer la metodología más adecuada de captura. Planificación: fase clave de la que dependerá el resto de fases del proyecto. Se irá adaptando a las necesidades del proyecto.
Identificar y analizar las necesidades de la organización respecto a su documentación.
Conocer procesos que actualmente utiliza la organización para gestionar la documentación.
Identificar y definir en detalle los tipos documentales. Determinar metas y objetivos que se pretenden conseguir y los medios para
conseguirlos. Viabilidad: análisis de la viabilidad de los objetivos y metas perseguidos y los planes de actuación respecto a los medios (económicos, técnicos y humanos…) con los que cuenta la organización. La organización decidirá si realiza el proyecto con personal y medios propios o mediante outsourcing.
Proyectos de captura de documentos Diseño: representación de forma diagramada los distintos procesos que se van a llevar a cabo a lo largo de la ejecución del sistema de captura masiva.
Procesos: recepción de la documentación, manipulación, expurgo, digitalización, captura de datos, integración en el Sistema de Gestión Documental, volcado de la información, copias de seguridad y control de calidad en los distintos procesos.
Fase muy productiva: el momento de diseñar los procesos es el idóneo para optimizar y rediseñar algunos de los procesos previos ya existentes en relación al manejo de la documentación.
Fase previa de pruebas: Previo a la puesta en marcha de un proyecto, se pone en práctica el mismo en modo de pruebas para comprobar que realmente funciona como habíamos proyectado. Se probaran en lo posible todas las fases y procesos previstos en el diseño desde la recepción de la documentación hasta su posterior consulta digital a través de la plataforma informática. La duración de esta fase será proporcional a la magnitud del proyecto.
¡GRACIAS POR VUESTRA ATENCIÓN!
http://twitter.com/amaciasalegre
http://es.linkedin.com/in/adrianmaciasalegre
http://www.dokumentalistas.com
http://www.adrianmacias.es
http://www.slideshare.net/adrianmacias/
Seguridad en Gestión Documental: Datos personales e ISO 27001 15 de Julio de 2014 – 17 a 18 horas
http://www.tecnowebinars.com/webinar/920/seguridad-en-gestion-documental-datos-personales-e-iso-27001/dokumentalistas
PRÓXIMO WEBINAR