Oracle Document Capture 10gR3 OCR. An Oracle White Paper Mayo 2009



Documentos relacionados
Lidiando con el contenido no estructurado. An Oracle White Paper Junio 2009

Productos Oracle para gobierno de SOA. Oracle White Paper Mayo 2009

Oracle Data Integrator. An Oracle Technical White Paper Febrero 2009

Introducción a la Administración de Roles. Un Oracle White Paper Septiembre 2008

Oracle On Demand Infrastructure: Virtualización con Oracle VM. An Oracle White Paper Junio 2009

Phone Manager Compatibilidad con aplicaciones JANUARY 2015 DOCUMENT RELEASE 4.2 COMPATIBILIDAD CON APLICACIONES

Phone Manager Compatibilidad con aplicaciones JANUARY 2015 DOCUMENT RELEASE 4.2 COMPATIBILIDAD CON APLICACIONES

Phone Manager Compatibilidad con aplicaciones OCTOBER 2014 DOCUMENT RELEASE 4.1 COMPATIBILIDAD CON APLICACIONES

Oracle Data Integrator

Light Account Siguientes pasos FAQ

Phone Manager Compatibilidad con aplicaciones JANUARY 2015 DOCUMENT RELEASE 4.2 COMPATIBILIDAD CON APLICACIONES

Mejores Prácticas SOA, Estandares y Gobernabilidad An Oracle White Paper Feb 2009

Phone Manager Compatibilidad con aplicaciones JANUARY 2015 DOCUMENT RELEASE 4.2 COMPATIBILIDAD CON APLICACIONES

Phone Manager Compatibilidad con aplicaciones OCTOBER 2014 DOCUMENT RELEASE 4.1 COMPATIBILIDAD CON APLICACIONES

XV ENCUENTRO INGENIERO&JOVEN 2017 Salidas profesionales en Auge Movilidad: Sostenibilidad e Innovación

EMC Documentum Archive Services for SharePoint

SAP SuccessFactors: Extensiones HCP Learning Service Report: FUNDAE (Fundación Tripartita)

1. European Compatible AC indoor units / Unidades de Aire Acondicionado europeas compatibles:

La coexistencia de aerogeneradores nuevos y con vida extendida en el mismo parque

Autodesk. SketchBook INK. Consejos y Trucos. Android

SAP Banking Forum Millennials live. Buenos Aires, Agosto 2014

Phone Manager Compatibilidad con aplicaciones OCTOBER 2014 DOCUMENT RELEASE 4.1 COMPATIBILIDAD CON APLICACIONES

Liberación de Notas de Crédito.

Creación y Actualización de Descuentos.

Phone Manager Mobile Guía rápida de referencia ABRIL 2016 DOCUMENT RELEASE 4.3 GUÍA RÁPIDA DE REFERENCIA

Procesamiento de nóminas en ADP Time & Attendance

Financiamiento sostenible de proyectos energéticos renovables

Phone Manager Compatibilidad con aplicaciones OCTOBER 2014 DOCUMENT RELEASE 4.1 COMPATIBILIDAD CON APLICACIONES

COMALCA Gourmet apuesta por sus clientes con SAP Business One

Cursos técnicos gratuitos en línea

Phone Manager Compatibilidad con aplicaciones OCTOBER 2014 DOCUMENT RELEASE 4.1 COMPATIBILIDAD CON APLICACIONES

Determinación de material.

Rational Developer for System z Unit Test. Sergio González Consultor Calidad Ingeniería del Software

Phone Manager Compatibilidad con aplicaciones OCTOBER 2014 DOCUMENT RELEASE 4.1 COMPATIBILIDAD CON APLICACIONES

Application Note. GeForce 9400M G Memory Compatibility List. March 19, 2009 DA _v01

Un White Paper de Epicor. Los Paros de Producción No Son Iguales

Servicio de Reclamos Amadeus Guía Rápida

Hoja de trabajo de configuración de EMC VNXe

Creación de ofertas(cotizaciones).

La cadena de suministro: consolidación o incremento del tamaño.

Sharp OSA Network Scanner Tool

Guía de instalación de LifeSize SDI Adapter

Mercado de aerogeneradores: Evolución del mercado futuro

Es tiempo de Mover la Seguridad del Correo a la Nube?

Consideraciones sobre la alimentación. Guía de instalación y operación Número de referencia Rev. 02. EMC Gabinetes VNXe3300 de CC

Amazon WorkSpaces Application Manager. Guía del usuario

Pantalla principal NOTA

Cartas de Cobro. Soluciones de Cobranza

Protegiendo la información gubernamental: Retos y recomendaciones

Aquapura: Más oportunidades de crecer con SAP Business One

Phone Manager Guía rápida de referencia ABRIL 2016 EDICIÓN 4.3 DEL DOCUMENTO GUÍA RÁPIDA DE REFERENCIA

Impacto de los Cambios Normativos Ambientales en Colombia sobre el Sector de Gas y Petróleo. ENERGIA COLOMBIA 2018 Bogotá, octubre 23

Mitos Desenmascarados de la Prevención de Perdida de Información

Phone Manager Compatibilidad con aplicaciones OCTOBER 2014 DOCUMENT RELEASE 4.1 COMPATIBILIDAD CON APLICACIONES

Jornadas Técnicas de la AEE

DYCSI: Optimiza su proceso de evaluación de desempeño con SAP SuccessFactors y PeopleNext

La Era Cognitiva. 5as. Jornadas Binacionales de Informática y Comunicaciones (JOBIC 2016) Marcel Kuza

Granjas Kaki: Consolidando el control con SAP

Cómo proteger su organización con una estrategia de Administración de Dispositivos Móviles? Rodrigo Calvo,CISSP, ITIL v3, SNIA

Microsoft Virtualization para profesionales de Vmware

El empleo en la energía eólica

LinkedIn 201. Alejandra Hamelink Partner & SME Marketing Manager LAC Marzo, 2016

Berto. y sus buenos amigos. Chris Stolz

Administración de Laboratorio de prácticas

Mejore su proceso de administración de viajes y reservas en línea con SAP Cloud for Travel & Expense y GetThere Francisco Del Valle Marzo 12, 2014

Edwin Garzón Microsoft

20 de Marzo Jaume Riera Javier Morillo. it.cpg Sales. Gestión de condiciones fuera factura

Los retos de seguridad en el ciclo de vida de la información en la Administración Pública Federal: Clasificación, acceso y retención

EMC SourceOne TM para Microsoft SharePoint 7.0 Búsqueda de archivo Tarjeta de referencia rápida

O ra c le H o s p ita lity R E S 3700 Guía de configuración para Micros RES FIP de Honduras Release or higher. July 2016

Richter de México: Mejora 20% su control de inventarios con SAP Business One

El Servidor Web Conceptos Avanzados

Solución en SAP Estatus al 17-Nov-2016 Hugo Rodríguez Localization Product Manager Mexico

Propuesta de posiciones.

Phone Manager Compatibilidad con aplicaciones OCTOBER 2014 DOCUMENT RELEASE 4.1 COMPATIBILIDAD CON APLICACIONES

Traspaso de material de devolución.

Fondo y pantalla inactiva. Guía del administrador

Eliminando Fronteras: Aumente su Productividad con Soluciones de Movilidad de Symantec Gabriel Celis

Solución :: Éxito :: Perfección

Evento SOCINFO - Madrid 19 Octubre Modelos de Cooperación Proveedores TIC - AAPP. Jordi Aracil Director Sector Público SAP España

Términos sobre el Uso de la Data Data Use Terms

Cursos técnicos gratuitos en línea

Servicios Public Cloud PaaS e IaaS Oracle D O C U M E N T A C I Ó N D E P I L A R J U L I O D E

Servicios Public Cloud SaaS Oracle D O C U M E N T A C I Ó N D E P I L A R J U L I O D E

Peru: Nuevos Desafíos

Términos sobre el Uso de la Data Data Use Terms

Términos sobre el Uso de la Data Data Use Terms

DDR3 Unbuffered DIMMs Evaluated with AMD Phenom II X6 Processors

Janesville Acoustics México: Más integrada y versátil con SAP

Términos sobre el Uso de la Data Data Use Terms

Términos sobre el Uso de la Data Data Use Terms

Administración de horarios en ADP Time & Attendance

ihacklabs PROGRAMA DE RESELLERS TALENTO Y CAPACITACIÓN RED / BLUE TEAM CYBERSEGURIDAD NACIONAL CYBERSEGURIDAD INDUSTRIAL

Microcat Authorisation Server (MAS ) Guía del Usuario

Terminal Portátil Dolphin TM Guía de inicio rápido

Serie CM: Módulo de escaneo 2D

Términos sobre el Uso de la Data Data Use Terms

NOTAS DE LANZAMIENTO SOFTWARE TRIMBLE ACCESS

Reunión ASUG Ajuste por inflación en Argentina Factura electrónica WEB SERVICE: Notas de crédito y débito por diferencia de cambio (RG2385 y 2904)

Transcripción:

Oracle Document Capture 10gR3 OCR An Oracle White Paper Mayo 2009

Oracle Document Capture 10GR3 OCR Ken Peterka: Para versiones previas a 10.1.3.5, el uso de la capacidad full text OCR requería licencias adicionales de terceros. La mayoría de clientes utilizan full-text OCR en la forma de Searchable PDF (imagen más texto oculto) Oracle Document Capture utiliza el Nuance OCR engine para sus procesos de reconocimiento de caracteres Se tiene que tomar en cuenta cuales son los lenguajes soportados por el componente OCR. En el siguiente url se podrán encontrar una lista con las últimas actualizaciones: http://ias.us.oracle.com/pls/portal/url/item/ 55FC7C908A151315E044080020E8C187 INTRODUCCIÓN Este documento presenta un resumen de las opciones actuales y futuras con las que cuenta Document Capture para el reconocimiento óptico de caracteres más conocido como OCR. QUE ES OCR? El software de reconocimiento óptico de caracteres, abreviado habitualmente como OCR (Optical character recognition), extrae de una imagen los caracteres que componen un texto para almacenarlos en un formato con el cual puedan interactuar programas de edición de texto o búsqueda, por ejemplo arhivos PDF o TXT. Mientras que en una imagen los caracteres se describen indicando cada uno de los píxeles que los forman, al convertirlos a un formato de texto (por ejemplo ASCII o Unicode), pasan a estar descritos por un solo número, por lo que se produce una reducción significativa del espacio en memoria que ocupan. A partir de ahí el texto es reconocido como texto, de modo que se pueden buscar en él cadenas de caracteres, exportar el texto a un editor de textos, o a otras aplicaciones, etc. Actualmente, junto con el texto, se registra también el formato con el que ha sido escrito. DOCUMENT CAPTURE Y OCR Una parte integral de la captura de documentos son los campos índices. Los usuarios ingresan valores en estos campos de indexación, y los usuarios más tarde podrán buscar los documentos usando estos campos. Sin embargo, los valores de indexación también podrían ser automáticamente ingresados, mediante la tecnología OCR. El proceso manual por supuesto es muy costoso, tanto por el requerimiento de personal especializado como también por el tiempo requerido para el ingreso individual de los valores de indexación por cada documento. Oracle Database 11g - Comparación con Bases de Datos Open Source Page 2

Las opciones de reconocimiento óptico de caracteres proporcionadas con Oracle Document Capture, son las siguientes: 1. Zonal 2. Full-Text 3. Barcodes 4. Handwriting* 5. Invoice details* * Las 2 últimas opciones requieren software adicional de terceros, como por ejemplo Datacaps Paper Keyboard para reconocimiento handwriting RECONOCIMIENTO ZONAL Se puede configurar la indexación para capturar texto desde una zona especifica del documento y automáticamente ingresarla en un campo índice seleccionado. Las imágenes luego podrán ser buscadas usando dichos valores. La figura anterior muestra como quedan elegidas las zonas de lectura. Oracle Database 11g - Comparación con Bases de Datos Open Source Page 3

FULL-TEXT OCR Muchos clientes sin embargo, requieren y utilizan frecuentemente la capacidad full-text OCR, opción que permite extraer todos los caracteres de las imágenes permitiendo realizar búsquedas por su contenido. Document Capture hasta la versión 10.1.3.4.0, requería de licencias adicionales de terceros para realizar full-text OCR. Se espera que en el siguiente release 10.1.3.5.0, esta caracterisitica sea parte del producto. BARCODES RECOGNITION El reconocimiento de código de barras permite también automatizar la indexación de documentos mediante la lectura e interpretación de los códigos de barras, los cuales son fácilmente asociados a campos de indexación. Para poder realizar este proceso, se requiere de un componente opcional del Document Capture: el Recognition Server. Este servidor ya esta incluido en las licencias de Document Capture. INVOICE DETAILS Oracle Document Capture no es un producto de procesamiento de formularios. Esta es la razón por la que tenemos un nuevo producto en nuestro roadmap llamado "Oracle Forms Recognition" (OFR), la cual será un OEM de un producto llamado "Oracle Forms Recognition" (OFR). Este producto se planea liberar este fiscal year. OFR tambien soportará handprint y marksense, pero handwriting no será soportado. ODC sera un prerequisite para OFR. Los Clientes utilizarán ODC para escanear los documentos que serán enviados a OFR para procesar. Por otro lado, si bien se pueden definir zonas OCR dentro de un template, las zonas son fijas y no pueden ajustarse debido a variaciones dentro de la imagen. Esto podría trabajar bién para un único formulario de una página que requiere que los usuarios lo verifiquen. Para procesos automatizados, OFR sería requerido. OPCIONES DE LIMPIEZA DE IMAGENES Document capture cuenta con opciones de procesamiento de imágenes que pueden ser seleccionadas para configurar filtros de procesamiento y aplicarlas a las imágenes durante el escaneo, lo cual permitiría un proceso OCR más preciso. Se podría por ejemplo setear una detección de código de barra, desde recortar la imagen hasta hacerla más pequeña, también corregir, enderezar imágenes y remover brillo y color de ser necesario. RESUMEN Oracle Document Capture permite entonces, realizar reconocimiento óptico de caracteres, permitiendo asi acelerar el proceso de indexación y carga de documentos hacia servidores de contenido como IPM o UCM. Cada documento dentro de estos repositorios se espera pueda ser encontrado ya sea por la metadata de los campos índices ingresados, ó por algún texto que es parte del contenido de las imágenes, esto es una funcionalidad básica esperada en todo servidor de contenido. Oracle Database 11g - Comparación con Bases de Datos Open Source Page 4

Habría que tomar en cuenta sin embargo que la exactitud del reconocimiento óptico de caracteres dependerá de la imagen origen. Existen muchas variables que pueden cambiar la exactitud del componente OCR: Font type y size, calidad de la imagen escaneada, etc. No se puede garantizar siquiera una exactitud del 95% con la solución OCR que viene con Document Capture, sin embargo para la mayoría de casos y requerimientos satisface las necesidades de digitalización e indexación automática. Oracle Database 11g - Comparación con Bases de Datos Open Source Page 5

Oracle Document Capture 10gR3 Opciones OCR May 2009 Autor:Luis Serrano Oracle Corporation World Headquarters 500 Oracle Parkway Redwood Shores, CA 94065 U.S.A. Worldwide Inquiries: Phone: +1.650.506.7000 Fax: +1.650.506.7200 oracle.com Copyright 2008, Oracle Corporation and/or its affiliates. All rights reserved. This document is provided for information purposes only and the contents hereof are subject to change without notice. This document is not warranted to be error-free, nor subject to any other warranties or conditions, whether expressed orally or implied in law, including implied warranties and conditions of merchantability or fitness for a particular purpose. We specifically disclaim any liability with respect to this document and no contractual obligations are formed either directly or indirectly by this document. This document may not be reproduced or transmitted in any form or by any means, electronic or mechanical, for any purpose, without our prior written permission. Oracle is a registered trademark of Oracle Corporation and/or its affiliates. Other names may be trademarks of their respective owners.