- Información general
- Contratos de procesamiento de documentos
- Notas relacionadas
- Acerca de los contratos de procesamiento de documento
- Clase Cuadro
- Interfaz IPersistedActivity
- Clase PrettyBoxConverter
- Interfaz IClassifierActivity
- Interfaz IClasificadorProveedorDeCapacidades
- Clase ClassifierDocumentType
- Clase ClassifierResult
- ClassifierCodeActivity Class
- ClassifierNativeActivity Class
- ClassifierAsyncCodeActivity Class
- Clase ClasificadorCapacidadDeTipoDeDocumento
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- Clase
- Clase
- Clase ExtractorDocumentType
- Clase ExtractorDocumentTypeCapabilities
- Clase ExtractorFieldCapability
- Clase
- Clase ExtractorResult
- FieldValue Class
- FieldValueResult Class
- Interfaz ICapabilitiesProvider
- Interfaz IExtractorActivity
- Clase ExtractorPayload
- Enumeración DocumentActionPriority
- Clase DocumentActionData
- Enumeración DocumentActionStatus
- DocumentActionType Enum
- Clase DocumentClassificationActionData
- Clase DocumentValidationActionData
- Clase UserData
- Clase Documento
- Clase DocumentoDividirResultado
- Clase DomExtensions
- Clase Página
- Clase SecciónDePágina
- Clase de polígono
- Clase PolygonConverter
- Clase de metadatos
- Clase GrupoDeWord
- Clase Word
- Enum FuenteDeProcesamiento
- Clase ResultadosTablaCelda
- Clase ResultadosTablaValor
- Clase ResultadosTablaColumnaInfo
- Clase TablaDeResultados
- Enum Rotación
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- Enum TipoDeSección
- Enum TipoDeGrupoDeWord
- Interfaz IDocumentTextProjection
- Clase ResultadoDeClasificación
- Clase ResultadoDeExtracción
- Clase ResultadosDeDocumento
- Clase ResultadosDeLímitesDeDocumento
- Clase ResultadosDePuntoDeDatos
- Clase ResultadosDeValor
- Clase ResultadosDeContenidoDeReferencia
- Clase ResultadosDeValorDeTokens
- Clase ResultadosDeCampoDerivado
- Enum ResultadosDeFuenteDeDatos
- Clase ResultadoDeConstantes
- Clase ValorDeCampoSimple
- Clase ValorDeCampoDeTabla
- Clase GrupoDeDocumento
- Clase TaxonomíaDeDocumento
- Clase TipoDeDocumento
- Clase Campo
- Enum TipoDeCampo
- FieldValueDetails Class
- Clase InformaciónDeLenguaje
- Clase MetadataEntry
- Enumeración de tipo de texto
- Clase TipoDeCampo
- Interfaz de actividad de ITracking
- Interfaz de ITrainableActivity
- Interfaz ITrainableClassifierActivity
- Interfaz ITrainableExtractorActivity
- Clase TrainableClassifierAsyncCodeActivity
- Clase TrainableClassifierCodeActivity
- Clase TrainableClassifierNativeActivity
- Clase TrainableExtractorAsyncCodeActivity
- Clase TrainableExtractorCodeActivity
- Clase TrainableExtractorNativeActivity
- Clase BasicDataPoint: vista previa
- Clase ExtractionResultHandler: vista previa
- Document Understanding ML
- Servidor local de OCR de Document Understanding
- Document Understanding
- Notas relacionadas
- Acerca del paquete de actividades Document Understanding
- Compatibilidad de proyectos
- Configurar la conexión externa
- Establecer contraseña de PDF
- Fusionar PDF
- Obtener el recuento de páginas del PDF
- Extraer texto en PDF
- Extraer imágenes en PDF
- Extraer rango de página en PDF
- Extraer datos del documento
- Cree una tarea de validación y espere
- Esperar la tarea de validación y continuar
- Crear tarea de validación
- Clasificar documento
- Crear tarea de validación de clasificación
- Crear tarea de validación de clasificación y esperar
- Esperar la tarea de validación de clasificación y reanudar
- OCRInteligente
- Notas relacionadas
- Acerca del paquete de actividades IntelligentOCR
- Compatibilidad de proyectos
- Cargar taxonomía
- Digitalizar documento
- Clasificar ámbito de documento
- Clasificador basado en palabras clave
- Clasificador de proyectos de Document Understanding
- Clasificador inteligente de palabra clave
- Crear acción de clasificación de documentos
- Crear artefactos de validación de documentos
- Recuperar artefactos de validación de documentos
- Esperar la acción de clasificación de documentos y reanudar
- Entrenar el alcance de los clasificadores
- Entrenador del clasificador basado en palabras clave
- Entrenador del clasificador inteligente de palabra clave
- Alcance de la extracción de información
- Extractor de proyectos de Document Understanding
- Entrenador del extractor de proyectos de Document Understanding
- Extractor basado en regex
- Extractor de forma
- Extractor inteligente de formularios
- Redactar documento
- Crear acción de validación de documentos
- Esperar la acción de validación de documentos y reanudar
- Entrenar el alcance de los Extractores
- Exportar resultados de extracción
- Extractor con aprendizaje automático
- Entrenador de extractor con aprendizaje automático
- Clasificador de aprendizaje automático
- Entrenador del clasificador de aprendizaje automático
- Clasificador generativo
- Extractor generativo
- Configurar autenticación
- Validar documentos con acciones de la aplicación
- Validación manual para digitalizar documentos
- Extracción de datos basada en anclajes utilizando el extractor inteligente de formularios
- Estación de validación
- Actividades generativas: buenas prácticas
- Extractor generativo: buenas prácticas
- Clasificador generativo: buenas prácticas
- Servicios ML
- OCR
- Contratos OCR
- Notas relacionadas
- Acerca de los contratos OCR
- Compatibilidad de proyectos
- IOCRActivity Interface
- OCRAsyncCodeActivity Class
- OCRCodeActivity Class
- OCRNativeActivity Class
- Clase Carácter
- Clase OCRResult
- Clase Word
- FontStyles Enum
- OCRRotation Enum
- Clase OCRCapabilities
- OCRScrapeBase Class
- OCRScrapeFactory Class
- ScrapeControlBase Class
- Enum ScrapeEngineUsages
- ExtraerBaseDelEctor
- Clase ScrapeEngineFactory
- Clase ExtraerEngineProvider
- OmniPage
- PDF
- [No en la lista] Abbyy
- [No en la lista] Abbyy incrustado

Actividades de Document Understanding
OmniPage OCR
UiPath.OmniPage.Activities
Handwriting recognition works only for hand-printed text, where the characters don’t have a connection. The ideal size for a document is between 25 and 45 pixels.
Descripción
Extracts a string and its information from an indicated UI element or image using OmniPage OCR Engine. The OmniPage OCR is an alternative to the other OCR engines, in all activities that require OCR engine implementations. Here are a few examples of activities that can be used together with the OmniPage OCR:Click OCR Text, Hover OCR Text, Double Click OCR Text, Get OCR Text, Find OCR Text Position, Digitize Document, CV Screen Scope, CV Get Text.
The UiPath.OmniPage.Activities package, v1.9.0 or higher, has been upgraded to .NET5 core. This change implies having the .NET5 framework installed on your machine if the package is run within a non-Windows legacy workflow.
The OmniPage OCR activity is compatible with the UiPath.IntelligentOCR.Activities package, v2.0.0 or higher and can be used in any OCR context.
Compatibilidad de proyectos
Windows-Legacy | Windows
Configuración
Panel de propiedades
Común
- Nombre para mostrar: el nombre para mostrar de la actividad.
Entrada
- Imagen: la imagen que desea procesar. Este campo solo admite variables
Image.
Otros
- Privado : si se selecciona, los valores de variables y argumentos ya no se registran en el nivel Detallado.
Opciones
-
EnginePack - Specifies which embedded engine must be used for image processing. There are two options, as follows: Basic - Supports a wide range of languages, Extended - Contains extra support for Asian, Arabic, Thai, Hebrew and Vietnamese languages. Check the list of all available languages for the Basic pack at the end of this page.
Nota:In order to use the Extended engine, you must manually install the UiPath.OmniPage.Bundle.Extended package in the current project from the Package Manager.
-
ExtractWords - If selected, extracts the on-screen position of all detected words.
-
Language - The language used by the OCR engine. The default option is auto, meaning that the language is automatically detected. Multiple languages can be used separated by commas.
Nota:Puedes usar la configuración para varios idiomas al mismo tiempo. Por ejemplo, puedes configurar "eng, fra" para procesar imágenes que contengan contenido tanto en inglés como en francés.
Ten en cuenta que la configuración de los idiomas japonés, coreano y chino activa un motor de reconocimiento dedicado. Solo se debe seleccionar uno de estos idiomas a la vez y no combinarlo con ningún idioma no asiático.
Los textos insertados cortos en inglés pueden reconocerse sin seleccionar el inglés como idioma de reconocimiento.
-
Profile - Choose a pre-processing profile for the specified image or UI element to achieve a better OCR read. The following options are available:
- None - does not apply a pre-processing profile, this is the default option;
- Screen - pre-processing suitable for remote desktop applications;
- Scan - pre-processing suitable for scanned files;
- Legacy - uses the engine's default settings for pre-processing images.
-
Escala: el factor de escalado del elemento o imagen de la IU escogido. Cuanto mayor sea el número, más se ampliará la imagen. Esto puede facilitar una mejor lectura OCR y es lo recomendado para imágenes pequeñas. Si quieres reducir la escala, también se aceptan valores entre 0 y 1. De forma predeterminada, el valor es 1.
Nota:If you want to use this OCR activity from package UiPath.OmniPage.Activities v1.8.0 in Studio v19.10, install the UiPath.CoreIPC package, version 2.0.1 or higher.
Importante:Las imágenes de gran tamaño pueden dar lugar a un error cuando el factor de escala es superior a 1.
Salida
- Result - The text extracted by the OCR engine along with their on-screen position, stored in a
KeyValuePair<Rectangle,String>. This field supports onlyKeyValuePair<Rectangle,String>. - Text - The text extracted by the OCR engine, stored in a String variable. This field supports only
Stringvariables.
Idiomas admitidos
La siguiente tabla muestra una lista de todos los idiomas compatibles con OmniPage OCR, así como sus códigos de idioma correspondientes.
Table 1. Supported languages and language codes for OmniPage OCR - Basic Pack Languages
| Código de idioma | |
|---|---|
| Afrikáans | AFR |
| Albanés | SQI |
| Aymara | AYM |
| Vasco | EUS |
| Bemba | BEM |
| Pienegro | BLA |
| Brasileño | QBP |
| Bretón | BRE |
| Bugotu | BGT |
| Búlgaro | BUL |
| Bielorruso | BEL |
| Catalán | CAT |
| Chamorro | CHA |
| Checheno | CHE |
| Corso | COS |
| Croata | HRV |
| Crow | CRO |
| Checo | CES |
| Danés | DAN |
| Holandés | NLD |
| English | ENG |
| Esquimal (inuit) | QES |
| Esperanto | EPO |
| Estonio | EST |
| Islas Feroe | FAO |
| Fiyiano | FIJ |
| Finlandés | FIN |
| Francés | FRA |
| Frisón | FRY |
| Friulano | FUR |
| Gaélico (irlandés) | GLE |
| Gaélico (escocés) | GLA |
| Gallego | GLG |
| Ganda | LUG |
| Alemán | DEU |
| Griego | ELL |
| Guaraní | GRN |
| Hani * | HNI |
| Hawaiano | HAW |
| Húngaro | HUN |
| Islandés | ISL |
| Ido | IDO |
| Indonesio | IND |
| Interlingua | INA |
| Italiano | ITA |
| Kasub | CSB |
| Kawa * | WBM |
| Kikuyú | KIK |
| Congo | KON |
| Kpelle | KPE |
| Kurdo * | KUR |
| Latín | LAT |
| Letón | LAV |
| Lituano | LIT |
| Luba | LUA |
| Luxemburgués | LTZ |
| Macedonio | MKD |
| Malgache | MLG |
| Malayo | MSA |
| Malinke | MLQ |
| Maltés | MLT |
| Maorí | MRI |
| Maya | MYN |
| Miao * | HMN |
| Minangkabau | Mín. |
| Mohicano | MOH |
| Moldavo | MOL |
| El nahuatl | NAH |
| Noruego | NOR |
| Nyanja | NYA |
| Occidental | OCC |
| Ojibway | OJI |
| Papiamento | PAP |
| Pidgin inglés | TPI |
| Polaco | POL |
| Portugués | POR |
| Provenzales | PRV |
| Quechua | QUE |
| Rético | ROH |
| Rumano | RON |
| Gitano | ROM |
| Ruanda | KIN |
| Rundi | Iniciar |
| Ruso | RUS |
| Sami | SMI |
| Sami, Lule | SMJ |
| Sami, del Norte | SME |
| Sami, Sur | SMA |
| Samoano | SMO |
| Cerdeña | SRD |
| Serbio | SRP |
| Serbio, latín | QSL |
| Shona | SNA |
| Sioux | DAK |
| Eslovaco | SLK |
| Esloveno | SLV |
| Somalí | SOM |
| Sorabo (wend) | WEN |
| Sotho | SOT |
| Español | SPA |
| Sundanés | Dom |
| Suajili | SWA |
| Suaze | SSW |
| Sueco | SWE |
| Tagalo | TGL |
| Tahitiano | TAH |
| Pirez | QTI |
| Tongano | TON |
| Tswana (Chuana) | TSN |
| Tún * | TUG |
| Turco | TUR |
| Ucraniano | UKR |
| Visayan | QIS |
| Galés | CYM |
| Wolof | WOL |
| Xhosa | XHO |
| Zapoteco | ZAP |
| Zulú | ZUL |
| = Este idioma solo se puede manejar si está escrito con el alfabeto latín. |
Table 2. Supported languages and language codes for OmniPage OCR - Extended Pack Languages
| Código de idioma | |
|---|---|
| Todos los idiomas incluidos en el paquete básico | |
| Japonés | JPN |
| Chino simplificado | QCS |
| Chino tradicional | QCT |
| Koreano | KOR |
| Tailandés | THA |
| Árabe | ARA |
| Hebreo | HEB |
| Vietnamita (latín) | VIE |
The Extended Pack can be used with the ISO/DIS 639-3 language codes mentioned above, with the ISO 639-1 and ISO 639-2 language codes, or with the actual name of the language.