UiPath Documentation
document-understanding
2.2510
true
Importante :
La localización de contenidos recién publicados puede tardar entre una y dos semanas en estar disponible.
UiPath logo, featuring letters U and I in white

Document Understanding user guide

Última actualización 6 de abr. de 2026

Información general

There are several ways in which you can consume Document UnderstandingTM capabilities:

  • The DocumentUnderstanding.Activities package is available in Studio Web, Studio X, and Studio Desktop and is pre-configured for you either when you create a new automation starting from a file, or if you continue your journey after publishing a project version.
  • Using the IntelligentOCR package, which is designed for Windows and Windows Legacy projects, and pre-configured in the Document Understanding process template.
  • Using cloud API calls, consuming Document Understanding as a service via the programming language of your choice.

Actividades de Document Understanding

If you're an RPA developer, you can use DocumentUnderstanding.Activities in your cloud projects. Using Document Understanding allows you to handle all data about a document within a single input/output object, named Document Data. Also, Document Understanding activities don't require setting the taxonomy of Document Types, so you can easily leverage out-of-the-box-models.

Puedes configurar fácilmente una automatización utilizando algunas de las siguientes actividades, a través del Creador de automatización de extracción disponible en Document Understanding, Marketplace y Studio Web:

Ten en cuenta que las actividades de Document Understanding no admiten las siguientes capacidades, todavía: dividir, entrenar (ajuste de modelos), soporte de tenant de producción/desarrollador, soporte local y varios métodos de extracción por tipo de documento.

If you start new automation projects that leverage modern projects (created using the Active Learning experience), you can use DocumentUnderstanding.Activities.

OCRInteligente

Como RPA developer que desea probar el paquete IntelligentOCR, puedes utilizar diferentes modelos de extracción y clasificación en función de tus necesidades. Si un modelo no se ajusta a tus necesidades, puedes utilizar otros extractores o clasificadores como opción de copia de seguridad. También puedes modificar la taxonomía, el modelo de objetos de documento (DOM) y los resultados de extracción utilizando código RPA durante el runtime.

Sin embargo, se requiere una curva de aprendizaje más larga para utilizar IntelligentOCR, porque su flexibilidad implica complejidad, mientras se trabaja con varias actividades y tipos de datos.

With IntelligentOCR, you can integrate your own classifier, extractor, or OCR engine. Visit Document Processing Code Samples to check implementation examples.

Llamadas a API

Puedes utilizar las llamadas a la API como alternativa al enfoque de automatización de procesos robóticos (RPA). Las llamadas a las API permiten recuperar información detallada sobre el proyecto, incluidos los extractores y clasificadores utilizados, facilitar el uso de las API de digitalización, clasificar y extraer datos de documentos utilizando modelos especializados y generativos, y validar la información digitalizada, clasificada y extraída previamente.

Para consumir las API, puedes utilizar cualquier lenguaje de programación/scripting (ya que las llamadas se realizan utilizando HTTP), incluido RPA.

You can access the APIs via Swagger: In the toolbar of the Document Understanding service, search the REST API dropdown list, and select Framework.

Consejo:

For more information on how to get started with the Document Understanding APIs, check the Document Understanding API Guide.

  • Actividades de Document Understanding
  • OCRInteligente
  • Llamadas a API

¿Te ha resultado útil esta página?

Conectar

¿Necesita ayuda? Soporte

¿Quiere aprender? UiPath Academy

¿Tiene alguna pregunta? Foro de UiPath

Manténgase actualizado