apply_deep_ocrT_apply_deep_ocrApplyDeepOcrApplyDeepOcrapply_deep_ocr (Operator)

Name

apply_deep_ocrT_apply_deep_ocrApplyDeepOcrApplyDeepOcrapply_deep_ocr — Anwenden eines Deep OCR-Modells auf mehreren Bildern.

Signatur

apply_deep_ocr(Image : : DeepOcrHandle, Mode : DeepOcrResult)

Herror T_apply_deep_ocr(const Hobject Image, const Htuple DeepOcrHandle, const Htuple Mode, Htuple* DeepOcrResult)

void ApplyDeepOcr(const HObject& Image, const HTuple& DeepOcrHandle, const HTuple& Mode, HTuple* DeepOcrResult)

HDictArray HDlModelOcr::ApplyDeepOcr(const HImage& Image, const HString& Mode) const

HDictArray HDlModelOcr::ApplyDeepOcr(const HImage& Image, const char* Mode) const

HDictArray HDlModelOcr::ApplyDeepOcr(const HImage& Image, const wchar_t* Mode) const   (Nur Windows)

static void HOperatorSet.ApplyDeepOcr(HObject image, HTuple deepOcrHandle, HTuple mode, out HTuple deepOcrResult)

HDict[] HDlModelOcr.ApplyDeepOcr(HImage image, string mode)

def apply_deep_ocr(image: HObject, deep_ocr_handle: HHandle, mode: str) -> Sequence[HHandle]

def apply_deep_ocr_s(image: HObject, deep_ocr_handle: HHandle, mode: str) -> HHandle

Beschreibung

apply_deep_ocrapply_deep_ocrApplyDeepOcrApplyDeepOcrApplyDeepOcrapply_deep_ocr wendet das durch DeepOcrHandleDeepOcrHandleDeepOcrHandleDeepOcrHandledeepOcrHandledeep_ocr_handle gegebene Deep OCR-Modell auf die Eingabebilder im Tupel ImageImageImageImageimageimage an. Der Operator gibt DeepOcrResultDeepOcrResultDeepOcrResultDeepOcrResultdeepOcrResultdeep_ocr_result zurück, ein Tupel mit einem Ergebnis-Dictionary DeepOcrResultDeepOcrResultDeepOcrResultDeepOcrResultdeepOcrResultdeep_ocr_result pro Eingabebild.

Der Operator apply_deep_ocrapply_deep_ocrApplyDeepOcrApplyDeepOcrApplyDeepOcrapply_deep_ocr stellt folgende Anforderungen an die Eingabebilder ImageImageImageImageimageimage:

Des Weiteren wird der Operator apply_deep_ocrapply_deep_ocrApplyDeepOcrApplyDeepOcrApplyDeepOcrapply_deep_ocr die Bilder ImageImageImageImageimageimage vorverarbeiten um den Modellspezifikationen zu entsprechen. Dies bedeutet, dass die Byte-Bilder normalisiert und in real-Bilder umgewandelt werden. Außerdem wird für ModeModeModeModemodemode = 'auto'"auto""auto""auto""auto""auto" oder 'detection'"detection""detection""detection""detection""detection" das Bild ImageImageImageImageimageimage auf die Eingabedimensionen des Modells aufgefüllt und im Falle von nur einem Kanal in ein dreikanaliges Bild umgewandelt. Für ModeModeModeModemodemode = 'recognition'"recognition""recognition""recognition""recognition""recognition" werden dreikanalige Bilder automatisch in einkanalige Bilder umgewandelt.

Der Parameter ModeModeModeModemodemode bestimmt den Modus und dadurch, welche Komponente ausgeführt wird. Es werden folgende Werte unterstützt:

'auto'"auto""auto""auto""auto""auto" (A):

Es werden beide Teile ausgeführt, die Lokalisierung und Erkennung der Worte.

'detection'"detection""detection""detection""detection""detection" (DET):

Nur die Komponente zur Lokalisierung wird ausgeführt. Daher lokalisiert das Modell lediglich die Wortbereiche innerhalb des Bildes.

'recognition'"recognition""recognition""recognition""recognition""recognition" (REC):

Nur die Komponente zum Erkennen der Worte wird ausgeführt. Daher erfordert das Modell, dass das Bild nur einen engen Zuschnitt eines einzelnen Wortes enthält.

Es gilt zu beachten, dass das Modell die entsprechenden Komponenten enthalten muss, siehe create_deep_ocrcreate_deep_ocrCreateDeepOcrCreateDeepOcrCreateDeepOcrcreate_deep_ocr.

Das Ergebnis-Dictionary DeepOcrResultDeepOcrResultDeepOcrResultDeepOcrResultdeepOcrResultdeep_ocr_result hat folgende Einträge, abhängig von ModeModeModeModemodemode (mit der Abkürzung markiert):

image (A, DET, REC):

Vorverarbeitetes Bild.

score_maps (A, DET):

Bewertungen als Bild mit vier Kanälen:

words (A, DET):

Dictionary mit den folgenden Einträgen. Dabei sind die Einträge Tupel mit einem Wert für jedes gefundene Wort.

Die Lokalisierung der Worte ist mittels Parameter orientierter Rechtecke gegeben, siehe gen_rectangle2gen_rectangle2GenRectangle2GenRectangle2GenRectangle2gen_rectangle2 für weitere Informationen.

word_boxes_on_image (A, DET):

Dictionary mit der Lokalisierung der Worte im Koordinatensystem der vorverarbeiteten Bilder, die sich in image befinden. Dabei sind die Einträge Tupel mit einem Wert für jedes gefundene Wort.

Die Lokalisierung der Worte ist mittels Parameter orientierter Rechtecke gegeben, siehe gen_rectangle2gen_rectangle2GenRectangle2GenRectangle2GenRectangle2gen_rectangle2 für weitere Informationen.

word_boxes_on_score_maps (A, DET):

Dictionary mit der Lokalisierung der Worte im Koordinatensystem der Bewertungsbilder, die sich in score_maps befinden. Die Einträge sind die gleichen wie für word_boxes_on_image oben.

word (REC):

Erkanntes Wort.

char_candidates (REC):

Ein Tupel von Dictionaries mit Informationen über jeden Buchstaben des erkannten Wortes. Jedes Buchstaben-Dictonary enthält folgende Schlüssel/Werte Paare:

Achtung

Systemvoraussetzungen: Um diesen Operator auf der GPU auszuführen (siehe get_deep_ocr_paramget_deep_ocr_paramGetDeepOcrParamGetDeepOcrParamGetDeepOcrParamget_deep_ocr_param), werden cuDNN und cuBLAS benötigt. Für weitere Details wird auf den „Installation Guide“, Abschnitt „Requirements for Deep Learning and Deep-Learning-Based Methods“, verwiesen. Alternativ kann dieser Operator auch auf der CPU ausgeführt werden.

Ausführungsinformationen

Dieser Operator liefert ein Handle zurück. Es ist zu beachten, dass der Zustand einer Instanz dieses Handletyps durch bestimmte Operatoren geändert werden kann, obwohl das Handle als Eingabeparameter in diesen Operatoren verwendet wird.

Dieser Operator unterstützt Cancel-Timeouts und Interrupts.

Dieser Operator unterstützt Break-Timeouts und Interrupts.

Parameter

ImageImageImageImageimageimage (input_object)  (multichannel-)image(-array) objectHImageHObjectHImageHobject (byte)

Eingabebild.

DeepOcrHandleDeepOcrHandleDeepOcrHandleDeepOcrHandledeepOcrHandledeep_ocr_handle (input_control)  deep_ocr HDlModelOcr, HTupleHHandleHTupleHtuple (handle) (IntPtr) (HHandle) (handle)

Handle des Deep OCR-Modells.

ModeModeModeModemodemode (input_control)  string HTuplestrHTupleHtuple (string) (string) (HString) (char*)

Inferenz-Modus.

Defaultwert: []

Werteliste: 'auto'"auto""auto""auto""auto""auto", 'detection'"detection""detection""detection""detection""detection", 'recognition'"recognition""recognition""recognition""recognition""recognition"

DeepOcrResultDeepOcrResultDeepOcrResultDeepOcrResultdeepOcrResultdeep_ocr_result (output_control)  dict(-array) HDict, HTupleSequence[HHandle]HTupleHtuple (handle) (IntPtr) (HHandle) (handle)

Tupel mit Ergebnis-Dictionaries.

Ergebnis

Sind die Parameterwerte korrekt, dann liefert apply_deep_ocrapply_deep_ocrApplyDeepOcrApplyDeepOcrApplyDeepOcrapply_deep_ocr den Wert TRUE. Gegebenenfalls wird eine Fehlerbehandlung durchgeführt.

Vorgänger

get_deep_ocr_paramget_deep_ocr_paramGetDeepOcrParamGetDeepOcrParamGetDeepOcrParamget_deep_ocr_param, set_deep_ocr_paramset_deep_ocr_paramSetDeepOcrParamSetDeepOcrParamSetDeepOcrParamset_deep_ocr_param, create_deep_ocrcreate_deep_ocrCreateDeepOcrCreateDeepOcrCreateDeepOcrcreate_deep_ocr

Modul

OCR/OCV