get_deep_ocr_paramT_get_deep_ocr_paramGetDeepOcrParamGetDeepOcrParamget_deep_ocr_param (Operator)

Name

get_deep_ocr_paramT_get_deep_ocr_paramGetDeepOcrParamGetDeepOcrParamget_deep_ocr_param — Auslesen der Parameter des Deep OCR-Modells.

Signatur

get_deep_ocr_param( : : DeepOcrHandle, GenParamName : GenParamValue)

Herror T_get_deep_ocr_param(const Htuple DeepOcrHandle, const Htuple GenParamName, Htuple* GenParamValue)

void GetDeepOcrParam(const HTuple& DeepOcrHandle, const HTuple& GenParamName, HTuple* GenParamValue)

HTuple HDlModelOcr::GetDeepOcrParam(const HString& GenParamName) const

HTuple HDlModelOcr::GetDeepOcrParam(const char* GenParamName) const

HTuple HDlModelOcr::GetDeepOcrParam(const wchar_t* GenParamName) const   (Nur Windows)

static void HOperatorSet.GetDeepOcrParam(HTuple deepOcrHandle, HTuple genParamName, out HTuple genParamValue)

HTuple HDlModelOcr.GetDeepOcrParam(string genParamName)

def get_deep_ocr_param(deep_ocr_handle: HHandle, gen_param_name: str) -> Sequence[HTupleElementType]

def get_deep_ocr_param_s(deep_ocr_handle: HHandle, gen_param_name: str) -> HTupleElementType

Beschreibung

get_deep_ocr_paramget_deep_ocr_paramGetDeepOcrParamGetDeepOcrParamGetDeepOcrParamget_deep_ocr_param gibt die Parameterwerte von GenParamNameGenParamNameGenParamNameGenParamNamegenParamNamegen_param_name für das Deep OCR-Modell DeepOcrHandleDeepOcrHandleDeepOcrHandleDeepOcrHandledeepOcrHandledeep_ocr_handle in GenParamValueGenParamValueGenParamValueGenParamValuegenParamValuegen_param_value aus.

Die Parameter können das ganze Modell betreffen oder nur spezifische Komponenten. Die folgende Tabelle gibt einen Überblick, welche Parameter gesetzt und welche zurückgegeben werden können sowie für welche Modell-Komponente sie zutreffen.

GenParamNameGenParamNameGenParamNameGenParamNamegenParamNamegen_param_name Modell Det. Komp. Recog. Komp.
'device'"device""device""device""device""device"
'detection_device'"detection_device""detection_device""detection_device""detection_device""detection_device"
'detection_image_dimensions'"detection_image_dimensions""detection_image_dimensions""detection_image_dimensions""detection_image_dimensions""detection_image_dimensions"
'detection_image_height'"detection_image_height""detection_image_height""detection_image_height""detection_image_height""detection_image_height"
'detection_image_size'"detection_image_size""detection_image_size""detection_image_size""detection_image_size""detection_image_size"
'detection_image_width'"detection_image_width""detection_image_width""detection_image_width""detection_image_width""detection_image_width"
'detection_min_character_score'"detection_min_character_score""detection_min_character_score""detection_min_character_score""detection_min_character_score""detection_min_character_score"
'detection_min_link_score'"detection_min_link_score""detection_min_link_score""detection_min_link_score""detection_min_link_score""detection_min_link_score"
'detection_min_word_area'"detection_min_word_area""detection_min_word_area""detection_min_word_area""detection_min_word_area""detection_min_word_area"
'detection_min_word_score'"detection_min_word_score""detection_min_word_score""detection_min_word_score""detection_min_word_score""detection_min_word_score"
'detection_model'"detection_model""detection_model""detection_model""detection_model""detection_model"
'detection_orientation'"detection_orientation""detection_orientation""detection_orientation""detection_orientation""detection_orientation"
'detection_sort_by_line'"detection_sort_by_line""detection_sort_by_line""detection_sort_by_line""detection_sort_by_line""detection_sort_by_line"
'detection_tiling'"detection_tiling""detection_tiling""detection_tiling""detection_tiling""detection_tiling"
'recognition_alphabet'"recognition_alphabet""recognition_alphabet""recognition_alphabet""recognition_alphabet""recognition_alphabet"
'recognition_batch_size'"recognition_batch_size""recognition_batch_size""recognition_batch_size""recognition_batch_size""recognition_batch_size"
'recognition_device'"recognition_device""recognition_device""recognition_device""recognition_device""recognition_device"
'recognition_image_dimensions'"recognition_image_dimensions""recognition_image_dimensions""recognition_image_dimensions""recognition_image_dimensions""recognition_image_dimensions"
'recognition_image_height'"recognition_image_height""recognition_image_height""recognition_image_height""recognition_image_height""recognition_image_height"
'recognition_image_width'"recognition_image_width""recognition_image_width""recognition_image_width""recognition_image_width""recognition_image_width"
'recognition_model'"recognition_model""recognition_model""recognition_model""recognition_model""recognition_model"
'recognition_num_char_candidates'"recognition_num_char_candidates""recognition_num_char_candidates""recognition_num_char_candidates""recognition_num_char_candidates""recognition_num_char_candidates"
Hierbei stehen die verwendeten Symbole für folgendes:

Im Folgenden werden die Parameter GenParamNameGenParamNameGenParamNameGenParamNamegenParamNamegen_param_name, deren Werte mit get_deep_ocr_paramget_deep_ocr_paramGetDeepOcrParamGetDeepOcrParamGetDeepOcrParamget_deep_ocr_param abgefragt werden können, aufgelistet und erläutert.

Komplettes Modell:

'device'"device""device""device""device""device":

Handle der Hardware Einheit, auf der das Modell ausgeführt wird. Ein Tupel mit den Handles aller potentiell Deep OCR-fähigen Geräte kann über query_available_dl_devicesquery_available_dl_devicesQueryAvailableDlDevicesQueryAvailableDlDevicesQueryAvailableDlDevicesquery_available_dl_devices erzeugt werden.

Es gilt zu beachten, dass eine Einheit auch für eine einzelne Komponente neu gesetzt werden kann. In diesem Fall wird nur der möglicherweise verbliebene Teil des Modells (z.B. eine verbleibende Komponente) auf der Einheit dieses Handles ausgeführt.

Default: Handle der Standard-Einheit, d.h. die GPU mit Index 0 in der Liste, die mit get_systemget_systemGetSystemGetSystemGetSystemget_system und 'cuda_devices'"cuda_devices""cuda_devices""cuda_devices""cuda_devices""cuda_devices" erhalten wird. Falls keine Einheit vorhanden ist, ein leeres Tupel.

Lokalisierungs-Komponente:

'detection_device'"detection_device""detection_device""detection_device""detection_device""detection_device":

Dieser Parameter setzt die Hardware Einheit auf welcher die Lokalisierungs-Komponente des Deep OCR-Modells ausgeführt wird. Siehe 'device'"device""device""device""device""device" für weitere Erklärungen.

Default: Der selbe Wert wie für 'device'"device""device""device""device""device".

'detection_image_dimensions'"detection_image_dimensions""detection_image_dimensions""detection_image_dimensions""detection_image_dimensions""detection_image_dimensions":

Tupel mit den Bilddimensionen ('detection_image_width'"detection_image_width""detection_image_width""detection_image_width""detection_image_width""detection_image_width", 'detection_image_height'"detection_image_height""detection_image_height""detection_image_height""detection_image_height""detection_image_height", Anzahl Kanäle), welche die Lokalisierungs-Komponente verarbeitet.

Default: [1024, 1024, 3]

'detection_image_height'"detection_image_height""detection_image_height""detection_image_height""detection_image_height""detection_image_height":

Höhe des Bildes, welche die Lokalisierungs-Komponente verarbeitet. Dies bedeutet, dass das Netzwerk erst das Eingabebild auf diese Höhe zoomt bevor es das Bild verarbeitet. Dadurch kann diese Größe die Ergebnisse beeinflussen.

Die Modellarchitektur verlangt, dass die Höhe ein Vielfaches von 32 ist. Ist dies nicht der Fall, wird die Höhe auf das nächstgrößere ganzzahlige Vielfache von 32 gerundet.

Typical values: 768, 1024, 1280

Default: 1024

'detection_image_size'"detection_image_size""detection_image_size""detection_image_size""detection_image_size""detection_image_size":

Tupel mit der Bildgröße ('detection_image_width'"detection_image_width""detection_image_width""detection_image_width""detection_image_width""detection_image_width", 'detection_image_height'"detection_image_height""detection_image_height""detection_image_height""detection_image_height""detection_image_height"), welche die Lokalisierungs-Komponente verarbeitet.

Default: [1024, 1024]

'detection_image_width'"detection_image_width""detection_image_width""detection_image_width""detection_image_width""detection_image_width":

Breite des Bildes, welche die Lokalisierungs-Komponente verarbeitet. Dies bedeutet, dass das Netzwerk erst das Eingabebild auf diese Breite zoomt bevor es das Bild verarbeitet. Dadurch kann diese Größe die Ergebnisse beeinflussen.

Die Modellarchitektur verlangt, dass die Breite ein Vielfaches von 32 ist. Ist dies nicht der Fall, wird die Breite auf das nächstgrößere ganzzahlige Vielfache von 32 gerundet.

Typical values: 768, 1024, 1280

Default: 1024

'detection_min_character_score'"detection_min_character_score""detection_min_character_score""detection_min_character_score""detection_min_character_score""detection_min_character_score":

Der Parameter 'detection_min_character_score'"detection_min_character_score""detection_min_character_score""detection_min_character_score""detection_min_character_score""detection_min_character_score" gibt den unteren Schwellenwert an, der für die Zeichenbewertung verwendet wird, um die Abmessungen der Zeichen zu schätzen. Durch Anpassen von 'detection_min_character_score'"detection_min_character_score""detection_min_character_score""detection_min_character_score""detection_min_character_score""detection_min_character_score" können vorgeschlagene Instanzen aufgespalten, beziehungsweise benachbarte Instanzen vereint werden.

Wertebereich: .

Default: 0.5

'detection_min_link_score'"detection_min_link_score""detection_min_link_score""detection_min_link_score""detection_min_link_score""detection_min_link_score":

Der Parameter 'detection_min_link_score'"detection_min_link_score""detection_min_link_score""detection_min_link_score""detection_min_link_score""detection_min_link_score" definiert die minimale Verknüpfungsbewertung, die zwischen zwei lokalisierten Zeichen gefordert ist, um diese Zeichen als zusammenhängendes Wort zu erkennen.

Wertebereich: .

Default: 0.3

'detection_min_word_area'"detection_min_word_area""detection_min_word_area""detection_min_word_area""detection_min_word_area""detection_min_word_area":

Der Parameter 'detection_min_word_area'"detection_min_word_area""detection_min_word_area""detection_min_word_area""detection_min_word_area""detection_min_word_area" definiert die Mindestgröße, die ein lokalisiertes Wort haben muss, um vorgeschlagen zu werden. Über diesen Parameter können zu kleine Vorschläge gefiltert werden.

Wertebereich: .

Default: 10

'detection_min_word_score'"detection_min_word_score""detection_min_word_score""detection_min_word_score""detection_min_word_score""detection_min_word_score":

Der Parameter 'detection_min_word_score'"detection_min_word_score""detection_min_word_score""detection_min_word_score""detection_min_word_score""detection_min_word_score" definiert die minimale Bewertung, die eine lokalisierte Instanz enthalten muss, um als Wort vorgeschlagen zu werden. Über diesen Parameter können unsichere Worte herausgefiltert werden.

Wertebereich: .

Default: 0.7

'detection_model'"detection_model""detection_model""detection_model""detection_model""detection_model":

Handle der Deep OCR-Modell-Komponente zur Lokalisierung der Worte.

'detection_orientation'"detection_orientation""detection_orientation""detection_orientation""detection_orientation""detection_orientation":

Dieser Parameter erlaubt es, die Orientierung der vorhergesagten Worte im Voraus festzulegen. Diese Festlegung kann wieder rückgängig gemacht werden, indem 'detection_orientation'"detection_orientation""detection_orientation""detection_orientation""detection_orientation""detection_orientation" auf 'auto'"auto""auto""auto""auto""auto" gesetzt wird. Dann wird für die Orientierung der Worte wieder die Vorhersage des Modells benutzt.

Wertebereich: .

Default: 'auto'"auto""auto""auto""auto""auto"

'detection_sort_by_line'"detection_sort_by_line""detection_sort_by_line""detection_sort_by_line""detection_sort_by_line""detection_sort_by_line":

Auf Grundlage der geschätzten Orientierungen der lokalisierten Worte werden die gefundenen Worte zeilenweise sortiert. Wird eine Sortierung in Zeilen- und Spaltenrichtung bevorzugt, muss der Parameter 'detection_sort_by_line'"detection_sort_by_line""detection_sort_by_line""detection_sort_by_line""detection_sort_by_line""detection_sort_by_line" auf 'false'"false""false""false""false""false" gesetzt werden.

Default: 'true'"true""true""true""true""true"

'detection_tiling'"detection_tiling""detection_tiling""detection_tiling""detection_tiling""detection_tiling":

Das Eingabebild wird automatisch in überlappende Kacheln der Größe 'detection_image_size'"detection_image_size""detection_image_size""detection_image_size""detection_image_size""detection_image_size" aufgeteilt, welche separat von der Lokalisierungs-Komponente verarbeitet werden. Dies ermöglicht das Verarbeiten von Eingabebildern, welche wesentlich größer sind als die eigentliche Bildgröße 'detection_image_size'"detection_image_size""detection_image_size""detection_image_size""detection_image_size""detection_image_size", ohne dass das Eingabebild gezoomt werden muss. Entsprechend wird für 'detection_tiling'"detection_tiling""detection_tiling""detection_tiling""detection_tiling""detection_tiling" = 'true'"true""true""true""true""true" das Eingabebild nicht mehr gezoomt bevor es verarbeitet wird.

Default: 'false'"false""false""false""false""false"

Erkennungs-Komponente:

'recognition_alphabet'"recognition_alphabet""recognition_alphabet""recognition_alphabet""recognition_alphabet""recognition_alphabet":

Der Zeichensatz mit welchem das Deep OCR-Modell trainiert wurde und somit die Zeichen, welche das Modell erkennen kann.

'recognition_batch_size'"recognition_batch_size""recognition_batch_size""recognition_batch_size""recognition_batch_size""recognition_batch_size":

Anzahl der Bilder in einem Batch, die gleichzeitig in den Gerätespeicher transferiert werden. Für mehr Informationen wird auf die Referenzdokumentation des Operator apply_dl_modelapply_dl_modelApplyDlModelApplyDlModelApplyDlModelapply_dl_model bezüglich des Parameters 'batch_size'"batch_size""batch_size""batch_size""batch_size""batch_size" verwiesen. Dieser Parameter kann dazu verwendet werden die Laufzeit von apply_deep_ocrapply_deep_ocrApplyDeepOcrApplyDeepOcrApplyDeepOcrapply_deep_ocr auf der gegebenen Hardware-Einheit zu verkürzen. Falls die Erkennungs-Komponente mehrere Eingaben (Wörter) gleichzeitig verarbeiten muss, kann eine höhere 'recognition_batch_size'"recognition_batch_size""recognition_batch_size""recognition_batch_size""recognition_batch_size""recognition_batch_size" zu schnellerer Verarbeitung führen. Es gilt zu beachten, dass ein höherer Wert für die 'recognition_batch_size'"recognition_batch_size""recognition_batch_size""recognition_batch_size""recognition_batch_size""recognition_batch_size" zu höherem Speicherverbrauch auf der Hardware-Einheit führt.

Default: 1

'recognition_device'"recognition_device""recognition_device""recognition_device""recognition_device""recognition_device":

Dieser Parameter setzt die Hardware Einheit auf welcher die Erkennungs-Komponente des Deep OCR-Modells ausgeführt wird. Siehe 'device'"device""device""device""device""device" für weitere Erklärungen.

Default: Der selbe Wert wie für 'device'"device""device""device""device""device".

'recognition_image_dimensions'"recognition_image_dimensions""recognition_image_dimensions""recognition_image_dimensions""recognition_image_dimensions""recognition_image_dimensions":

Tupel mit den Bilddimensionen ('recognition_image_width'"recognition_image_width""recognition_image_width""recognition_image_width""recognition_image_width""recognition_image_width", 'recognition_image_height'"recognition_image_height""recognition_image_height""recognition_image_height""recognition_image_height""recognition_image_height", Anzahl Kanäle), welche die Erkennungs-Komponente verarbeitet.

Default: [120, 32, 1]

'recognition_image_height'"recognition_image_height""recognition_image_height""recognition_image_height""recognition_image_height""recognition_image_height":

Höhe des Bildes, welche die Erkennungs-Komponente verarbeitet. Dies bedeutet, dass das Netzwerk erst den Bildausschnitt auf diese Höhe zoomt bevor es den Bildausschnitt verarbeitet.

Default: 32

'recognition_image_width'"recognition_image_width""recognition_image_width""recognition_image_width""recognition_image_width""recognition_image_width":

Breite des Bildes, welche die Erkennungs-Komponente verarbeitet. Dies bedeutet, dass das Netzwerk erst den Bildausschnitt auf diese Breite zoomt bevor es den Bildausschnitt verarbeitet.

Default: 120

'recognition_model'"recognition_model""recognition_model""recognition_model""recognition_model""recognition_model":

Handle der Deep OCR-Modell-Komponente zur Worterkennung.

'recognition_num_char_candidates'"recognition_num_char_candidates""recognition_num_char_candidates""recognition_num_char_candidates""recognition_num_char_candidates""recognition_num_char_candidates":

Kontrolliert die Anzahl der zurückgegebenen Buchstaben-Kandidaten des Operators apply_deep_ocrapply_deep_ocrApplyDeepOcrApplyDeepOcrApplyDeepOcrapply_deep_ocr.

Default: 3

Ausführungsinformationen

Parameter

DeepOcrHandleDeepOcrHandleDeepOcrHandleDeepOcrHandledeepOcrHandledeep_ocr_handle (input_control)  deep_ocr HDlModelOcr, HTupleHHandleHTupleHtuple (handle) (IntPtr) (HHandle) (handle)

Handle des Deep OCR-Modells.

GenParamNameGenParamNameGenParamNameGenParamNamegenParamNamegen_param_name (input_control)  attribute.name HTuplestrHTupleHtuple (string) (string) (HString) (char*)

Name des generischen Parameters.

Defaultwert: 'recognition_model' "recognition_model" "recognition_model" "recognition_model" "recognition_model" "recognition_model"

Werteliste: 'detection_device'"detection_device""detection_device""detection_device""detection_device""detection_device", 'detection_image_dimensions'"detection_image_dimensions""detection_image_dimensions""detection_image_dimensions""detection_image_dimensions""detection_image_dimensions", 'detection_image_height'"detection_image_height""detection_image_height""detection_image_height""detection_image_height""detection_image_height", 'detection_image_size'"detection_image_size""detection_image_size""detection_image_size""detection_image_size""detection_image_size", 'detection_image_width'"detection_image_width""detection_image_width""detection_image_width""detection_image_width""detection_image_width", 'detection_min_character_score'"detection_min_character_score""detection_min_character_score""detection_min_character_score""detection_min_character_score""detection_min_character_score", 'detection_min_link_score'"detection_min_link_score""detection_min_link_score""detection_min_link_score""detection_min_link_score""detection_min_link_score", 'detection_min_word_area'"detection_min_word_area""detection_min_word_area""detection_min_word_area""detection_min_word_area""detection_min_word_area", 'detection_min_word_score'"detection_min_word_score""detection_min_word_score""detection_min_word_score""detection_min_word_score""detection_min_word_score", 'detection_model'"detection_model""detection_model""detection_model""detection_model""detection_model", 'detection_orientation'"detection_orientation""detection_orientation""detection_orientation""detection_orientation""detection_orientation", 'detection_sort_by_line'"detection_sort_by_line""detection_sort_by_line""detection_sort_by_line""detection_sort_by_line""detection_sort_by_line", 'detection_tiling'"detection_tiling""detection_tiling""detection_tiling""detection_tiling""detection_tiling", 'recognition_alphabet'"recognition_alphabet""recognition_alphabet""recognition_alphabet""recognition_alphabet""recognition_alphabet", 'recognition_batch_size'"recognition_batch_size""recognition_batch_size""recognition_batch_size""recognition_batch_size""recognition_batch_size", 'recognition_device'"recognition_device""recognition_device""recognition_device""recognition_device""recognition_device", 'recognition_image_dimensions'"recognition_image_dimensions""recognition_image_dimensions""recognition_image_dimensions""recognition_image_dimensions""recognition_image_dimensions", 'recognition_image_height'"recognition_image_height""recognition_image_height""recognition_image_height""recognition_image_height""recognition_image_height", 'recognition_image_width'"recognition_image_width""recognition_image_width""recognition_image_width""recognition_image_width""recognition_image_width", 'recognition_model'"recognition_model""recognition_model""recognition_model""recognition_model""recognition_model", 'recognition_num_char_candidates'"recognition_num_char_candidates""recognition_num_char_candidates""recognition_num_char_candidates""recognition_num_char_candidates""recognition_num_char_candidates"

GenParamValueGenParamValueGenParamValueGenParamValuegenParamValuegen_param_value (output_control)  attribute.value(-array) HTupleSequence[HTupleElementType]HTupleHtuple (integer / handle / string / real) (int / long / HHandle / string / double) (Hlong / HHandle / HString / double) (Hlong / handle / char* / double)

Wert des generischen Parameters.

Ergebnis

Sind die Parameterwerte korrekt, dann liefert get_deep_ocr_paramget_deep_ocr_paramGetDeepOcrParamGetDeepOcrParamGetDeepOcrParamget_deep_ocr_param den Wert TRUE. Gegebenenfalls wird eine Fehlerbehandlung durchgeführt.

Vorgänger

create_deep_ocrcreate_deep_ocrCreateDeepOcrCreateDeepOcrCreateDeepOcrcreate_deep_ocr, set_deep_ocr_paramset_deep_ocr_paramSetDeepOcrParamSetDeepOcrParamSetDeepOcrParamset_deep_ocr_param

Nachfolger

set_deep_ocr_paramset_deep_ocr_paramSetDeepOcrParamSetDeepOcrParamSetDeepOcrParamset_deep_ocr_param, apply_deep_ocrapply_deep_ocrApplyDeepOcrApplyDeepOcrApplyDeepOcrapply_deep_ocr

Siehe auch

set_deep_ocr_paramset_deep_ocr_paramSetDeepOcrParamSetDeepOcrParamSetDeepOcrParamset_deep_ocr_param

Modul

OCR/OCV