Die Parameter können das ganze Modell betreffen oder nur spezifische
Komponenten.
Die folgende Tabelle gibt einen Überblick, welche Parameter gesetzt und welche
zurückgegeben werden können sowie für welche Modell-Komponente sie zutreffen.
Es gilt zu beachten, dass eine Einheit auch für eine einzelne Komponente
neu gesetzt werden kann. In diesem Fall wird nur der möglicherweise
verbliebene Teil des Modells (z.B. eine verbleibende Komponente)
auf der Einheit dieses Handles ausgeführt.
Default: Handle der Standard-Einheit, d.h. die GPU mit Index
0 in der Liste, die mit get_systemget_systemGetSystemGetSystemGetSystemget_system und
'cuda_devices'"cuda_devices""cuda_devices""cuda_devices""cuda_devices""cuda_devices" erhalten wird.
Falls keine Einheit vorhanden ist, ein leeres Tupel.
Dieser Parameter setzt die Hardware Einheit auf welcher die
Lokalisierungs-Komponente des Deep OCR-Modells ausgeführt wird.
Siehe 'device'"device""device""device""device""device" für weitere Erklärungen.
Default: Der selbe Wert wie für 'device'"device""device""device""device""device".
Tupel mit den Bilddimensionen ('detection_image_width'"detection_image_width""detection_image_width""detection_image_width""detection_image_width""detection_image_width",
'detection_image_height'"detection_image_height""detection_image_height""detection_image_height""detection_image_height""detection_image_height", Anzahl Kanäle), welche die
Lokalisierungs-Komponente verarbeitet.
Höhe des Bildes, welche die Lokalisierungs-Komponente verarbeitet.
Dies bedeutet, dass das Netzwerk erst das Eingabebild auf diese Höhe zoomt
bevor es das Bild verarbeitet. Dadurch kann diese Größe die Ergebnisse
beeinflussen.
Die Modellarchitektur verlangt, dass die Höhe ein Vielfaches von 32 ist.
Ist dies nicht der Fall, wird die Höhe auf das nächstgrößere ganzzahlige
Vielfache von 32 gerundet.
Tupel mit der Bildgröße ('detection_image_width'"detection_image_width""detection_image_width""detection_image_width""detection_image_width""detection_image_width",
'detection_image_height'"detection_image_height""detection_image_height""detection_image_height""detection_image_height""detection_image_height"), welche die
Lokalisierungs-Komponente verarbeitet.
Breite des Bildes, welche die Lokalisierungs-Komponente verarbeitet.
Dies bedeutet, dass das Netzwerk erst das Eingabebild auf diese Breite
zoomt bevor es das Bild verarbeitet. Dadurch kann diese Größe die Ergebnisse
beeinflussen.
Die Modellarchitektur verlangt, dass die Breite ein Vielfaches von 32
ist. Ist dies nicht der Fall, wird die Breite auf das nächstgrößere
ganzzahlige Vielfache von 32 gerundet.
Der Parameter 'detection_min_character_score'"detection_min_character_score""detection_min_character_score""detection_min_character_score""detection_min_character_score""detection_min_character_score" gibt den unteren
Schwellenwert an, der für die Zeichenbewertung verwendet wird, um die
Abmessungen der Zeichen zu schätzen.
Durch Anpassen von 'detection_min_character_score'"detection_min_character_score""detection_min_character_score""detection_min_character_score""detection_min_character_score""detection_min_character_score" können
vorgeschlagene Instanzen aufgespalten, beziehungsweise benachbarte
Instanzen vereint werden.
Der Parameter 'detection_min_link_score'"detection_min_link_score""detection_min_link_score""detection_min_link_score""detection_min_link_score""detection_min_link_score" definiert die minimale
Verknüpfungsbewertung, die zwischen zwei lokalisierten Zeichen gefordert
ist, um diese Zeichen als zusammenhängendes Wort zu erkennen.
Der Parameter 'detection_min_word_area'"detection_min_word_area""detection_min_word_area""detection_min_word_area""detection_min_word_area""detection_min_word_area" definiert die
Mindestgröße, die ein lokalisiertes Wort haben muss, um vorgeschlagen zu
werden.
Über diesen Parameter können zu kleine Vorschläge gefiltert werden.
Der Parameter 'detection_min_word_score'"detection_min_word_score""detection_min_word_score""detection_min_word_score""detection_min_word_score""detection_min_word_score" definiert die minimale
Bewertung, die eine lokalisierte Instanz enthalten muss, um als Wort
vorgeschlagen zu werden. Über diesen Parameter können unsichere Worte
herausgefiltert werden.
Dieser Parameter erlaubt es, die Orientierung der vorhergesagten Worte im
Voraus festzulegen. Diese Festlegung kann wieder rückgängig gemacht
werden, indem 'detection_orientation'"detection_orientation""detection_orientation""detection_orientation""detection_orientation""detection_orientation" auf 'auto'"auto""auto""auto""auto""auto"
gesetzt wird. Dann wird für die Orientierung der Worte wieder die
Vorhersage des Modells benutzt.
Auf Grundlage der geschätzten Orientierungen der lokalisierten Worte
werden die gefundenen Worte zeilenweise sortiert. Wird eine Sortierung in
Zeilen- und Spaltenrichtung bevorzugt, muss der Parameter
'detection_sort_by_line'"detection_sort_by_line""detection_sort_by_line""detection_sort_by_line""detection_sort_by_line""detection_sort_by_line" auf 'false'"false""false""false""false""false" gesetzt werden.
Das Eingabebild wird automatisch in überlappende Kacheln der Größe
'detection_image_size'"detection_image_size""detection_image_size""detection_image_size""detection_image_size""detection_image_size" aufgeteilt, welche separat von der
Lokalisierungs-Komponente verarbeitet werden.
Dies ermöglicht das Verarbeiten von Eingabebildern, welche wesentlich
größer sind als die eigentliche Bildgröße
'detection_image_size'"detection_image_size""detection_image_size""detection_image_size""detection_image_size""detection_image_size", ohne dass das Eingabebild gezoomt
werden muss.
Entsprechend wird für 'detection_tiling'"detection_tiling""detection_tiling""detection_tiling""detection_tiling""detection_tiling" = 'true'"true""true""true""true""true" das
Eingabebild nicht mehr gezoomt bevor es verarbeitet wird.
Anzahl der Bilder in einem Batch, die gleichzeitig in den Gerätespeicher
transferiert werden. Für mehr Informationen wird auf die
Referenzdokumentation des Operator apply_dl_modelapply_dl_modelApplyDlModelApplyDlModelApplyDlModelapply_dl_model bezüglich des
Parameters 'batch_size'"batch_size""batch_size""batch_size""batch_size""batch_size" verwiesen. Dieser Parameter kann dazu
verwendet werden die Laufzeit von apply_deep_ocrapply_deep_ocrApplyDeepOcrApplyDeepOcrApplyDeepOcrapply_deep_ocr auf der
gegebenen Hardware-Einheit zu verkürzen. Falls die
Erkennungs-Komponente mehrere Eingaben (Wörter) gleichzeitig
verarbeiten muss, kann eine höhere 'recognition_batch_size'"recognition_batch_size""recognition_batch_size""recognition_batch_size""recognition_batch_size""recognition_batch_size" zu
schnellerer Verarbeitung führen. Es gilt zu beachten, dass ein höherer
Wert für die 'recognition_batch_size'"recognition_batch_size""recognition_batch_size""recognition_batch_size""recognition_batch_size""recognition_batch_size" zu höherem
Speicherverbrauch auf der Hardware-Einheit führt.
Dieser Parameter setzt die Hardware Einheit auf welcher die
Erkennungs-Komponente des Deep OCR-Modells ausgeführt wird.
Siehe 'device'"device""device""device""device""device" für weitere Erklärungen.
Default: Der selbe Wert wie für 'device'"device""device""device""device""device".
Tupel mit den Bilddimensionen ('recognition_image_width'"recognition_image_width""recognition_image_width""recognition_image_width""recognition_image_width""recognition_image_width",
'recognition_image_height'"recognition_image_height""recognition_image_height""recognition_image_height""recognition_image_height""recognition_image_height", Anzahl Kanäle),
welche die Erkennungs-Komponente verarbeitet.
Höhe des Bildes, welche die Erkennungs-Komponente verarbeitet.
Dies bedeutet, dass das Netzwerk erst den Bildausschnitt auf diese Höhe
zoomt bevor es den Bildausschnitt verarbeitet.
Breite des Bildes, welche die Erkennungs-Komponente verarbeitet.
Dies bedeutet, dass das Netzwerk erst den Bildausschnitt auf diese Breite
zoomt bevor es den Bildausschnitt verarbeitet.
Sind die Parameterwerte korrekt, dann liefert get_deep_ocr_paramget_deep_ocr_paramGetDeepOcrParamGetDeepOcrParamGetDeepOcrParamget_deep_ocr_param den
Wert TRUE. Gegebenenfalls wird eine Fehlerbehandlung durchgeführt.