Name
create_text_model_readercreate_text_model_readerCreateTextModelReadercreate_text_model_readerCreateTextModelReaderCreateTextModelReader — Erzeugen eines Textmodells.
create_text_model_readercreate_text_model_readerCreateTextModelReadercreate_text_model_readerCreateTextModelReaderCreateTextModelReader erzeugt das neue Textmodell
TextModelTextModelTextModelTextModelTextModeltextModel, welches den Text beschreibt, der von find_textfind_textFindTextfind_textFindTextFindText
segmentiert werden soll.
ModeModeModeModeModemode bestimmt welche Methode der Textsegmetierung gewählt werden
soll. Mögliche Werte für ModeModeModeModeModemode sind 'auto'"auto""auto""auto""auto""auto" und
'manual'"manual""manual""manual""manual""manual".
Im Allgemeinen sollte ModeModeModeModeModemode auf 'auto'"auto""auto""auto""auto""auto" gesetzt werden,
da die automatische Textsegmentierung stabiler ist und weniger
Anpassungen notwendig sind. Hierbei ist zu beachten, dass ein
OCR Klassifikator OCRClassifierMLPOCRClassifierMLPOCRClassifierMLPOCRClassifierMLPOCRClassifierMLPOCRClassifierMLP übergeben werden muss.
ModeModeModeModeModemode muss nur in den folgenden Fällen auf 'manual'"manual""manual""manual""manual""manual" gesetzt
werden:
-
Der zu segmentierende Text ist ein Punktdruck.
-
Der zu segmentierende Text enthält sehr viele lokale Änderungen der
Polarität aufgrund von Reflektionen. Dies ist häufig bei geprägtem Text der
Fall.
-
Es steht kein geeigneter MLP-basierter OCR Klassifikator zur
Verfügung (siehe unten).
Für Textmodelle mit ModeModeModeModeModemode = 'auto'"auto""auto""auto""auto""auto", kann mit
find_textfind_textFindTextfind_textFindTextFindText automatisch Text jeglicher Größe extrahiert und
klassifiziert werden. Es ist aber auch möglich, die Suche auf
Buchstaben mit bestimmten Eigenschaften einzuschränken, siehe
set_text_model_paramset_text_model_paramSetTextModelParamset_text_model_paramSetTextModelParamSetTextModelParam. Für Textmodelle mit
ModeModeModeModeModemode = 'auto'"auto""auto""auto""auto""auto" muss ein OCR Klassifikator
OCRClassifierMLPOCRClassifierMLPOCRClassifierMLPOCRClassifierMLPOCRClassifierMLPOCRClassifierMLP übergeben werden, der unter Verwendung eines
mehrschichtigen Perzeptrons (MLP) erzeugt wurde. Es wird ausdrücklich
empfohlen einen regularisierten OCR Klassifikator (siehe
set_regularization_params_ocr_class_mlpset_regularization_params_ocr_class_mlpSetRegularizationParamsOcrClassMlpset_regularization_params_ocr_class_mlpSetRegularizationParamsOcrClassMlpSetRegularizationParamsOcrClassMlp) zu verwenden, der
unbekannte Zeichen zurückweist (siehe
set_rejection_params_ocr_class_mlpset_rejection_params_ocr_class_mlpSetRejectionParamsOcrClassMlpset_rejection_params_ocr_class_mlpSetRejectionParamsOcrClassMlpSetRejectionParamsOcrClassMlp). Ein geeigneter OCR Klassifikator
OCRClassifierMLPOCRClassifierMLPOCRClassifierMLPOCRClassifierMLPOCRClassifierMLPOCRClassifierMLP kann entweder mit create_ocr_class_mlpcreate_ocr_class_mlpCreateOcrClassMlpcreate_ocr_class_mlpCreateOcrClassMlpCreateOcrClassMlp
erstellt, oder mit read_ocr_class_mlpread_ocr_class_mlpReadOcrClassMlpread_ocr_class_mlpReadOcrClassMlpReadOcrClassMlp eingelesen werden.
Außerdem ist es möglich in OCRClassifierMLPOCRClassifierMLPOCRClassifierMLPOCRClassifierMLPOCRClassifierMLPOCRClassifierMLP einen Pfad zu einem
OCR Klassifikator zu übergeben, der mit write_ocr_class_mlpwrite_ocr_class_mlpWriteOcrClassMlpwrite_ocr_class_mlpWriteOcrClassMlpWriteOcrClassMlp
gespeichert wurde.
Bei Textmodellen mit ModeModeModeModeModemode = 'manual'"manual""manual""manual""manual""manual" müssen für die
Textsegmentierung geeignete Parameter wie die Höhe und Breite von Buchstaben
mittels set_text_model_paramset_text_model_paramSetTextModelParamset_text_model_paramSetTextModelParamSetTextModelParam gesetzt werden. In diesem Fall wird der
Wert von OCRClassifierMLPOCRClassifierMLPOCRClassifierMLPOCRClassifierMLPOCRClassifierMLPOCRClassifierMLP ignoriert.
Parameter des Textmodells werden mit set_text_model_paramset_text_model_paramSetTextModelParamset_text_model_paramSetTextModelParamSetTextModelParam gesetzt
und mit get_text_model_paramget_text_model_paramGetTextModelParamget_text_model_paramGetTextModelParamGetTextModelParam abgefragt.
Da beim Aufruf von create_text_model_readercreate_text_model_readerCreateTextModelReadercreate_text_model_readerCreateTextModelReaderCreateTextModelReader und folgenden Operationen
für das Textmodell Speicher allokiert wird, sollte das Modell mit
clear_text_modelclear_text_modelClearTextModelclear_text_modelClearTextModelClearTextModel freigegeben werden, sobald es nicht mehr benötigt
wird.
- Multithreading-Typ: reentrant (läuft parallel zu nicht-exklusiven Operatoren).
- Multithreading-Bereich: global (kann von jedem Thread aufgerufen werden).
- Wird ohne Parallelisierung verarbeitet.
Dieser Operator liefert ein Handle zurück. Es ist zu beachten, dass der Zustand einer Instanz dieses Handletyps durch bestimmte Operatoren geändert werden kann, obwohl das Handle als Eingabeparameter in diesen Operatoren verwendet wird.
Modus des Textmodells.
Defaultwert:
'auto'
"auto"
"auto"
"auto"
"auto"
"auto"
Werteliste: 'auto'"auto""auto""auto""auto""auto", 'manual'"manual""manual""manual""manual""manual"
OCR Klassifikator.
Defaultwert:
'Industrial_Rej.omc'
"Industrial_Rej.omc"
"Industrial_Rej.omc"
"Industrial_Rej.omc"
"Industrial_Rej.omc"
"Industrial_Rej.omc"
Wertevorschläge: 'Document_A-Z+_NoRej.omc'"Document_A-Z+_NoRej.omc""Document_A-Z+_NoRej.omc""Document_A-Z+_NoRej.omc""Document_A-Z+_NoRej.omc""Document_A-Z+_NoRej.omc", 'Document_A-Z+_Rej.omc'"Document_A-Z+_Rej.omc""Document_A-Z+_Rej.omc""Document_A-Z+_Rej.omc""Document_A-Z+_Rej.omc""Document_A-Z+_Rej.omc", 'Document_0-9A-Z_NoRej.omc'"Document_0-9A-Z_NoRej.omc""Document_0-9A-Z_NoRej.omc""Document_0-9A-Z_NoRej.omc""Document_0-9A-Z_NoRej.omc""Document_0-9A-Z_NoRej.omc", 'Document_0-9A-Z_Rej.omc'"Document_0-9A-Z_Rej.omc""Document_0-9A-Z_Rej.omc""Document_0-9A-Z_Rej.omc""Document_0-9A-Z_Rej.omc""Document_0-9A-Z_Rej.omc", 'Document_0-9_NoRej.omc'"Document_0-9_NoRej.omc""Document_0-9_NoRej.omc""Document_0-9_NoRej.omc""Document_0-9_NoRej.omc""Document_0-9_NoRej.omc", 'Document_0-9_Rej.omc'"Document_0-9_Rej.omc""Document_0-9_Rej.omc""Document_0-9_Rej.omc""Document_0-9_Rej.omc""Document_0-9_Rej.omc", 'Document_NoRej.omc'"Document_NoRej.omc""Document_NoRej.omc""Document_NoRej.omc""Document_NoRej.omc""Document_NoRej.omc", 'Document_Rej.omc'"Document_Rej.omc""Document_Rej.omc""Document_Rej.omc""Document_Rej.omc""Document_Rej.omc", 'DotPrint_A-Z+_NoRej.omc'"DotPrint_A-Z+_NoRej.omc""DotPrint_A-Z+_NoRej.omc""DotPrint_A-Z+_NoRej.omc""DotPrint_A-Z+_NoRej.omc""DotPrint_A-Z+_NoRej.omc", 'DotPrint_A-Z+_Rej.omc'"DotPrint_A-Z+_Rej.omc""DotPrint_A-Z+_Rej.omc""DotPrint_A-Z+_Rej.omc""DotPrint_A-Z+_Rej.omc""DotPrint_A-Z+_Rej.omc", 'DotPrint_0-9A-Z_NoRej.omc'"DotPrint_0-9A-Z_NoRej.omc""DotPrint_0-9A-Z_NoRej.omc""DotPrint_0-9A-Z_NoRej.omc""DotPrint_0-9A-Z_NoRej.omc""DotPrint_0-9A-Z_NoRej.omc", 'DotPrint_0-9A-Z_Rej.omc'"DotPrint_0-9A-Z_Rej.omc""DotPrint_0-9A-Z_Rej.omc""DotPrint_0-9A-Z_Rej.omc""DotPrint_0-9A-Z_Rej.omc""DotPrint_0-9A-Z_Rej.omc", 'DotPrint_0-9_NoRej.omc'"DotPrint_0-9_NoRej.omc""DotPrint_0-9_NoRej.omc""DotPrint_0-9_NoRej.omc""DotPrint_0-9_NoRej.omc""DotPrint_0-9_NoRej.omc", 'DotPrint_0-9_Rej.omc'"DotPrint_0-9_Rej.omc""DotPrint_0-9_Rej.omc""DotPrint_0-9_Rej.omc""DotPrint_0-9_Rej.omc""DotPrint_0-9_Rej.omc", 'DotPrint_0-9+_NoRej.omc'"DotPrint_0-9+_NoRej.omc""DotPrint_0-9+_NoRej.omc""DotPrint_0-9+_NoRej.omc""DotPrint_0-9+_NoRej.omc""DotPrint_0-9+_NoRej.omc", 'DotPrint_0-9+_Rej.omc'"DotPrint_0-9+_Rej.omc""DotPrint_0-9+_Rej.omc""DotPrint_0-9+_Rej.omc""DotPrint_0-9+_Rej.omc""DotPrint_0-9+_Rej.omc", 'DotPrint_NoRej.omc'"DotPrint_NoRej.omc""DotPrint_NoRej.omc""DotPrint_NoRej.omc""DotPrint_NoRej.omc""DotPrint_NoRej.omc", 'DotPrint_Rej.omc'"DotPrint_Rej.omc""DotPrint_Rej.omc""DotPrint_Rej.omc""DotPrint_Rej.omc""DotPrint_Rej.omc", 'HandWritten_0-9_NoRej.omc'"HandWritten_0-9_NoRej.omc""HandWritten_0-9_NoRej.omc""HandWritten_0-9_NoRej.omc""HandWritten_0-9_NoRej.omc""HandWritten_0-9_NoRej.omc", 'HandWritten_0-9_Rej.omc'"HandWritten_0-9_Rej.omc""HandWritten_0-9_Rej.omc""HandWritten_0-9_Rej.omc""HandWritten_0-9_Rej.omc""HandWritten_0-9_Rej.omc", 'Industrial_A-Z+_NoRej.omc'"Industrial_A-Z+_NoRej.omc""Industrial_A-Z+_NoRej.omc""Industrial_A-Z+_NoRej.omc""Industrial_A-Z+_NoRej.omc""Industrial_A-Z+_NoRej.omc", 'Industrial_A-Z+_Rej.omc'"Industrial_A-Z+_Rej.omc""Industrial_A-Z+_Rej.omc""Industrial_A-Z+_Rej.omc""Industrial_A-Z+_Rej.omc""Industrial_A-Z+_Rej.omc", 'Industrial_0-9A-Z_NoRej.omc'"Industrial_0-9A-Z_NoRej.omc""Industrial_0-9A-Z_NoRej.omc""Industrial_0-9A-Z_NoRej.omc""Industrial_0-9A-Z_NoRej.omc""Industrial_0-9A-Z_NoRej.omc", 'Industrial_0-9A-Z_Rej.omc'"Industrial_0-9A-Z_Rej.omc""Industrial_0-9A-Z_Rej.omc""Industrial_0-9A-Z_Rej.omc""Industrial_0-9A-Z_Rej.omc""Industrial_0-9A-Z_Rej.omc", 'Industrial_0-9_NoRej.omc'"Industrial_0-9_NoRej.omc""Industrial_0-9_NoRej.omc""Industrial_0-9_NoRej.omc""Industrial_0-9_NoRej.omc""Industrial_0-9_NoRej.omc", 'Industrial_0-9_Rej.omc'"Industrial_0-9_Rej.omc""Industrial_0-9_Rej.omc""Industrial_0-9_Rej.omc""Industrial_0-9_Rej.omc""Industrial_0-9_Rej.omc", 'Industrial_0-9+_NoRej.omc'"Industrial_0-9+_NoRej.omc""Industrial_0-9+_NoRej.omc""Industrial_0-9+_NoRej.omc""Industrial_0-9+_NoRej.omc""Industrial_0-9+_NoRej.omc", 'Industrial_0-9+_Rej.omc'"Industrial_0-9+_Rej.omc""Industrial_0-9+_Rej.omc""Industrial_0-9+_Rej.omc""Industrial_0-9+_Rej.omc""Industrial_0-9+_Rej.omc", 'Industrial_NoRej.omc'"Industrial_NoRej.omc""Industrial_NoRej.omc""Industrial_NoRej.omc""Industrial_NoRej.omc""Industrial_NoRej.omc", 'Industrial_Rej.omc'"Industrial_Rej.omc""Industrial_Rej.omc""Industrial_Rej.omc""Industrial_Rej.omc""Industrial_Rej.omc", 'OCRA_A-Z+_NoRej.omc'"OCRA_A-Z+_NoRej.omc""OCRA_A-Z+_NoRej.omc""OCRA_A-Z+_NoRej.omc""OCRA_A-Z+_NoRej.omc""OCRA_A-Z+_NoRej.omc", 'OCRA_A-Z+_Rej.omc'"OCRA_A-Z+_Rej.omc""OCRA_A-Z+_Rej.omc""OCRA_A-Z+_Rej.omc""OCRA_A-Z+_Rej.omc""OCRA_A-Z+_Rej.omc", 'OCRA_0-9A-Z_NoRej.omc'"OCRA_0-9A-Z_NoRej.omc""OCRA_0-9A-Z_NoRej.omc""OCRA_0-9A-Z_NoRej.omc""OCRA_0-9A-Z_NoRej.omc""OCRA_0-9A-Z_NoRej.omc", 'OCRA_0-9A-Z_Rej.omc'"OCRA_0-9A-Z_Rej.omc""OCRA_0-9A-Z_Rej.omc""OCRA_0-9A-Z_Rej.omc""OCRA_0-9A-Z_Rej.omc""OCRA_0-9A-Z_Rej.omc", 'OCRA_0-9_NoRej.omc'"OCRA_0-9_NoRej.omc""OCRA_0-9_NoRej.omc""OCRA_0-9_NoRej.omc""OCRA_0-9_NoRej.omc""OCRA_0-9_NoRej.omc", 'OCRA_0-9_Rej.omc'"OCRA_0-9_Rej.omc""OCRA_0-9_Rej.omc""OCRA_0-9_Rej.omc""OCRA_0-9_Rej.omc""OCRA_0-9_Rej.omc", 'OCRA_NoRej.omc'"OCRA_NoRej.omc""OCRA_NoRej.omc""OCRA_NoRej.omc""OCRA_NoRej.omc""OCRA_NoRej.omc", 'OCRA_Rej.omc'"OCRA_Rej.omc""OCRA_Rej.omc""OCRA_Rej.omc""OCRA_Rej.omc""OCRA_Rej.omc", 'OCRB_A-Z+_NoRej.omc'"OCRB_A-Z+_NoRej.omc""OCRB_A-Z+_NoRej.omc""OCRB_A-Z+_NoRej.omc""OCRB_A-Z+_NoRej.omc""OCRB_A-Z+_NoRej.omc", 'OCRB_A-Z+_Rej.omc'"OCRB_A-Z+_Rej.omc""OCRB_A-Z+_Rej.omc""OCRB_A-Z+_Rej.omc""OCRB_A-Z+_Rej.omc""OCRB_A-Z+_Rej.omc", 'OCRB_0-9A-Z_NoRej.omc'"OCRB_0-9A-Z_NoRej.omc""OCRB_0-9A-Z_NoRej.omc""OCRB_0-9A-Z_NoRej.omc""OCRB_0-9A-Z_NoRej.omc""OCRB_0-9A-Z_NoRej.omc", 'OCRB_0-9A-Z_Rej.omc'"OCRB_0-9A-Z_Rej.omc""OCRB_0-9A-Z_Rej.omc""OCRB_0-9A-Z_Rej.omc""OCRB_0-9A-Z_Rej.omc""OCRB_0-9A-Z_Rej.omc", 'OCRB_0-9_NoRej.omc'"OCRB_0-9_NoRej.omc""OCRB_0-9_NoRej.omc""OCRB_0-9_NoRej.omc""OCRB_0-9_NoRej.omc""OCRB_0-9_NoRej.omc", 'OCRB_0-9_Rej.omc'"OCRB_0-9_Rej.omc""OCRB_0-9_Rej.omc""OCRB_0-9_Rej.omc""OCRB_0-9_Rej.omc""OCRB_0-9_Rej.omc", 'OCRB_NoRej.omc'"OCRB_NoRej.omc""OCRB_NoRej.omc""OCRB_NoRej.omc""OCRB_NoRej.omc""OCRB_NoRej.omc", 'OCRB_Rej.omc'"OCRB_Rej.omc""OCRB_Rej.omc""OCRB_Rej.omc""OCRB_Rej.omc""OCRB_Rej.omc", 'OCRB_passport_NoRej.omc'"OCRB_passport_NoRej.omc""OCRB_passport_NoRej.omc""OCRB_passport_NoRej.omc""OCRB_passport_NoRej.omc""OCRB_passport_NoRej.omc", 'OCRB_passport_Rej.omc'"OCRB_passport_Rej.omc""OCRB_passport_Rej.omc""OCRB_passport_Rej.omc""OCRB_passport_Rej.omc""OCRB_passport_Rej.omc", 'Pharma_0-9A-Z_NoRej.omc'"Pharma_0-9A-Z_NoRej.omc""Pharma_0-9A-Z_NoRej.omc""Pharma_0-9A-Z_NoRej.omc""Pharma_0-9A-Z_NoRej.omc""Pharma_0-9A-Z_NoRej.omc", 'Pharma_0-9A-Z_Rej.omc'"Pharma_0-9A-Z_Rej.omc""Pharma_0-9A-Z_Rej.omc""Pharma_0-9A-Z_Rej.omc""Pharma_0-9A-Z_Rej.omc""Pharma_0-9A-Z_Rej.omc", 'Pharma_0-9_NoRej.omc'"Pharma_0-9_NoRej.omc""Pharma_0-9_NoRej.omc""Pharma_0-9_NoRej.omc""Pharma_0-9_NoRej.omc""Pharma_0-9_NoRej.omc", 'Pharma_0-9_Rej.omc'"Pharma_0-9_Rej.omc""Pharma_0-9_Rej.omc""Pharma_0-9_Rej.omc""Pharma_0-9_Rej.omc""Pharma_0-9_Rej.omc", 'Pharma_0-9+_NoRej.omc'"Pharma_0-9+_NoRej.omc""Pharma_0-9+_NoRej.omc""Pharma_0-9+_NoRej.omc""Pharma_0-9+_NoRej.omc""Pharma_0-9+_NoRej.omc", 'Pharma_0-9+_Rej.omc'"Pharma_0-9+_Rej.omc""Pharma_0-9+_Rej.omc""Pharma_0-9+_Rej.omc""Pharma_0-9+_Rej.omc""Pharma_0-9+_Rej.omc", 'Pharma_NoRej.omc'"Pharma_NoRej.omc""Pharma_NoRej.omc""Pharma_NoRej.omc""Pharma_NoRej.omc""Pharma_NoRej.omc", 'Pharma_Rej.omc'"Pharma_Rej.omc""Pharma_Rej.omc""Pharma_Rej.omc""Pharma_Rej.omc""Pharma_Rej.omc", 'SEMI_NoRej.omc'"SEMI_NoRej.omc""SEMI_NoRej.omc""SEMI_NoRej.omc""SEMI_NoRej.omc""SEMI_NoRej.omc", 'SEMI_Rej.omc'"SEMI_Rej.omc""SEMI_Rej.omc""SEMI_Rej.omc""SEMI_Rej.omc""SEMI_Rej.omc"
Neu erzeugtes Textmodell.
create_text_model_readercreate_text_model_readerCreateTextModelReadercreate_text_model_readerCreateTextModelReaderCreateTextModelReader gibt 2 (H_MSG_TRUE) zurück.
set_text_model_paramset_text_model_paramSetTextModelParamset_text_model_paramSetTextModelParamSetTextModelParam,
get_text_model_paramget_text_model_paramGetTextModelParamget_text_model_paramGetTextModelParamGetTextModelParam,
find_textfind_textFindTextfind_textFindTextFindText
clear_text_modelclear_text_modelClearTextModelclear_text_modelClearTextModelClearTextModel
OCR/OCV