do_ocr_word_mlpT_do_ocr_word_mlpDoOcrWordMlpDoOcrWordMlpdo_ocr_word_mlp (Operator)

Name

do_ocr_word_mlpT_do_ocr_word_mlpDoOcrWordMlpDoOcrWordMlpdo_ocr_word_mlp — Klassifikation einer Zeichengruppe mit einem OCR-Klassifikator.

Signatur

do_ocr_word_mlp(Character, Image : : OCRHandle, Expression, NumAlternatives, NumCorrections : Class, Confidence, Word, Score)

Beschreibung

do_ocr_word_mlpdo_ocr_word_mlpDoOcrWordMlpDoOcrWordMlpdo_ocr_word_mlp verhält sich wie do_ocr_multi_class_mlpdo_ocr_multi_class_mlpDoOcrMultiClassMlpDoOcrMultiClassMlpdo_ocr_multi_class_mlp, indem es mit dem durch OCRHandleOCRHandleOCRHandleOCRHandleocrhandle gegebenen OCR-Klassifikator zu den durch die Regionen CharacterCharacterCharactercharactercharacter und die Grauwerte ImageImageImageimageimage gegebenen Zeichen die jeweils beste Klasse berechnet, und die Klassen in ClassClassClassclassValclass und die zugehörigen Konfidenzen (Wahrscheinlichkeiten) der Klassen in ConfidenceConfidenceConfidenceconfidenceconfidence zurückgibt.

Im Gegensatz zu do_ocr_multi_class_mlpdo_ocr_multi_class_mlpDoOcrMultiClassMlpDoOcrMultiClassMlpdo_ocr_multi_class_mlp behandelt do_ocr_word_mlpdo_ocr_word_mlpDoOcrWordMlpDoOcrWordMlpdo_ocr_word_mlp die Zeichengruppe als eine Einheit, die durch Aneinanderhängen von Klassennamen für jedes einzelne Zeichen ein Wort WordWordWordwordword liefert. Dies ermöglicht die Einschränkung der erlaubten Klassifikationsergebnisse auf Textebene durch Angabe eines Ausdrucks ExpressionExpressionExpressionexpressionexpression, der das erwartete Wort beschreibt.

Ein Ausdruck kann das Wort auf ein festes Lexikon, welches zuvor durch create_lexiconcreate_lexiconCreateLexiconCreateLexiconcreate_lexicon oder import_lexiconimport_lexiconImportLexiconImportLexiconimport_lexicon erzeugt wurde, einschränken, indem der Name des Lexikons in spitzen Klammern wie in '<meinlexikon>'"<meinlexikon>""<meinlexikon>""<meinlexikon>""<meinlexikon>" angegeben wird. Ist der Ausdruck nicht von dieser Form, so wird er als regulärer Ausdruck mit derselben Syntax wie für tuple_regexp_matchtuple_regexp_matchTupleRegexpMatchTupleRegexpMatchtuple_regexp_match interpretiert. Bei Verwendung von Quantifikatoren wie '*' sollte man normalerweise mit einem Ausdruck der Form '^...'$'"$""$""$""$"' dafür sorgen, dass das gesamte Wort verwendet wird.

Im Gegensatz zu tuple_regexp_matchtuple_regexp_matchTupleRegexpMatchTupleRegexpMatchtuple_regexp_match erlaubt do_ocr_word_mlpdo_ocr_word_mlpDoOcrWordMlpDoOcrWordMlpdo_ocr_word_mlp keine Angabe von zusätzlichen Optionen für ExpressionExpressionExpressionexpressionexpression in einem Tupel.

Falls das aus den jeweils besten Klassen abgeleitete Wort dem Ausdruck nicht genügt, versucht do_ocr_word_mlpdo_ocr_word_mlpDoOcrWordMlpDoOcrWordMlpdo_ocr_word_mlp eine Korrektur durch Berücksichtigung der NumAlternativesNumAlternativesNumAlternativesnumAlternativesnum_alternatives besten Klassen für jedes Zeichen, so wie sie von do_ocr_single_class_mlpdo_ocr_single_class_mlpDoOcrSingleClassMlpDoOcrSingleClassMlpdo_ocr_single_class_mlp für ein einzelnes Zeichen bestimmt werden. Hierzu werden alle möglichen Korrekturen ausprobiert, bei denen die Klassifikation von höchstens NumCorrectionsNumCorrectionsNumCorrectionsnumCorrectionsnum_corrections Zeichenregionen geändert wird. Zu beachten ist hierbei, dass NumAlternativesNumAlternativesNumAlternativesnumAlternativesnum_alternatives und NumCorrectionsNumCorrectionsNumCorrectionsnumCorrectionsnum_corrections Auswirkungen auf die Komplexität des Algorithmus haben und daher in manchen Fällen intern beschränkt werden müssen. Für weitere Informationen siehe den Abschnitt 'Komplexität' weiter unten.

Falls der Ausdruck ein Lexikon beschreibt und die obige Prozedur nicht zum Erfolg führte, so wird das ähnlichste Wort aus dem Lexikon zurückgegeben, solange für die Korrektur weniger als NumCorrectionsNumCorrectionsNumCorrectionsnumCorrectionsnum_corrections Editieroperationen benötigt werden (siehe suggest_lexiconsuggest_lexiconSuggestLexiconSuggestLexiconsuggest_lexicon).

Das Ergebnis wird mit einem ScoreScoreScorescorescore zwischen 0.0 (keine Korrektur gefunden) und 1.0 (ursprüngliches Wort war schon korrekt) bewertet. Verringert wird der ScoreScoreScorescorescore durch das Anbringen einer Strafe entsprechend der Anzahl korrigierter Zeichen und einer (kleineren) Strafe für das Ignorieren von Klassen mit höherer Konfidenz um einen Ausdruck ExpressionExpressionExpressionexpressionexpression zu erhalten:

wobei num_corr die Anzahl tatsächlich angebrachter Korrekturen und num_alt die Anzahl ignorierter Alternativen ist.

Diese Bewertung ist rein kombinatorisch und berücksichtigt nicht die ursprünglichen Konfidenzen der besten Klassen.

Eine Zeichenkette des Zahlenwertes '\032'"\032""\032""\032""\032" (alternativ als '\0x1A'"\0x1A""\0x1A""\0x1A""\0x1A" dargestellt) im Resultat ClassClassClassclassValclass bedeutet, dass die Region als Rückweisungsklasse klassifiziert wurde.

Ausführungsinformationen

Multithreading-Typ: reentrant (läuft parallel zu nicht-exklusiven Operatoren).
Multithreading-Bereich: global (kann von jedem Thread aufgerufen werden).
Wird ohne Parallelisierung verarbeitet.

Parameter

CharacterCharacterCharactercharactercharacter (input_object) region(-array) → object

Zu erkennende Zeichen.

ImageImageImageimageimage (input_object) singlechannelimage → object (byte / uint2)

Grauwerte der Zeichen.

OCRHandleOCRHandleOCRHandleOCRHandleocrhandle (input_control) ocr_mlp → (handle)

Handle des OCR-Klassifikators.

ExpressionExpressionExpressionexpressionexpression (input_control) string → (string)

Ausdruck, der die erlaubte Wortstruktur beschreibt

NumAlternativesNumAlternativesNumAlternativesnumAlternativesnum_alternatives (input_control) integer → (integer)

Anzahl der Klassen pro Zeichen, die für die interne Wortkorrektur berücksichtigt werden.

Default: 3

Wertevorschläge: 3, 4, 5

Wertebereich: 1 ≤ NumAlternatives NumAlternatives NumAlternatives numAlternatives num_alternatives

NumCorrectionsNumCorrectionsNumCorrectionsnumCorrectionsnum_corrections (input_control) integer → (integer)

Maximale Anzahl der korrigierten Zeichen.

Default: 2

Wertevorschläge: 1, 2, 3, 4, 5

Wertebereich: 0 ≤ NumCorrections NumCorrections NumCorrections numCorrections num_corrections

ClassClassClassclassValclass (output_control) string(-array) → (string)

Ergebnis der Klassifikation der Zeichen durch das MLP.

Parameteranzahl: Class == Character

ConfidenceConfidenceConfidenceconfidenceconfidence (output_control) real(-array) → (real)

Konfidenz der Klasse der Zeichen.

Parameteranzahl: Confidence == Character

WordWordWordwordword (output_control) string → (string)

Text des Wortes nach Klassifikation und Korrektur.

ScoreScoreScorescorescore (output_control) real → (real)

Ähnlichkeitsmaß von korrigiertem Wort zum Original.

Komplexität

Die Komplexität des Prüfens aller möglichen Korrekturen hat die Größenordnung , wobei a die Anzahl der Alternativen, n die Anzahl der Zeichenregionen und c die Anzahl der erlaubten Korrekturen ist. Als Absicherung gegen quasi-unendliche Schleifen im Falle von großem n wird der Wert von c intern beschränkt auf 5, 3, oder 1, falls a*n >= 30, 60, bzw. 90.

Ergebnis

Sind die Parameterwerte korrekt, dann liefert do_ocr_word_mlpdo_ocr_word_mlpDoOcrWordMlpDoOcrWordMlpdo_ocr_word_mlp den Wert 2 ( H_MSG_TRUE) . Gegebenenfalls wird eine Fehlerbehandlung durchgeführt.

Vorgänger

trainf_ocr_class_mlptrainf_ocr_class_mlpTrainfOcrClassMlpTrainfOcrClassMlptrainf_ocr_class_mlp, read_ocr_class_mlpread_ocr_class_mlpReadOcrClassMlpReadOcrClassMlpread_ocr_class_mlp

Alternativen

do_ocr_multi_class_mlpdo_ocr_multi_class_mlpDoOcrMultiClassMlpDoOcrMultiClassMlpdo_ocr_multi_class_mlp

Siehe auch

create_ocr_class_mlpcreate_ocr_class_mlpCreateOcrClassMlpCreateOcrClassMlpcreate_ocr_class_mlp, classify_class_mlpclassify_class_mlpClassifyClassMlpClassifyClassMlpclassify_class_mlp

Modul

OCR/OCV

Operatoren