KlassenKlassenKlassenKlassen | | | | Operatoren

do_ocr_word_knndo_ocr_word_knnDoOcrWordKnndo_ocr_word_knnDoOcrWordKnnDoOcrWordKnn (Operator)

Name

do_ocr_word_knndo_ocr_word_knnDoOcrWordKnndo_ocr_word_knnDoOcrWordKnnDoOcrWordKnn — Klassifikation einer Zeichengruppe mit einem OCR-Klassifikator.

Signatur

do_ocr_word_knn(Character, Image : : OCRHandle, Expression, NumAlternatives, NumCorrections : Class, Confidence, Word, Score)

Herror do_ocr_word_knn(const Hobject Character, const Hobject Image, const Hlong OCRHandle, const char* Expression, const Hlong NumAlternatives, const Hlong NumCorrections, char* Class, double* Confidence, char* Word, double* Score)

Herror T_do_ocr_word_knn(const Hobject Character, const Hobject Image, const Htuple OCRHandle, const Htuple Expression, const Htuple NumAlternatives, const Htuple NumCorrections, Htuple* Class, Htuple* Confidence, Htuple* Word, Htuple* Score)

Herror do_ocr_word_knn(Hobject Character, Hobject Image, const HTuple& OCRHandle, const HTuple& Expression, const HTuple& NumAlternatives, const HTuple& NumCorrections, char* Class, double* Confidence, char* Word, double* Score)

Herror do_ocr_word_knn(Hobject Character, Hobject Image, const HTuple& OCRHandle, const HTuple& Expression, const HTuple& NumAlternatives, const HTuple& NumCorrections, HTuple* Class, HTuple* Confidence, HTuple* Word, HTuple* Score)

HTuple HRegion::DoOcrWordKnn(const HImage& Image, const HOCRKnn& OCRHandle, const HTuple& Expression, const HTuple& NumAlternatives, const HTuple& NumCorrections, double* Confidence, char* Word, double* Score) const

HTuple HRegionArray::DoOcrWordKnn(const HImage& Image, const HOCRKnn& OCRHandle, const HTuple& Expression, const HTuple& NumAlternatives, const HTuple& NumCorrections, HTuple* Confidence, HTuple* Word, HTuple* Score) const

HTuple HOCRKnn::DoOcrWordKnn(const HRegionArray& Character, const HImage& Image, const HTuple& Expression, const HTuple& NumAlternatives, const HTuple& NumCorrections, HTuple* Confidence, HTuple* Word, HTuple* Score) const

void DoOcrWordKnn(const HObject& Character, const HObject& Image, const HTuple& OCRHandle, const HTuple& Expression, const HTuple& NumAlternatives, const HTuple& NumCorrections, HTuple* Class, HTuple* Confidence, HTuple* Word, HTuple* Score)

HTuple HRegion::DoOcrWordKnn(const HImage& Image, const HOCRKnn& OCRHandle, const HString& Expression, Hlong NumAlternatives, Hlong NumCorrections, HTuple* Confidence, HString* Word, double* Score) const

HString HRegion::DoOcrWordKnn(const HImage& Image, const HOCRKnn& OCRHandle, const HString& Expression, Hlong NumAlternatives, Hlong NumCorrections, double* Confidence, HString* Word, double* Score) const

HString HRegion::DoOcrWordKnn(const HImage& Image, const HOCRKnn& OCRHandle, const char* Expression, Hlong NumAlternatives, Hlong NumCorrections, double* Confidence, HString* Word, double* Score) const

HTuple HOCRKnn::DoOcrWordKnn(const HRegion& Character, const HImage& Image, const HString& Expression, Hlong NumAlternatives, Hlong NumCorrections, HTuple* Confidence, HString* Word, double* Score) const

HString HOCRKnn::DoOcrWordKnn(const HRegion& Character, const HImage& Image, const HString& Expression, Hlong NumAlternatives, Hlong NumCorrections, double* Confidence, HString* Word, double* Score) const

HString HOCRKnn::DoOcrWordKnn(const HRegion& Character, const HImage& Image, const char* Expression, Hlong NumAlternatives, Hlong NumCorrections, double* Confidence, HString* Word, double* Score) const

void HOperatorSetX.DoOcrWordKnn(
[in] IHUntypedObjectX* Character, [in] IHUntypedObjectX* Image, [in] VARIANT OCRHandle, [in] VARIANT Expression, [in] VARIANT NumAlternatives, [in] VARIANT NumCorrections, [out] VARIANT* Class, [out] VARIANT* Confidence, [out] VARIANT* Word, [out] VARIANT* Score)

VARIANT HRegionX.DoOcrWordKnn(
[in] IHImageX* Image, [in] IHOCRKnnX* OCRHandle, [in] BSTR Expression, [in] Hlong NumAlternatives, [in] Hlong NumCorrections, [out] VARIANT* Confidence, [out] BSTR* Word, [out] double* Score)

VARIANT HOCRKnnX.DoOcrWordKnn(
[in] IHRegionX* Character, [in] IHImageX* Image, [in] BSTR Expression, [in] Hlong NumAlternatives, [in] Hlong NumCorrections, [out] VARIANT* Confidence, [out] BSTR* Word, [out] double* Score)

static void HOperatorSet.DoOcrWordKnn(HObject character, HObject image, HTuple OCRHandle, HTuple expression, HTuple numAlternatives, HTuple numCorrections, out HTuple classVal, out HTuple confidence, out HTuple word, out HTuple score)

HTuple HRegion.DoOcrWordKnn(HImage image, HOCRKnn OCRHandle, string expression, int numAlternatives, int numCorrections, out HTuple confidence, out string word, out double score)

string HRegion.DoOcrWordKnn(HImage image, HOCRKnn OCRHandle, string expression, int numAlternatives, int numCorrections, out double confidence, out string word, out double score)

HTuple HOCRKnn.DoOcrWordKnn(HRegion character, HImage image, string expression, int numAlternatives, int numCorrections, out HTuple confidence, out string word, out double score)

string HOCRKnn.DoOcrWordKnn(HRegion character, HImage image, string expression, int numAlternatives, int numCorrections, out double confidence, out string word, out double score)

Beschreibung

do_ocr_word_knndo_ocr_word_knnDoOcrWordKnndo_ocr_word_knnDoOcrWordKnnDoOcrWordKnn verhält sich wie do_ocr_multi_class_knndo_ocr_multi_class_knnDoOcrMultiClassKnndo_ocr_multi_class_knnDoOcrMultiClassKnnDoOcrMultiClassKnn, indem es mit dem durch OCRHandleOCRHandleOCRHandleOCRHandleOCRHandleOCRHandle gegebenen OCR-Klassifikator zu den durch die Regionen CharacterCharacterCharacterCharacterCharactercharacter und die Grauwerte ImageImageImageImageImageimage gegebenen Zeichen die jeweils beste Klasse berechnet, und die Klassen in ClassClassClassClassClassclassVal und die zugehörigen Konfidenzen der Klassen in ConfidenceConfidenceConfidenceConfidenceConfidenceconfidence zurückgibt. Die Konfidenzen liegen zwischen 0.0 und 1.0. Je höher der Wert, desto sicherer ist die Klassifikation der einzelnen Zeichen.

Im Gegensatz zu do_ocr_multi_class_knndo_ocr_multi_class_knnDoOcrMultiClassKnndo_ocr_multi_class_knnDoOcrMultiClassKnnDoOcrMultiClassKnn behandelt do_ocr_word_knndo_ocr_word_knnDoOcrWordKnndo_ocr_word_knnDoOcrWordKnnDoOcrWordKnn die Zeichengruppe als eine Einheit, die durch Aneinanderhängen von Klassennamen für jedes einzelne Zeichen ein Wort WordWordWordWordWordword liefert. Dies ermöglicht die Einschränkung der erlaubten Klassifikationsergebnisse auf Textebene durch Angabe eines Ausdrucks ExpressionExpressionExpressionExpressionExpressionexpression, der das erwartete Wort beschreibt.

Ein Ausdruck kann das Wort auf ein festes Lexikon, welches zuvor durch create_lexiconcreate_lexiconCreateLexiconcreate_lexiconCreateLexiconCreateLexicon oder import_lexiconimport_lexiconImportLexiconimport_lexiconImportLexiconImportLexicon erzeugt wurde, einschränken, indem der Name des Lexikons in spitzen Klammern wie in '<meinlexikon>'"<meinlexikon>""<meinlexikon>""<meinlexikon>""<meinlexikon>""<meinlexikon>" angegeben wird. Hat der Ausdruck eine andere Form, so wird er als regulärer Ausdruck mit derselben Syntax wie für tuple_regexp_matchtuple_regexp_matchTupleRegexpMatchtuple_regexp_matchTupleRegexpMatchTupleRegexpMatch interpretiert. Bei Verwendung von Quantifikatoren wie '*' sollte man normalerweise mit einem Ausdruck der Form '^...'$'"$""$""$""$""$"' dafür sorgen, dass das gesamte Wort verwendet wird.

Im Gegensatz zu tuple_regexp_matchtuple_regexp_matchTupleRegexpMatchtuple_regexp_matchTupleRegexpMatchTupleRegexpMatch erlaubt do_ocr_word_knndo_ocr_word_knnDoOcrWordKnndo_ocr_word_knnDoOcrWordKnnDoOcrWordKnn keine Angabe von zusätzlichen Optionen für ExpressionExpressionExpressionExpressionExpressionexpression in einem Tupel.

Falls das aus den jeweils besten Klassen abgeleitete Wort dem Ausdruck nicht genügt, versucht do_ocr_word_knndo_ocr_word_knnDoOcrWordKnndo_ocr_word_knnDoOcrWordKnnDoOcrWordKnn eine Korrektur durch Berücksichtigung der NumAlternativesNumAlternativesNumAlternativesNumAlternativesNumAlternativesnumAlternatives besten Klassen für jedes Zeichen, so wie sie von do_ocr_single_class_knndo_ocr_single_class_knnDoOcrSingleClassKnndo_ocr_single_class_knnDoOcrSingleClassKnnDoOcrSingleClassKnn für ein einzelnes Zeichen bestimmt werden. Hierzu werden alle möglichen Korrekturen ausprobiert, bei denen die Klassifikation von höchstens NumCorrectionsNumCorrectionsNumCorrectionsNumCorrectionsNumCorrectionsnumCorrections Zeichenregionen geändert wird.

Falls der Ausdruck ein Lexikon beschreibt und die obige Prozedur nicht zum Erfolg führte, so wird das ähnlichste Wort aus dem Lexikon zurückgegeben, solange für die Korrektur weniger als NumCorrectionsNumCorrectionsNumCorrectionsNumCorrectionsNumCorrectionsnumCorrections Editieroperationen benötigt werden (siehe suggest_lexiconsuggest_lexiconSuggestLexiconsuggest_lexiconSuggestLexiconSuggestLexicon).

Das Ergebnis wird mit einer ScoreScoreScoreScoreScorescore zwischen 0.0 (keine Korrektur gefunden) und 1.0 (ursprüngliches Wort war schon korrekt) bewertet, welche im Wesentlichen von der Anzahl der korrigierten Zeichen bestimmt ist, aber auch kleinere Strafen für das Ignorieren der zweitbesten oder gar aller Klassen beinhaltet. Diese Bewertung ist rein kombinatorisch und berücksichtigt nicht die ursprünglichen Konfidenzen der besten Klassen.

Parallelisierung

Parameter

CharacterCharacterCharacterCharacterCharactercharacter (input_object)  region(-array) objectHRegionHRegionHRegionHRegionXHobject

Zu erkennende Zeichen.

ImageImageImageImageImageimage (input_object)  singlechannelimage objectHImageHImageHImageHImageXHobject (byte / uint2)

Grauwerte der Zeichen.

OCRHandleOCRHandleOCRHandleOCRHandleOCRHandleOCRHandle (input_control)  ocr_knn HOCRKnn, HTupleHTupleHOCRKnn, HTupleHOCRKnnX, VARIANTHtuple (integer) (IntPtr) (Hlong) (Hlong) (Hlong) (Hlong)

Handle des OCR-Klassifikators.

ExpressionExpressionExpressionExpressionExpressionexpression (input_control)  string HTupleHTupleHTupleVARIANTHtuple (string) (string) (HString) (char*) (BSTR) (char*)

Ausdruck, der die erlaubte Wortstruktur beschreibt

NumAlternativesNumAlternativesNumAlternativesNumAlternativesNumAlternativesnumAlternatives (input_control)  integer HTupleHTupleHTupleVARIANTHtuple (integer) (int / long) (Hlong) (Hlong) (Hlong) (Hlong)

Anzahl der Klassen pro Zeichen, die für die interne Wortkorrektur berücksichtigt werden.

Defaultwert: 3

Wertevorschläge: 3, 4, 5

Typischer Wertebereich: 1 ≤ NumAlternatives NumAlternatives NumAlternatives NumAlternatives NumAlternatives numAlternatives ≤ 5

NumCorrectionsNumCorrectionsNumCorrectionsNumCorrectionsNumCorrectionsnumCorrections (input_control)  integer HTupleHTupleHTupleVARIANTHtuple (integer) (int / long) (Hlong) (Hlong) (Hlong) (Hlong)

Maximale Anzahl der korrigierten Zeichen.

Defaultwert: 2

Wertevorschläge: 1, 2, 3, 4, 5

Typischer Wertebereich: 0 ≤ NumCorrections NumCorrections NumCorrections NumCorrections NumCorrections numCorrections ≤ 5

ClassClassClassClassClassclassVal (output_control)  string(-array) HTupleHTupleHTupleVARIANTHtuple (string) (string) (HString) (char*) (BSTR) (char*)

Ergebnis der Klassifikation der Zeichen durch das k-NN.

Parameteranzahl: Class == Character

ConfidenceConfidenceConfidenceConfidenceConfidenceconfidence (output_control)  real(-array) HTupleHTupleHTupleVARIANTHtuple (real) (double) (double) (double) (double) (double)

Konfidenz der Klasse der Zeichen.

Parameteranzahl: Confidence == Character

WordWordWordWordWordword (output_control)  string HTupleHTupleHTupleVARIANTHtuple (string) (string) (HString) (char*) (BSTR) (char*)

Text des Wortes nach Klassifikation und Korrektur.

ScoreScoreScoreScoreScorescore (output_control)  real HTupleHTupleHTupleVARIANTHtuple (real) (double) (double) (double) (double) (double)

Ähnlichkeitsmaß von korrigiertem Wort zum Original.

Komplexität

Die Komplexität des Prüfens aller möglichen Korrekturen hat die Größenordnung , wobei a die Anzahl der Alternativen, n die Anzahl der Zeichenregionen und c die Anzahl der erlaubten Korrekturen ist. Als Absicherung gegen quasi-unendliche Schleifen im Falle von großem n wird der Wert von c intern beschränkt auf 5, 3, oder 1, falls a*n >= 30, 60, bzw. 90.

Ergebnis

Sind die Parameterwerte korrekt, dann liefert do_ocr_word_knndo_ocr_word_knnDoOcrWordKnndo_ocr_word_knnDoOcrWordKnnDoOcrWordKnn den Wert 2 (H_MSG_TRUE). Gegebenenfalls wird eine Fehlerbehandlung durchgeführt.

Vorgänger

trainf_ocr_class_knntrainf_ocr_class_knnTrainfOcrClassKnntrainf_ocr_class_knnTrainfOcrClassKnnTrainfOcrClassKnn, read_ocr_class_knnread_ocr_class_knnReadOcrClassKnnread_ocr_class_knnReadOcrClassKnnReadOcrClassKnn

Alternativen

do_ocr_multi_class_knndo_ocr_multi_class_knnDoOcrMultiClassKnndo_ocr_multi_class_knnDoOcrMultiClassKnnDoOcrMultiClassKnn

Siehe auch

create_ocr_class_knncreate_ocr_class_knnCreateOcrClassKnncreate_ocr_class_knnCreateOcrClassKnnCreateOcrClassKnn, classify_class_knnclassify_class_knnClassifyClassKnnclassify_class_knnClassifyClassKnnClassifyClassKnn

Modul

OCR/OCV


KlassenKlassenKlassenKlassen | | | | Operatoren