import_lexicon
— Erzeugen eines Lexikons aus einer Textdatei.
import_lexicon( : : Name, FileName : LexiconHandle)
import_lexicon
erzeugt ein neues Lexikon basierend auf einer
Liste von Wörtern in der Datei FileName
. Durch die Vergabe
eines eindeutigen Namens in Name
kann das Lexikon später
aus textuellen Ausdrücken heraus referenziert werden, wie z.B.
bei do_ocr_word_mlp
.
Die Unterstützung von Lexika in HALCON zielt derzeit nicht auf natürliche Sprachen ab, sondern auf OCR Applikationen, die lediglich zwischen einem begrenzten Satz von nicht mehr als einigen tausend gültigen Wörtern unterscheiden müssen, z.B. Länder- oder Produktnamen. Sind in der Lexikon-Datei Einträge mit Sonderzeichen enthalten, muss die Datei UTF-8-kodiert sein. Alte Dateien, die in der lokalen 8-Bit-Kodierung vorliegen, können allerdings weiterhin geladen werden, solange sie mindestens eine Bytefolge enthalten, die eindeutig nicht auch als UTF-8-Zeichen missinterpretiert werden könnte. MVTec selbst bietet keine fertigen Lexika an.
Dieser Operator liefert ein Handle zurück. Es ist zu beachten, dass der Zustand einer Instanz dieses Handletyps durch bestimmte Operatoren geändert werden kann, obwohl das Handle als Eingabeparameter in diesen Operatoren verwendet wird.
Name
(input_control) string →
(string)
Eindeutiger Name für das neue Lexikon.
Defaultwert: 'lex1'
FileName
(input_control) filename.read →
(string)
Name einer Textdatei mit Worten für das neue Lexikon.
Defaultwert: 'words.txt'
Dateiendung: .txt
LexiconHandle
(output_control) lexicon →
(handle)
Handle des Lexikons.
do_ocr_word_mlp
,
do_ocr_word_svm
lookup_lexicon
,
suggest_lexicon
OCR/OCV