Text und Zahlen lesen

Mit diesem Tool können Sie Text und Zahlen in einem Bild lesen. Mithilfe von easyTouch und easyTouch+ können Sie den zu lesenden Text interaktiv auswählen. easyTouch bestimmt die Parameterwerte zum Erkennen und Lesen des ausgewählten Textes automatisch. Sie können auch eine ROI (Region of Interest) über dem zu lesenden Text verwenden. Falls die ROI mehrere Textzeilen enthält, werden die einzelnen Textzeilen gelesen und in einem Tupel ausgegeben.

Im Gegensatz zum Tool Text und Zahlen lesen mittels Deep Learning erfordert dieses Tool eine trainierte Schriftart als Eingabe, um den Text zu lesen. Daher kann nur Text mit der vorgegebenen Schriftart gelesen werden. MERLIC umfasst bereits einige vorab trainierte Schriftarten. Sie können jedoch auch eine eigene Schriftartdatei verwenden. Darüber hinaus gibt es noch einige weitere Einschränkungen, die berücksichtigt werden müssen. So müssen z. B. mindestens zwei Zeichen in einer Textzeile vorhanden sein.

Welches Tool – „Text und Zahlen lesen“ oder „Text und Zahlen lesen mittels Deep Learning“ – für die jeweilige Anwendung am besten geeignet ist, hängt von verschiedenen Faktoren ab. Wenn Sie unsicher sind, welches der beiden Tools am besten für Ihre Anwendung geeignet ist, können Sie beide Tools testen und die Ergebnisse, die Verarbeitungszeit sowie andere für die jeweilige Anwendung relevante Faktoren vergleichen.

Im Allgemeinen eignet sich dieses Tool für Texte mit Schreibweise von links nach rechts sowie für Bilder, bei denen die Position des zu lesenden Textes bereits bekannt ist. Sie können dieses Tool auch zuerst ausprobieren, wenn Sie über die erforderliche vorab trainierte Schriftart verfügen, möglichst wenig Arbeitsspeicher beanspruchen möchten und die Verarbeitungszeit möglichst kurz sein soll.

Parameter

Standardparameter

Bild:

Dieser Parameter stellt das Eingabebild dar.

Bei der Verwendung eines Farbbilds als Eingabebild für dieses Tool wird nur der erste Kanal, d. h. der rote Kanal, für die Verarbeitung verwendet.

Schriftart:

Dieser Parameter bietet die Möglichkeit, eine Schriftart aus dem Kombinationsfeld auszuwählen. Alternativ können Sie über die Schaltfläche eine Schriftart aus einer Datei laden. Diese Schriftart wird zum Lesen des Textes verwendet.

Wert	Beschreibung
DotPrint.omc	Diese Schriftart ermöglicht das Lesen von Dot Prints.
Industrial.omc	Diese Schriftart ermöglicht das Lesen von normalem Text.
Universal.omc	Diese Schriftart ermöglicht das Lesen von normalem Text und Dot Print. Die Erkennungsrate von „Universal.omc“ kann kleiner sein als die Rate für „DotPrint.omc“ und „Industrial.omc“. Daher empfehlen wir, diese Schriftart nur dann einzusetzen, wenn unbekannt ist, ob es sich bei dem zu lesenden Text um normalen Text oder Dot Print handelt.
UniversalDeepLearning.occ	Diese Schriftart ermöglicht das Lesen von normalem Text und Dot Print. Sie basiert auf Deep Learning und wird im Vergleich mit anderen Schriftarten als robuster betrachtet. Standardmäßig wird diese Schriftart zum Lesen des Textes verwendet.

Wenn Sie eine eigene Schriftartdatei verwenden möchten, kopieren Sie die Schriftartdatei in das Verzeichnis ocr im MERLIC-Installationsverzeichnis. Die neue Schriftart wird dann im Dropdown-Menü des Parameters „Schriftart“ aufgeführt, sobald das Tool erneut geladen wird, d. h. beim Einfügen.

Dot Print:

Dieser Parameter gibt an, ob Zeichen als Punkte gedruckt werden (Dot Print). Die Standardeinstellung ist 0.

Wert	Beschreibung
0	Das Zeichen ist nicht als Dot Print gedruckt.
1	Das Zeichen ist als Dot Print gedruckt.

Zeichenbreite:

Dieser Parameter definiert die Breite der Zeichen. Der Wert bezieht sich auf einen Großbuchstaben. Er wird in Pixeln angegeben und ist standardmäßig auf 30 px festgelegt.

Wert	Beschreibung
30	Dies ist der Standardwert für die Zeichenbreite.
0 – 120	Dies ist der verfügbare Wertebereich zum Festlegen der Zeichenbreite.

Zeichenhöhe:

Dieser Parameter definiert die Höhe der Zeichen. Der Wert bezieht sich auf einen Großbuchstaben. Er wird in Pixeln angegeben und ist standardmäßig auf 55 px festgelegt.

Wert	Beschreibung
55	Dies ist der Standardwert für die Zeichenhöhe.
0 – 200	Dies ist der verfügbare Wertebereich zum Festlegen der Zeichenhöhe.

Zusätzliche Parameter

ROI:

Der Parameter „ROI“ definiert die ROI für die Erkennung von Text und Zahlen. Standardmäßig ist keine ROI definiert. Wenn Sie eine ROI für die Verarbeitung verwenden möchten, müssen Sie den Parameter mit einem geeigneten ROI-Ergebnis eines vorherigen Tools verbinden, damit eine ROI an dieses Tool übergeben wird, oder mit den verfügbaren ROI-Schaltflächen neue ROIs im Bild zeichnen. Alternativ können Sie easyTouch und easyTouch+ verwenden, um die zu lesenden Textteile und Zahlen zu erkennen. Um den Text herum wird dann automatisch eine ROI erstellt.

Ausrichtungsdaten:

Dieser Parameter stellt die Ausrichtungsdaten dar, die zum Ausrichten der ROI verwendet werden. Ausrichtungsdaten sind standardmäßig nicht verbunden, sodass keine Auswirkung sichtbar ist. Wenn Sie bestimmte Ausrichtungsdaten verwenden möchten, müssen Sie den Parameter mit einem geeigneten Ergebnis eines vorherigen Tools verbinden, z. B. Ausrichtungsdaten mit Matching bestimmen, Ausrichtungsdaten mittels geradem Rand bestimmen, Bild ausrichten oder Bild drehen.

Größentoleranz:

Dieser Parameter definiert die zulässige Größenabweichung der Zeichen von „Zeichenbreite“ oder „Zeichenhöhe“. Er wird in Prozent angegeben. Der Standardwert ist 120 %. Sie können die „Größentoleranz“ auf einen Wert von 0 bis 300 festlegen. Bei Einstellung auf 300 % können Zeichen eine Größe von 1/4 bis zum 4-fachen von „Zeichenbreite“ (oder „Zeichenhöhe“) aufweisen.

Wert	Beschreibung
120	Die Größe der zu lesenden Zeichen darf um 120 Prozent abweichen.
0 – 300	Dies ist der verfügbare Wertebereich zum Festlegen der Größentoleranz.

Zeicheneigenschaft:

Dieser Parameter definiert die Darstellung von Zeichen im Vergleich zum Hintergrund. Die Standardeinstellung ist „dunkel“.

Wert	Beschreibung
dunkel	Das Zeichen ist dunkel auf hellem Hintergrund.
hell	Das Zeichen ist hell auf dunklem Hintergrund.

Textstruktur:

Der Parameter „Textstruktur“ unterstützt nur proportionale Schriftarten, d. h. Schriftarten mit unterschiedlicher Zeichengröße. Möglicherweise funktioniert er nicht bei nichtproportionalen Schriftarten.

Dieser Parameter legt die Struktur eines Textes fest, d. h. wie die Zeichen gruppiert sind. Dieser Parameter ist hilfreich, wenn Texte immer in derselben Struktur erscheinen, z. B. wenn das Bild ein Datum enthält. In solch einem strukturierten Text erscheinen Zeichen in Blöcken einer bestimmten Länge. Dieser Wert enthält die Anzahl der Zeichen in jedem Block. Ist „Textstruktur“ also beispielsweise als „4 2 2“ definiert und der Parameter „Trennungszeichen“ lautet „-“, besteht der Text aus drei Blöcken, von denen der erste Block vier Zeichen enthält und der zweite und dritte Block jeweils zwei Zeichen enthalten. Die drei Blöcke werden durch das Zeichen „-“ getrennt.

Beispieltext zum Lesen: 2015-06-15

Ausdruck im Parameter „Textstruktur“: 4 2 2

Trennungszeichen:

Dieser Parameter legt fest, welche Trennungszeichen in einer Zeichenfolge erscheinen dürfen. Dieser Parameter ist hilfreich für strukturierten Text, z. B. beim Lesen eines Datums. In diesem Fall muss zunächst die „Textstruktur“ im entsprechenden Parameter definiert werden.

Beispieltext zum Lesen:2015-06-15

Das „Text“-Ergebnis wird ohne Trennzeichen ausgegeben: 20150615

Werden andere Trennzeichen als „.“ verwendet, z. B. „/“, müssen alle Trennzeichen im Parameter „Trennungszeichen“ definiert werden. Ist für „Trennungszeichen“ kein Wert festgelegt, kann in diesem Fall möglicherweise dennoch ein korrektes Ergebnis ausgegeben werden, weil das Tool die Information über die Anzahl der Zeichenblöcke bereits aus dem Parameter „Textstruktur“ gezogen hat, auch wenn das Trennzeichen nicht bekannt ist.

Strichstärke:

Dieser Parameter definiert die Strichstärke der Zeichen. Er wird in Pixeln angegeben und ist standardmäßig auf 12 px festgelegt.

Wert	Beschreibung
12	Dies ist der Standardwert für die Strichstärke eines Zeichens.
1 – 30	Dies ist der verfügbare Wertebereich zum Festlegen der Strichstärke.

Fehlgeschlagene Verarbeitung:

Dieser Parameter legt fest, welcher Wert im Ergebnis für „Text“ und „Konfidenz“ zurückgegeben wird, falls eine Zeichenfolge im Bild nicht gelesen werden kann. Der Parameter ist standardmäßig auf „ignorieren“ festgelegt.Sie können den Parameter an der entsprechenden Verbindungsstelle auf die folgenden Werte einstellen.

Wert	Beschreibung
ignorieren	Wenn eine der Zeichenfolgen im Bild nicht gelesen werden kann, passiert nichts.
-1	Dieser Wert stellt nur ein Beispiel dar. Sie können ihn direkt im Eingabefeld der Verbindungsstelle durch eine beliebige Zahl oder Zeichenfolge ersetzen, die ausgegeben werden soll, wenn ein Text nicht gelesen werden kann.
*	Dieser Wert stellt nur ein Beispiel dar. Sie können ihn direkt im Eingabefeld der Verbindungsstelle durch eine beliebige Zahl oder Zeichenfolge ersetzen, die ausgegeben werden soll, wenn ein Text nicht gelesen werden kann.

Kodierung:

Dieser Parameter definiert, welche Codierung zum Lesen von Text oder Zahlen verwendet wird. Der „Standard“-Wert bedeutet, dass „UTF-8“ als Codierungstyp verwendet wird.

Erweitern Sie die folgende Tabelle, um die Liste der unterstützten Codierungstypen anzuzeigen.

Liste der Codierungstypen

Codierungstyp
Standard (UTF-8)
Nativ (Codierung des Systems)
Big5
Big5-HKSCS
CP949
EUC-JP
EUC-KR
GB18030
HP-ROMAN8
IBM 850
IBM 866
IBM 874
ISO 2022-JP
ISO 8859-1
ISO 8859-2
ISO 8859-3
ISO 8859-4
ISO 8859-5
ISO 8859-6
ISO 8859-7
ISO 8859-8
ISO 8859-9
ISO 8859-10
ISO 8859-13
ISO 8859-14
ISO 8859-15
Iscii-Bng
Iscii-Dev
Iscii-Gjr
Iscii-Knd
Iscii-Mlm
Iscii-Ori
Iscii-Pnj
Iscii-Tlg
Iscii-Tml
KOI8-R
KOI8-U
Macintosh
Shift-JIS
TIS-620
TSCII
UTF-8
UTF-16
UTF-16BE
UTF-16LE
UTF-32
UTF-32BE
UTF-32LE
Windows-1250
Windows-1251
Windows-1252
Windows-1253
Windows-1254
Windows-1255
Windows-1256
Windows-1257
Windows-1258

Ergebnisse

Standardergebnisse

Text:

Dieses Ergebnis enthält den gelesenen Text und die gelesenen Zahlen. Die Ausgabe erfolgt als Zeichenfolge. Wurden mehrere Texteinträge oder Zahlen in mehreren ROIs gelesen, werden die Ergebnisse als Tupel ausgegeben.

Konfidenz:

Dieses Ergebnis gibt ein Tupel von Konfidenzwerten aus, die angeben, mit welcher Konfidenz ein Text gelesen wurde. Es wird für jede Textfolge im Bild ein Konfidenzwert ausgegeben. Die Werte werden in einem Tupel als reelle Zahlen ausgegeben. Wurde ein Text mit einer Konfidenz von 100 % gelesen, so wird der Wert 1 für die betreffende Region ausgegeben.

Toolstatus:

„Toolstatus“ gibt Informationen zum Status des Tools aus und kann daher für die Fehlerbehandlung verwendet werden. Weitere Informationen zu den verschiedenen Toolstatus-Ergebnissen finden Sie unter Toolstatus-Ergebnis.

Zusätzliche Ergebnisse

Extrahierte Zeichenregionen:

Dieses Ergebnis gibt die Region für jedes Zeichen an, die im Bild gelesen wurden.

Verarbeitungszeit:

Dieses Ergebnis gibt die Dauer der letzten Ausführung des Tools in Millisekunden aus. Das Ergebnis wird als zusätzliches Ergebnis bereitgestellt. Es ist daher standardmäßig ausgeblendet, kann aber über die Schaltfläche neben den Toolergebnissen angezeigt werden. Weitere Informationen finden Sie im Abschnitt Verarbeitungszeit in der Tool-Referenz-Übersicht.

Anwendungsbeispiele

Dieses Tool wird in den folgenden MERLIC-Vision-App-Beispielen verwendet:

read_lot_number_and_ECC200.mvapp
read_text_in_3d_height_image.mvapp