Name
select_charactersT_select_charactersSelectCharactersselect_charactersSelectCharactersSelectCharacters — Selektieren von Zeichen aus einer gegebenen Region.
select_characters(Region : RegionCharacters : DotPrint, StrokeWidth, CharWidth, CharHeight, Punctuation, DiacriticMarks, PartitionMethod, PartitionLines, FragmentDistance, ConnectFragments, ClutterSizeMax, StopAfter : )
Herror T_select_characters(const Hobject Region, Hobject* RegionCharacters, const Htuple DotPrint, const Htuple StrokeWidth, const Htuple CharWidth, const Htuple CharHeight, const Htuple Punctuation, const Htuple DiacriticMarks, const Htuple PartitionMethod, const Htuple PartitionLines, const Htuple FragmentDistance, const Htuple ConnectFragments, const Htuple ClutterSizeMax, const Htuple StopAfter)
Herror select_characters(Hobject Region, Hobject* RegionCharacters, const HTuple& DotPrint, const HTuple& StrokeWidth, const HTuple& CharWidth, const HTuple& CharHeight, const HTuple& Punctuation, const HTuple& DiacriticMarks, const HTuple& PartitionMethod, const HTuple& PartitionLines, const HTuple& FragmentDistance, const HTuple& ConnectFragments, const HTuple& ClutterSizeMax, const HTuple& StopAfter)
HRegion HRegion::SelectCharacters(const HTuple& DotPrint, const HTuple& StrokeWidth, const HTuple& CharWidth, const HTuple& CharHeight, const HTuple& Punctuation, const HTuple& DiacriticMarks, const HTuple& PartitionMethod, const HTuple& PartitionLines, const HTuple& FragmentDistance, const HTuple& ConnectFragments, const HTuple& ClutterSizeMax, const HTuple& StopAfter) const
HRegionArray HRegionArray::SelectCharacters(const HTuple& DotPrint, const HTuple& StrokeWidth, const HTuple& CharWidth, const HTuple& CharHeight, const HTuple& Punctuation, const HTuple& DiacriticMarks, const HTuple& PartitionMethod, const HTuple& PartitionLines, const HTuple& FragmentDistance, const HTuple& ConnectFragments, const HTuple& ClutterSizeMax, const HTuple& StopAfter) const
void SelectCharacters(const HObject& Region, HObject* RegionCharacters, const HTuple& DotPrint, const HTuple& StrokeWidth, const HTuple& CharWidth, const HTuple& CharHeight, const HTuple& Punctuation, const HTuple& DiacriticMarks, const HTuple& PartitionMethod, const HTuple& PartitionLines, const HTuple& FragmentDistance, const HTuple& ConnectFragments, const HTuple& ClutterSizeMax, const HTuple& StopAfter)
HRegion HRegion::SelectCharacters(const HString& DotPrint, const HString& StrokeWidth, const HTuple& CharWidth, const HTuple& CharHeight, const HString& Punctuation, const HString& DiacriticMarks, const HString& PartitionMethod, const HString& PartitionLines, const HString& FragmentDistance, const HString& ConnectFragments, Hlong ClutterSizeMax, const HString& StopAfter) const
HRegion HRegion::SelectCharacters(const char* DotPrint, const char* StrokeWidth, const HTuple& CharWidth, const HTuple& CharHeight, const char* Punctuation, const char* DiacriticMarks, const char* PartitionMethod, const char* PartitionLines, const char* FragmentDistance, const char* ConnectFragments, Hlong ClutterSizeMax, const char* StopAfter) const
void HOperatorSetX.SelectCharacters(
[in] IHUntypedObjectX* Region, [out] IHUntypedObjectX** RegionCharacters, [in] VARIANT DotPrint, [in] VARIANT StrokeWidth, [in] VARIANT CharWidth, [in] VARIANT CharHeight, [in] VARIANT Punctuation, [in] VARIANT DiacriticMarks, [in] VARIANT PartitionMethod, [in] VARIANT PartitionLines, [in] VARIANT FragmentDistance, [in] VARIANT ConnectFragments, [in] VARIANT ClutterSizeMax, [in] VARIANT StopAfter)
IHRegionX* HRegionX.SelectCharacters(
[in] BSTR DotPrint, [in] BSTR StrokeWidth, [in] VARIANT CharWidth, [in] VARIANT CharHeight, [in] BSTR Punctuation, [in] BSTR DiacriticMarks, [in] BSTR PartitionMethod, [in] BSTR PartitionLines, [in] BSTR FragmentDistance, [in] BSTR ConnectFragments, [in] Hlong ClutterSizeMax, [in] BSTR StopAfter)
static void HOperatorSet.SelectCharacters(HObject region, out HObject regionCharacters, HTuple dotPrint, HTuple strokeWidth, HTuple charWidth, HTuple charHeight, HTuple punctuation, HTuple diacriticMarks, HTuple partitionMethod, HTuple partitionLines, HTuple fragmentDistance, HTuple connectFragments, HTuple clutterSizeMax, HTuple stopAfter)
HRegion HRegion.SelectCharacters(string dotPrint, string strokeWidth, HTuple charWidth, HTuple charHeight, string punctuation, string diacriticMarks, string partitionMethod, string partitionLines, string fragmentDistance, string connectFragments, int clutterSizeMax, string stopAfter)
select_charactersselect_charactersSelectCharactersselect_charactersSelectCharactersSelectCharacters selektiert aus der gegebenen RegionRegionRegionRegionRegionregion
die Bereiche, die Zeichen darstellen. Hierfür werden Eigenschaften wie
StrokeWidthStrokeWidthStrokeWidthStrokeWidthStrokeWidthstrokeWidth, DotPrintDotPrintDotPrintDotPrintDotPrintdotPrint, die Größe der Zeichen und einige
weitere verwendet.
Die übergebene RegionRegionRegionRegionRegionregion sollte vereinigt sein, da ansonsten jede
RegionRegionRegionRegionRegionregion einzeln verarbeitet wird. Aus diesem Grund sollte der
Operator connectionconnectionConnectionconnectionConnectionConnection nicht vorher aufgerufen werden.
Sollten mehrere Textbereiche vorhanden sein, so können diese
selbstverständlich ohne vorheriges Zusammenfügen der Regionen behandelt
werden. Die übergebene RegionRegionRegionRegionRegionregion wird typischerweise vom Operator
segment_characterssegment_charactersSegmentCharacterssegment_charactersSegmentCharactersSegmentCharacters geliefert, sie kann jedoch auch von anderen
Segmentierungsoperatoren bereitgestellt werden.
Der Prozess zur Auswahl der Zeichen kann in vier Schritte unterteilt werden.
Jeder Verarbeitungsschritt wird durch die Parameter StrokeWidthStrokeWidthStrokeWidthStrokeWidthStrokeWidthstrokeWidth,
CharHeightCharHeightCharHeightCharHeightCharHeightcharHeight und CharWidthCharWidthCharWidthCharWidthCharWidthcharWidth beeinflusst.
Wenn kleine Objekte wie Punkte verloren gehen, dann sollte die minimale
CharWidthCharWidthCharWidthCharWidthCharWidthcharWidth und die minimale CharHeightCharHeightCharHeightCharHeightCharHeightcharHeight angepasst werden.
Die Ergebnisse der einzelnen Schritte sind allerdings von manchen
Parametern besonders abhängig. Eine nähere Beschreibung folgt.
Mit dem Parameter StopAfterStopAfterStopAfterStopAfterStopAfterstopAfter kann die Verarbeitung nach einem
bestimmten Schritt beendet werden.
Der erste Schritt ist 'step1_select_candidates'"step1_select_candidates""step1_select_candidates""step1_select_candidates""step1_select_candidates""step1_select_candidates". In diesem Schritt
werden CharWidthCharWidthCharWidthCharWidthCharWidthcharWidth und CharHeightCharHeightCharHeightCharHeightCharHeightcharHeight verwendet, um die
Kandidaten auszuwählen. Zusätzlich beeinflusst ClutterSizeMaxClutterSizeMaxClutterSizeMaxClutterSizeMaxClutterSizeMaxclutterSizeMax das
Ergebnis von diesem Schritt.
Im nächsten Schritt, 'step2_partition_characters'"step2_partition_characters""step2_partition_characters""step2_partition_characters""step2_partition_characters""step2_partition_characters", nehmen die
Parameter PartitionMethodPartitionMethodPartitionMethodPartitionMethodPartitionMethodpartitionMethod und PartitionLinesPartitionLinesPartitionLinesPartitionLinesPartitionLinespartitionLines Einfluss
auf das Ergebnis.
Schritt drei, 'step3_connect_fragments'"step3_connect_fragments""step3_connect_fragments""step3_connect_fragments""step3_connect_fragments""step3_connect_fragments", verwendet die Parameter
ConnectFragmentsConnectFragmentsConnectFragmentsConnectFragmentsConnectFragmentsconnectFragments und DotPrintDotPrintDotPrintDotPrintDotPrintdotPrint. Sollen Dot-Prints gelesen
werden und manche Punkte werden nicht zu den Zeichen hinzugefügt, so gibt es
zwei Möglichkeiten, dieses Problem zu beheben. Zum einen kann man den Wert des
Parameter FragmentDistanceFragmentDistanceFragmentDistanceFragmentDistanceFragmentDistancefragmentDistance erhöhen und/oder die StrokeWidthStrokeWidthStrokeWidthStrokeWidthStrokeWidthstrokeWidth
herunter setzen.
Im letzten Schritt, 'step4_select_characters'"step4_select_characters""step4_select_characters""step4_select_characters""step4_select_characters""step4_select_characters", beeinflussen die
Parameter DiacriticMarksDiacriticMarksDiacriticMarksDiacriticMarksDiacriticMarksdiacriticMarks und PunctuationPunctuationPunctuationPunctuationPunctuationpunctuation das Ergebnis.
RegionCharactersRegionCharactersRegionCharactersRegionCharactersRegionCharactersregionCharacters:
Nach dem Ausführen enthält RegionCharactersRegionCharactersRegionCharactersRegionCharactersRegionCharactersregionCharacters die extrahierten Zeichen
von der übergebenen RegionRegionRegionRegionRegionregion.
DotPrintDotPrintDotPrintDotPrintDotPrintdotPrint:
Sollte auf 'true'"true""true""true""true""true" gesetzt werden, wenn Dot-Prints gelesen werden
sollen, ansonsten auf 'false'"false""false""false""false""false".
StrokeWidthStrokeWidthStrokeWidthStrokeWidthStrokeWidthstrokeWidth:
Spezifiziert die Strichstärke des Textes und wird zur Bestimmung von
Filtergrößen für die Zeichendetektion verwendet. Die Filtergrößen werden
auch durch die Parameter DotPrintDotPrintDotPrintDotPrintDotPrintdotPrint, die durchschnittliche
Zeichenbreite CharWidthCharWidthCharWidthCharWidthCharWidthcharWidth und die durchschnittliche Zeichenhöhe
CharHeightCharHeightCharHeightCharHeightCharHeightcharHeight festgelegt.
CharWidthCharWidthCharWidthCharWidthCharWidthcharWidth:
Dieser Parameter kann durch ein Tupel, welches bis zu drei Werten besitzen
kann, gesetzt werden. Der erste Wert ist die durchschnittliche Breite,
der zweite ist die minimale und der dritte die maximale Zeichenbreite.
Wenn die minimale Zeichenbreite auf -1 gesetzt wird, berechnet der Operator
den Wert automatisch in Abhängigkeit von der durchschnittlichen
Zeichenbreite. Das gleiche gilt für den Fall, dass der maximale Wert nicht
gesetzt wird. Einige Beispiele:
[10] setzt die durchschnittliche Zeichenbreite auf 10, die
minimale und maximale Zeichenbreite werden vom Operator berechnet.
[10,-1,20] setzt die durchschnittliche Zeichenbreite auf 10, der minimale
Wert wird vom Operator bestimmt und der maximale auf 20 gesetzt.
[10,5,20] setzt die durchschnittliche Zeichenbreite auf 10, der minimale
Wert wird auf 5 und der maximale Wert auf 20 gesetzt.
CharHeightCharHeightCharHeightCharHeightCharHeightcharHeight:
Dieser Parameter kann durch ein Tupel, welches bis zu drei Werten besitzen
kann, gesetzt werden. Der erste Wert ist die durchschnittliche Höhe, der
zweite ist die minimale und der dritte die maximale Zeichenhöhe.
Wenn die minimale Zeichenhöhe auf -1 gesetzt wird, berechnet der Operator
den Wert automatisch in Abhängigkeit von der durchschnittlichen Zeichenhöhe.
Das gleiche gilt für den Fall, dass der maximale Wert nicht gesetzt wird.
Einige Beispiele:
[10] setzt die durchschnittliche Zeichenhöhe auf 10, die minimale
und maximale Zeichenhöhe werden vom Operator berechnet.
[10,-1,20] setzt die durchschnittliche Zeichenhöhe auf 10, der minimale
Wert wird vom Operator bestimmt und der maximale auf 20 gesetzt.
[10,5,20] setzt die durchschnittliche Zeichenhöhe auf 10, der minimale
Wert wird auf 5 und der maximale Wert auf 20 gesetzt.
PunctuationPunctuationPunctuationPunctuationPunctuationpunctuation:
Dieser Parameter sollte auf 'true'"true""true""true""true""true" gesetzt werden, wenn der
Operator Satzzeichen (wie .,:'´") detektieren soll, ansonsten werden
diese unterdrückt.
DiacriticMarksDiacriticMarksDiacriticMarksDiacriticMarksDiacriticMarksdiacriticMarks:
Dieser Parameter sollte auf 'true'"true""true""true""true""true" gesetzt werden, wenn die
Anwendung diakritisches Zeichen (wie â,é,ö) enthält oder auf
'false'"false""false""false""false""false" um diese zu unterdrücken.
PartitionMethodPartitionMethodPartitionMethodPartitionMethodPartitionMethodpartitionMethod:
Benachbarte Zeichen, welche sehr dicht nebeneinander gedruckt wurden,
können teilweise nicht getrennt detektiert werden. Mit diesem Parameter
kann die Methode zum Trennen dieser Zeichen festgelegt werden. Die
möglichen Werte sind 'none'"none""none""none""none""none", wodurch kein Auftrennen
durchgeführt wird. 'fixed_width'"fixed_width""fixed_width""fixed_width""fixed_width""fixed_width" bedeutet, dass die Auftrennung
davon ausgeht, dass alle Zeichen gleich breit sind. Falls die Breite
der extrahierten Region merklich über der durchschnittlichen
Zeichenbreite liegt, wird die Region in Teile getrennt, welche dann die
durchschnittliche Zeichenbreite besitzen. Das Aufteilen beginnt an der
linken Seite der Region.
'variable_width'"variable_width""variable_width""variable_width""variable_width""variable_width" bedeutet, dass die Zeichen an ihrer dünnsten
Verbindung getrennt werden. Diese Methode kann für Fonts mit
unterschiedlich breiten Zeichen ausgewählt werden, oder falls viele
aufeinanderfolgende Zeichen als eines extrahiert werden.
Es könnte hilfreich sein, text_line_slanttext_line_slantTextLineSlanttext_line_slantTextLineSlantTextLineSlant und/oder
text_line_orientationtext_line_orientationTextLineOrientationtext_line_orientationTextLineOrientationTextLineOrientation auszuführen, bevor select_charactersselect_charactersSelectCharactersselect_charactersSelectCharactersSelectCharacters
aufgerufen wird.
PartitionLinesPartitionLinesPartitionLinesPartitionLinesPartitionLinespartitionLines:
Wenn einige Textzeilen oder einige Zeichen von unterschiedlichen
Textzeilen verbunden sind, sollte dieser Parameter auf 'true'"true""true""true""true""true"
gesetzt werden.
FragmentDistanceFragmentDistanceFragmentDistanceFragmentDistanceFragmentDistancefragmentDistance:
Dieser Parameter beeinflusst die Verknüpfung von Zeichenfragmenten und
Zeichen. Wenn zu viel verbunden wird, sollte der Parameter auf
'narrow'"narrow""narrow""narrow""narrow""narrow" oder 'medium'"medium""medium""medium""medium""medium" gesetzt werden. Im Fall dass
mehr Fragmente verbunden werden sollen, sollte der Parameter auf
'medium'"medium""medium""medium""medium""medium" oder 'wide'"wide""wide""wide""wide""wide" gesetzt werden.
Das Verbinden wird außerdem vom Maximum von CharWidthCharWidthCharWidthCharWidthCharWidthcharWidth und
dem Maximum von CharHeightCharHeightCharHeightCharHeightCharHeightcharHeight beeinflusst. Siehe auch
ConnectFragmentsConnectFragmentsConnectFragmentsConnectFragmentsConnectFragmentsconnectFragments.
ConnectFragmentsConnectFragmentsConnectFragmentsConnectFragmentsConnectFragmentsconnectFragments
Dieser Parameter sollte auf 'true'"true""true""true""true""true" gesetzt werden, wenn
die extrahierten Zeichen fragmentiert sind, zum Beispiel wenn ein
Zeichen nicht als ein Zeichen detektiert wird, sondern in mehrere
Einzelteile zerfällt. Weitere Infos findet man unter
FragmentDistanceFragmentDistanceFragmentDistanceFragmentDistanceFragmentDistancefragmentDistance und StopAfterStopAfterStopAfterStopAfterStopAfterstopAfter im Schritt
'step3_connect_fragments'"step3_connect_fragments""step3_connect_fragments""step3_connect_fragments""step3_connect_fragments""step3_connect_fragments".
ClutterSizeMaxClutterSizeMaxClutterSizeMaxClutterSizeMaxClutterSizeMaxclutterSizeMax:
Sollten die segmentierten Zeichen Störungen enthalten, zum Beispiel
kleine Regionen neben den Zeichen, sollte dieser Wert erhöht werden.
Wenn Teile der Zeichen fehlen, dann sollte dieser Wert verkleinert
werden.
StopAfterStopAfterStopAfterStopAfterStopAfterstopAfter:
Dieser Parameter sollte verwendet werden, wenn select_charactersselect_charactersSelectCharactersselect_charactersSelectCharactersSelectCharacters
nicht das gewünschte Ergebnis liefert. Durch Modifizieren des Parameters
wird bestimmt, nach welchem Schritt der Operator die Ausführung beendet und
es werden die dazugehörigen Ergebnisse geliefert. Um den Operator nicht
abzubrechen sollte StopAfterStopAfterStopAfterStopAfterStopAfterstopAfter auf 'completion'"completion""completion""completion""completion""completion" gesetzt
werden.
- Multithreading-Typ: reentrant (läuft parallel zu nicht-exklusiven Operatoren).
- Multithreading-Bereich: global (kann von jedem Thread aufgerufen werden).
- Automatisch parallelisiert auf Tupelebene.
Region mit Textzeilen, in der die Zeichen segmentiert
werden sollen.
Sollen Dot-Print-Zeichen detektiert werden?
Defaultwert:
'false'
"false"
"false"
"false"
"false"
"false"
Werteliste: 'false'"false""false""false""false""false", 'true'"true""true""true""true""true"
Strichstärke der Zeichen.
Defaultwert:
'medium'
"medium"
"medium"
"medium"
"medium"
"medium"
Werteliste: 'bold'"bold""bold""bold""bold""bold", 'light'"light""light""light""light""light", 'medium'"medium""medium""medium""medium""medium", 'ultra_light'"ultra_light""ultra_light""ultra_light""ultra_light""ultra_light"
Breite eines Zeichens.
Defaultwert: 25
Typischer Wertebereich: 1
≤
CharWidth
CharWidth
CharWidth
CharWidth
CharWidth
charWidth
Restriktion: CharWidth >= 1
Höhe eines Zeichens.
Defaultwert: 25
Typischer Wertebereich: 1
≤
CharHeight
CharHeight
CharHeight
CharHeight
CharHeight
charHeight
Restriktion: CharHeight >= 1
Satzzeichen hinzufügen?
Defaultwert:
'false'
"false"
"false"
"false"
"false"
"false"
Werteliste: 'false'"false""false""false""false""false", 'true'"true""true""true""true""true"
Sind diakritsche Zeichen vorhanden?
Defaultwert:
'false'
"false"
"false"
"false"
"false"
"false"
Werteliste: 'false'"false""false""false""false""false", 'true'"true""true""true""true""true"
Methode zum Trennen von benachbarten Zeichen.
Defaultwert:
'none'
"none"
"none"
"none"
"none"
"none"
Werteliste: 'fixed_width'"fixed_width""fixed_width""fixed_width""fixed_width""fixed_width", 'none'"none""none""none""none""none", 'variable_width'"variable_width""variable_width""variable_width""variable_width""variable_width"
Sollen Zeilen getrennt werden?
Defaultwert:
'false'
"false"
"false"
"false"
"false"
"false"
Werteliste: 'false'"false""false""false""false""false", 'true'"true""true""true""true""true"
Abstand von Fragmenten.
Defaultwert:
'medium'
"medium"
"medium"
"medium"
"medium"
"medium"
Werteliste: 'medium'"medium""medium""medium""medium""medium", 'narrow'"narrow""narrow""narrow""narrow""narrow", 'wide'"wide""wide""wide""wide""wide"
Sollen Fragmente zusammmengefügt werden?
Defaultwert:
'false'
"false"
"false"
"false"
"false"
"false"
Werteliste: 'false'"false""false""false""false""false", 'true'"true""true""true""true""true"
Maximaler Größe von Störungen.
Defaultwert: 0
Typischer Wertebereich: 0
≤
ClutterSizeMax
ClutterSizeMax
ClutterSizeMax
ClutterSizeMax
ClutterSizeMax
clutterSizeMax
Restriktion: 0 < ClutterSizeMax
Beende die Ausführung nach diesem Schritt.
Defaultwert:
'completion'
"completion"
"completion"
"completion"
"completion"
"completion"
Werteliste: 'completion'"completion""completion""completion""completion""completion", 'step1_select_candidates'"step1_select_candidates""step1_select_candidates""step1_select_candidates""step1_select_candidates""step1_select_candidates", 'step2_partition_characters'"step2_partition_characters""step2_partition_characters""step2_partition_characters""step2_partition_characters""step2_partition_characters", 'step3_connect_fragments'"step3_connect_fragments""step3_connect_fragments""step3_connect_fragments""step3_connect_fragments""step3_connect_fragments", 'step4_select_characters'"step4_select_characters""step4_select_characters""step4_select_characters""step4_select_characters""step4_select_characters"
read_image (Image, 'dot_print_rotated/dot_print_rotated_'+J$'02d')
text_line_orientation (Image, Image, 50, rad(-30), rad(30), OrientationAngle)
rotate_image (Image, ImageRotate, -OrientationAngle/rad(180)*180, 'constant')
segment_characters (ImageRotate, ImageRotate, ImageForeground, \
RegionForeground, 'local_auto_shape', 0, 0, 'medium', \
25, 25, 0, 10, UsedThreshold)
select_characters (RegionForeground, RegionCharacters, 1, 'ultra_light', \
[60,1,100], [60,1,100], 0, 0, 'none', 1, 'wide', 1, 0, \
'completion')
Sind die Eingabeparameter korrekt besetzt, dann liefert
select_charactersselect_charactersSelectCharactersselect_charactersSelectCharactersSelectCharacters den Wert 2 (H_MSG_TRUE).
Andernfalls wird eine Fehlerbehandlung durchgeführt.
segment_characterssegment_charactersSegmentCharacterssegment_charactersSegmentCharactersSegmentCharacters,
text_line_slanttext_line_slantTextLineSlanttext_line_slantTextLineSlantTextLineSlant
do_ocr_singledo_ocr_singleDoOcrSingledo_ocr_singleDoOcrSingleDoOcrSingle,
do_ocr_multido_ocr_multiDoOcrMultido_ocr_multiDoOcrMultiDoOcrMulti
connectionconnectionConnectionconnectionConnectionConnection
Foundation