train_dl_classifier_batchT_train_dl_classifier_batchTrainDlClassifierBatchTrainDlClassifierBatch (Operator)

Name

train_dl_classifier_batchT_train_dl_classifier_batchTrainDlClassifierBatchTrainDlClassifierBatch — Ausführen eines Trainingsschrittes eines Deep Learning-basierten Klassifikators auf Basis eines Batches von Bildern.

Signatur

train_dl_classifier_batch(BatchImages : : DLClassifierHandle, BatchLabels : DLClassifierTrainResultHandle)

Beschreibung

train_dl_classifier_batchtrain_dl_classifier_batchTrainDlClassifierBatchTrainDlClassifierBatchTrainDlClassifierBatch führt einen Trainingsschritt für den Deep Learning-basierten Klassifikator in DLClassifierHandleDLClassifierHandleDLClassifierHandleDLClassifierHandleDLClassifierHandle aus, welcher zuvor mit read_dl_classifierread_dl_classifierReadDlClassifierReadDlClassifierReadDlClassifier eingelesen wurde. Bevor der Trainingsschritt ausgeführt werden kann, müssen die Klassen mittels set_dl_classifier_paramset_dl_classifier_paramSetDlClassifierParamSetDlClassifierParamSetDlClassifierParam gesetzt werden. Zudem empfiehlt es sich, für die Optimierung wichtige Hyperparameter wie die Lernrate und das Momentum mit set_dl_classifier_paramset_dl_classifier_paramSetDlClassifierParamSetDlClassifierParamSetDlClassifierParam zu setzen. Der Trainingsschritt für das Neuronale Netzwerk basiert auf den Daten eines einzelnen Batches aus dem Trainings-Datensatz, d.h. den Bilder BatchImagesBatchImagesBatchImagesBatchImagesbatchImages und zugehörigen Label BatchLabelsBatchLabelsBatchLabelsBatchLabelsbatchLabels. Dabei muss die Anzahl der Bilder des Batches mit der zuvor gesetzten Batchgröße übereinstimmen. Man beachte außerdem, dass die Bilder in BatchImagesBatchImagesBatchImagesBatchImagesbatchImages je nach gewähltem Netzwerk gewisse Voraussetzungen an beispielsweise der Bildgröße oder dem Grauwertbereich erfüllen muss. Für detailliertere Informationen siehe read_dl_classifierread_dl_classifierReadDlClassifierReadDlClassifierReadDlClassifier. Die Label in BatchImagesBatchImagesBatchImagesBatchImagesbatchImages können als Tupel von Klassennamen oder als Tupel von Indizes (von 0 startend) übergeben werden. Dabei geben die Indizes die jeweiligen Positionen der Label in dem Tupel der Klassen an, welches zuvor mit set_dl_classifier_paramset_dl_classifier_paramSetDlClassifierParamSetDlClassifierParamSetDlClassifierParam über 'classes'"classes""classes""classes""classes" gesetzt wurde. Informationen über die Resultate des Trainingsschrittes wie der Wert der Zielfunktion werden in DLClassifierTrainResultHandleDLClassifierTrainResultHandleDLClassifierTrainResultHandleDLClassifierTrainResultHandleDLClassifierTrainResultHandle gespeichert und können mit get_dl_classifier_train_resultget_dl_classifier_train_resultGetDlClassifierTrainResultGetDlClassifierTrainResultGetDlClassifierTrainResult abgefragt werden.

Man beachte, dass eine Epoche in der Regel aus mehreren Batches besteht und für ein erfolgreiches Training das Iterieren über mehrere Epochen notwendig ist. Daher muss der Operator train_dl_classifier_batchtrain_dl_classifier_batchTrainDlClassifierBatchTrainDlClassifierBatchTrainDlClassifierBatch mehrere Male mit unterschiedlichen Batches ausgeführt werden. Für einer detaillierte Erklärung siehe Deep Learning / Klassifikation.

Während des Trainingschrittes wird der Wert der Zielfunktion, der von dem Neuronalen Netzwerk auf Basis der Batch-Daten erreicht wird, mit einem nichtlinearen Optimierungsalgorithmus minimiert. Als Algorithmus wird ein stochastisches Gradientenabstiegsverfahren (SGD) verwendet. Dabei werden im Trainingsschritt die Gewichte des vorhergehenden Trainingsschrittes wie folgt auf aktualisiert:

Bei obiger Formel stehen für die Lernrate, für das Momentum und für das Klassifikationsergebnis des Deep Learning-basierten Klassifikators, welches von den Netzwerk Gewichten und dem Eingabe-Batch abhängt. Die Variable wird verwendet um die Wirkung des Momentums einfließen zu lassen. Als Zielfunktion wird der Multinomial Logistic Loss in Kombination mit einem quadratischen Regularisierungsterm verwendet:

Dabei kodiert der Vektor das Label des -ten Bildes des Batches welches -viele Bilder beinhaltet. Der Term ist als Vektor zu verstehen, der in jedem Eintrag den Logarithmus der Einträge von enthält. Der Regularisierungsterm besteht aus der gewichteten -Norm, die alle Gewichte außer Bias-Terme einbezieht. Der Einfluss der Regularisierung kann über gesteuert werden. In der obigen Formel steht für den Hyperparameter 'weight_prior'"weight_prior""weight_prior""weight_prior""weight_prior" und kann mit set_dl_classifier_paramset_dl_classifier_paramSetDlClassifierParamSetDlClassifierParamSetDlClassifierParam gesetzt werden.

Das Konzept der Deep Learning-basierten Klassifikation ist in der Einleitung zu Kapitel Deep Learning / Klassifikation beschrieben.

Achtung

Der Operator train_dl_classifier_batchtrain_dl_classifier_batchTrainDlClassifierBatchTrainDlClassifierBatchTrainDlClassifierBatch basiert auf Algorithmen, die in manchen Fällen nicht deterministisch sind. Daher können Ergebnisse von mehreren Aufrufen von train_dl_classifier_batchtrain_dl_classifier_batchTrainDlClassifierBatchTrainDlClassifierBatchTrainDlClassifierBatch trotz gleicher Eingabewerte leicht voneinander abweichen.

Um diesen Operator ausführen zu können, wird cuDNN benötigt. Für weitere Details wird auf den Installation Guide, Abschnitt Requirements for Deep Learning, verwiesen.

Ausführungsinformationen

Multithreading-Typ: reentrant (läuft parallel zu nicht-exklusiven Operatoren).
Multithreading-Bereich: global (kann von jedem Thread aufgerufen werden).
Wird ohne Parallelisierung verarbeitet.

Dieser Operator liefert ein Handle zurück. Es ist zu beachten, dass der Zustand einer Instanz dieses Handletyps durch bestimmte Operatoren geändert werden kann, obwohl das Handle als Eingabeparameter in diesen Operatoren verwendet wird.