Articles

Was sind Autoencoder?

On November 11, 2021 by admin

Eine sanfte Einführung in Autoencoder und ihre verschiedenen Anwendungen. Außerdem verwenden diese Tutorials tf.keras,die High-Level-Python-API von TensorFlow zum Erstellen und Trainieren von Deep Learning-Modellen.

Evans Tsai

Mar 9, 2019 – 16 min read

常常見到 Autoencoder 的變形以及應用，打算花幾篇的時間好好的研究一下，順便練習 Tensorflow.keras 的 API 使用。

Was ist Autoencoder
Typen von Autoencoder
Anwendung von Autoencoder
Implementierung
Große Beispiele
Abschluss

Schwierigkeit: ★ ★ ☆ ☆ ☆

後記: 由於 Tensorflow 2.0 alpha 已於 3/8號釋出，但此篇是在1月底完成的，故大家可以直接使用安裝使用看看，但需要更新至相對應的 CUDA10。

Was ist Autoencoder?

首先，什麼是 Autoencoder 呢? 不囉唆，先看圖吧！

Das ursprüngliche Konzept des Autoencoders ist sehr einfach: Man gibt Eingabedaten ein und erhält über ein neural-ähnliches Netzwerk genau die gleichen Daten wie die Eingabedaten.Der Encoder nimmt zunächst die Eingabedaten auf, komprimiert sie in einen kleiner dimensionierten Vektor Z und gibt diesen dann in den Decoder ein, um die ursprüngliche Größe von Z zu erhalten.Das hört sich einfach an, aber sehen wir uns doch einmal genauer an, ob es wirklich so einfach ist.

Kodierer:

Der Kodierer ist für die Komprimierung der ursprünglichen Eingabedaten in einen niedrigdimensionalen Vektor C verantwortlich. Dieses C, das wir gewöhnlich als Code, latenter Vektor oder Merkmalsvektor bezeichnen, aber ich bin gewohnt, es latenten Raum zu nennen, weil C ein verborgenes Merkmal darstellt.Der Encoder kann die Originaldaten in einen aussagekräftigen niedrigdimensionalen Vektor komprimieren, was bedeutet, dass der Autoencoder eine Dimensionalitätsreduktion hat, und die versteckte Schicht hat eine nicht-lineare Transformationsaktivierungsfunktion, so dass dieser Encoder wie eine leistungsstarke Version der PCA ist, da der Encoder nicht-lineare Transformationen durchführen kann.Dimensionsreduktion!

Decoder:

Der Decoder stellt den latenten Raum in den Eingabedaten so weit wie möglich wieder her, was eine Transformation der Merkmalsvektoren vom niedrigdimensionalen Raum in den höherdimensionalen Raum ist.

Wie misst man also, wie gut der Autoencoder funktioniert? Einfach durch den Vergleich der Ähnlichkeit der beiden ursprünglichen Eingabedaten mit den rekonstruierten Daten.Unsere Verlustfunktion kann also als …. geschrieben werden.

Verlustfunktion:

2-2. rekursive Autoencoder:

Dies ist ein Netz, das neuen Eingabetext mit latentem Raum aus anderen Eingaben kombiniert; der Zweck dieses Netzes ist die Gefühlsklassifizierung.Dies kann auch als eine Variante des Autoencoders angesehen werden, der den spärlichen Text während der Eingabe extrahiert und den latenten Raum findet, der wichtig ist.

Quelle: https://www.youtube.com/watch?v=FSKag11y8yI

2-Seq2Seq:

Sequence to Sequence ist ein generatives Modell, das sich seit einiger Zeit großer Beliebtheit erfreut. Es ist eine wunderbare Lösung für das Dilemma, dass RNN-Typen nicht in der Lage sind, mit unbestimmten Paaren umzugehen, und hat sich bei Themen wie Chatbot- und Texterstellung bewährt.Dies kann auch als eine Art Autoencoder-Architektur angesehen werden.

Anwendungen von Autoencoder

Nachdem wir uns die vielen und vielfältigen Variationen von Autoencoder angesehen haben, wollen wir sehen, wo Autoencoder sonst noch eingesetzt werden kann!

3-1. pretrained weight

Autoencoder kann auch für pretrain of weight verwendet werden, was bedeutet, dass das Modell einen besseren Startwert findet.Zum Beispiel, wenn wir das Ziel Modell wie Ziel zu vervollständigen. versteckte Schicht ist:, so dass am Anfang verwenden wir das Konzept der Autoencoder zu 784 Dimensionen eingeben, und der latente Raum in der Mitte ist 1000 Dimensionen, um die Pretrain ersten tun, so dass diese 1000 Dimensionen können gut behalten die EingabeDann entfernen wir die ursprüngliche Ausgabe und fügen die zweite Schicht hinzu, und so weiter.Auf diese Weise erhält das gesamte Modell einen besseren Startwert.

Huh! Wenn man 1000 Neuronen verwendet, um 784 Eingabedimensionen zu repräsentieren, bedeutet das dann nicht, dass man das Netzwerk einfach noch einmal kopieren muss? Was ist der Sinn einer Ausbildung? Ja, deshalb fügen wir bei einem Pre-Training wie diesem normalerweise den L1-Norm-Regulierer hinzu, damit die versteckte Schicht nicht noch einmal kopiert wird.