Articles

Co to są Autoenkodery?

On 11 listopada, 2021 by admin

Łagodne wprowadzenie do Autoenkodera i jego różnych zastosowań. Ponadto, te tutoriale używają tf.keras,wysokopoziomowe API TensorFlow w Pythonie do budowania i trenowania modeli głębokiego uczenia.

.1478>

Evans Tsai

Mar 9, 2019 – 16 min read

常常見到 Autoencoder 的變形以及應用，打算花幾篇的時間好好的研究一下，順便練習 Tensorflow.keras 的 API 使用。

Co to jest Autoencoder
Typy Autoencodera
Zastosowanie Autoencodera
Implementacja
Wspaniałe przykłady
Wnioski

Trudność: ★ ★ ☆ ☆

後記: 由於 Tensorflow 2.0 alpha 已於 3/8號釋出，但此篇是在1月底完成的，故大家可以直接使用安裝使用看看，但需要更新至相對應的 CUDA10。

Co to jest Autoencoder?

首先，什麼是 Autoencoder 呢? 不囉唆，先看圖吧！

.Oryginalna koncepcja Autoencodera jest bardzo prosta, polega na wrzuceniu danych wejściowych i otrzymaniu dokładnie takich samych danych jak dane wejściowe poprzez sieć neuronową.Koder najpierw przyjmuje dane wejściowe, kompresuje je do wektora o mniejszym wymiarze Z, a następnie wprowadza Z do dekodera, aby przywrócić Z do jego oryginalnego rozmiaru.Brzmi to łatwo, ale przyjrzyjmy się temu bliżej i sprawdźmy, czy jest to takie proste.

.Koder:

Enkoder jest odpowiedzialny za kompresję oryginalnych danych wejściowych do niskowymiarowego wektora C. Ten C, który zwykle nazywamy kodem, wektorem ukrytym lub wektorem cech, ale ja jestem przyzwyczajony do nazywania go przestrzenią ukrytą, ponieważ C reprezentuje ukrytą cechę.Encoder może skompresować oryginalne dane do znaczącego wektora niskowymiarowego, co oznacza, że Autoencoder ma redukcję wymiarowości, a warstwa ukryta ma nieliniową transformację aktywacji fukcji, więc ten Encoder jest jak potężna wersja PCA, ponieważ Encoder może zrobić nielinioweredukcja wymiarów!

Dekoder:

To co robi Dekoder to przywrócenie przestrzeni ukrytej z powrotem do danych wejściowych tak bardzo jak to możliwe, co jest transformacją wektorów cech z przestrzeni o niższym wymiarze do przestrzeni o wyższym wymiarze.

Więc jak mierzysz jak dobrze działa Autoencoder ! Po prostu poprzez porównanie podobieństwa dwóch oryginalnych danych wejściowych z danymi zrekonstruowanymi.Zatem nasza funkcja straty może być zapisana jako ….

Funkcja straty:

2-2. autokodery rekursywne:

Jest to sieć, która łączy nowy tekst wejściowy z przestrzenią ukrytą z innych wejść, celem tej sieci jest klasyfikacja sentymentu.Może to być również postrzegane jako wariant Autoencoder, który wyodrębnia nieliczbowy tekst w trakcie jego wpisywania i znajduje przestrzeń ukrytą, która jest istotna.

Źródło: https://www.youtube.com/watch?v=FSKag11y8yI

2-Seq2Seq:

Sequence to Sequence jest modelem generatywnym, który od jakiegoś czasu cieszy się dużą popularnością. Jest to wspaniałe rozwiązanie dylematu typów RNN, które nie są w stanie poradzić sobie z nieokreślonymi parami, i dobrze sprawdził się w tematach takich jak chatbot i generowanie tekstu.Może to być również postrzegane jako rodzaj architektury Autoencodera.

Aplikacje Autoencodera

Po przyjrzeniu się wielu i różnorodnym odmianom Autoencodera, zobaczmy gdzie jeszcze Autoencoder może być użyty!

3-1. Model pretrained weight

Autoencoder może być również użyty do pretrain of weight, co oznacza, że model znajduje lepszą wartość początkową.Na przykład, gdy chcemy zakończyć model docelowy, taki jak cel. ukryta warstwa jest:, więc na początku używamy koncepcji autoenkodera do wprowadzenia 784 wymiarów, a przestrzeń ukryta w środku jest 1000 wymiarów, aby zrobić wstępne szkolenie pierwszy, więc te 1000 wymiarów może dobrze zachować dane wejściowe.Następnie usuwamy oryginalne wyjście i dodajemy drugą warstwę, i tak dalej.W ten sposób cały model uzyska lepszą wartość początkową.

Huh! Jest pewna dziwna część… jeśli używasz 1000 neuronów do reprezentowania 784 wymiarów wejściowych, czy nie oznacza to, że sieć musi być po prostu skopiowana od nowa? Jaki jest sens szkolenia? Tak, dlatego w takim treningu wstępnym zazwyczaj dodajemy regularyzator normy L1, aby warstwa ukryta nie była kopiowana od nowa.

Według Pana Li Hongyi.W przeszłości częściej stosowano taką metodę do szkolenia wstępnego, ale obecnie, ze względu na wzrost umiejętności szkoleniowych, nie ma już potrzeby stosowania tej metody.Ale jeśli masz bardzo mało danych z etykietami, ale dużo nieoznakowanych danych, możesz użyć tej metody do wstępnego treningu wag, ponieważ Autoencoder sam w sobie jest metodą uczenia bez nadzoru, używamy nieoznakowanych danych, aby uzyskać wstępny trening wag, a następnie używamy nieoznakowanych danych, aby uzyskać wstępny trening wag.Używamy nieoznakowanych danych, aby uzyskać wstępne wytrenowanie wag, a następnie używamy oznakowanych danych, aby dostroić wagi, tak aby uzyskać dobry model.Aby uzyskać więcej szczegółów, zobacz wideo pana Li, jest to bardzo dobrze wyjaśnione!

3-2. segmentacja obrazu

Model Unet, który właśnie widzieliśmy, spójrzmy na to jeszcze raz, ponieważ jest to w zasadzie najczęstszy problem wykrywania wad w tajwańskim przemyśle wytwórczym.

Najpierw musimy oznaczyć dane wejściowe, które będą naszym wyjściem. To co musimy zrobić, to skonstruować sieć, wprowadzić oryginalny obraz (po lewej, zdjęcia rentgenowskie zębów) i wygenerować wyjście (po prawej, klasyfikacja struktury zęba).W tym przypadku, koder & dekodera będzie warstwą konwolucji z silną oceną graficzną, wydobywając znaczące cechy i dekonwolucję z powrotem w dekoderze, aby uzyskać wynik segmentacji.

3-3. wideo na tekst

Dla problemu z podpisem do obrazu, takiego jak ten, używamy modelu sekwencji na sekwencję, gdzie dane wejściowe są zbiorem zdjęć, a dane wyjściowe są tekstem opisującym te zdjęcia.Model sekwencji do sekwencji używa LSTM + Conv net jako kodera & dekodera, który może opisać sekwencję sekwencyjnych działań & używając jądra CNN do ekstrakcji przestrzeni ukrytej wymaganej w obrazie.ale to zadanie jest bardzo trudne do wykonania, więc pozwolę ci spróbować, jeśli jesteś zainteresowany!

3-4. Image Retrieval

Image Retrieval Rzeczą do zrobienia jest wprowadzenie obrazu i próba znalezienia najbliższego dopasowania, ale jeśli porównasz pikselowo, to naprawdę łatwo jestJeśli użyjesz Autoencoder, aby najpierw skompresować obraz do przestrzeni ukrytej, a następnie obliczyć podobieństwo na przestrzeni ukrytej obrazu, wynik będzie znacznie lepszy.Wynik jest znacznie lepszy, ponieważ każdy wymiar w przestrzeni ukrytej może reprezentować pewną cechę.Jeśli odległość jest obliczana na przestrzeni ukrytej, rozsądnie jest znaleźć podobne obrazy.W szczególności, byłby to świetny sposób na uczenie bez nadzoru, bez etykietowania danych!

Na przestrzeni utajonej oblicz odległość

a samym modelem i Conv_AENie ma różnicy między samym modelem a Conv_AE, z wyjątkiem tego, że podczas dopasowania musi być zmieniony na

denoise_AE.fit(train_images_noise, train_images, epochs=100, batch_size=128, shuffle=True)

, aby przywrócić oryginalny noise_data do oryginalnych danych wejściowych

Archives

Categories

Co to są Autoenkodery?

Łagodne wprowadzenie do Autoenkodera i jego różnych zastosowań. Ponadto, te tutoriale używają tf.keras,wysokopoziomowe API TensorFlow w Pythonie do budowania i trenowania modeli głębokiego uczenia.

Trudność: ★ ★ ☆ ☆

Co to jest Autoencoder?

.Koder:

Dekoder:

Funkcja straty:

Typy AutoEncodera

2-1. Unet:

2-2. autokodery rekursywne:

2-Seq2Seq:

Aplikacje Autoencodera

3-1. Model pretrained weight

3-2. segmentacja obrazu

3-4. Image Retrieval

3-5. wykrywanie anomalii

.Implementacja

4-1. Utwórz model – Vallina_AE:

Load data &model preprocess

Create a Model – Vallina_AE:

Kompilacja modelu & trening

4-2. Tworzenie modelu- Conv_AE:

4-3. Utwórz model – denoise_AE:

Wspaniałe przykłady

Zakończenie

Dodaj komentarz Anuluj pisanie odpowiedzi

Archiwa

Meta