Articles

O que são Autoencoders?

On Novembro 11, 2021 by admin

Uma introdução suave ao Autoencoder e suas várias aplicações. Além disso, estes tutoriais usam tf.keras,TensorFlow API de alto nível Python API para construir e treinar modelos de aprendizagem profunda.

Evans Tsai

Mar 9, 2019 – 16 min. lido

4310>

常常見到 Autoencoder 的變形以及應用，打算花幾篇的時間好好的研究一下，順便練習 Tensorflow.keras 的 API 使用。

O que é o Autoencoder
Tipos de Autoencoder
Aplicação do Autoencoder
Implantação
Grandes exemplos
Conclusão

Dificuldade: ★ ★ ☆ ☆ ☆ ☆

後記: 由於 Tensorflow 2.0 alfa 已於 3/8號釋出，但此篇是在1月底完成的，故大家可以直接使用安裝使用看看，但需要更新至相對應的 CUDA10。

O que é o Autoencoder?

首先，什麼是 Autoencoder 呢? 不囉唆，先看圖吧！

O conceito original do Autoencoder é muito simples, é lançar um dado de entrada e obter exatamente os mesmos dados que os dados de entrada através de uma rede do tipo neural.O codificador primeiro recebe os dados de entrada, comprime-os num vector Z de dimensão menor e depois introduz o Z no descodificador para restaurar o Z ao seu tamanho original.Isto parece fácil, mas vamos dar uma olhada mais de perto e ver se é assim tão fácil.

Encoder:

Encoder é responsável por comprimir os dados de entrada originais num vector C de baixa dimensão. Este C, a que costumamos chamar código, vector latente ou vector de característica, mas estou habituado a chamar-lhe espaço latente, porque o C representa uma característica oculta.O codificador pode comprimir os dados originais em um vetor significativo de baixa dimensão, o que significa que o Autoencoder tem redução de dimensionalidade, e a camada oculta tem fuction de ativação de transformação não-linear, então este codificador é como uma versão poderosa do PCA, porque o codificador pode fazerredução de dimensão!

Descodificador:

O que o Descodificador faz é restaurar ao máximo o espaço latente de volta aos dados de entrada, o que é uma transformação dos vectores de características do espaço dimensional inferior para o espaço dimensional superior.

Então como você mede o quão bem o Autoencoder está funcionando ! Simplesmente comparando a semelhança dos dois dados de entrada originais com os dados reconstruídos.Assim, a nossa função de perda pode ser escrita como ….

Perda de função:

Porque queremos minimizar a diferença entre osO AutoEncoder é treinado usando a retropropagação para atualizar os pesos, assim como uma rede neural normal.actualizar os pesos.

Para resumir, Autoencoder é ….
1. uma arquitetura de modelo muito comum, também comumente usada para aprendizagem não supervisionada
2. pode ser usada como um método de redução de dimensão para não-linear
3. pode ser usada para aprender a representação de dados, com transformações de características representativas

Neste ponto, deve ser fácil entender como é o Autoencoder, a arquitetura é muito simples, então vamos dar uma olhada nas suas transformações!

Tipos de Autoencoder

Depois de explicar os princípios básicos do AutoEncoder, é hora de dar uma olhada no uso estendido e avançado do Autoencoder, para que você possa ver o uso extensivo do Autoencoder!

2-1. Unet:

Unet pode ser usado como um dos meios de segmentação de imagem, e a arquitetura Unet pode ser vista como uma variante do Autoencoder.

2-2. Autoencoders Recursivos:

Esta é uma rede que combina novo texto de entrada com espaço latente de outras entradas, o propósito desta rede é a classificação dos sentimentos.Isto também pode ser visto como uma variante do Autoencoder, que extrai o texto esparso à medida que é digitado e encontra o espaço latente que é importante.