Umělé neuronové sítě (ANN) ve strojovém učení – Data Science Central
On 24 září, 2021 by adminUmělé neuronové sítě – úvod
Umělé neuronové sítě (ANN) neboli neuronové sítě jsou výpočetní algoritmy.
Jsou určeny k simulaci chování biologických systémů složených z „neuronů“. ANN jsou výpočetní modely inspirované centrální nervovou soustavou živočichů. Je schopen strojového učení i rozpoznávání vzorů. Jsou prezentovány jako systémy vzájemně propojených „neuronů“, které mohou vypočítávat hodnoty ze vstupů.
Nervová síť je orientovaný graf. Skládá se z uzlů, které v biologické analogii představují neurony, propojené oblouky. To odpovídá dendritům a synapsím. Každý oblouk je spojen s váhou, zatímco u každého uzlu. Použijte hodnoty přijaté jako vstup do uzlu a definujte aktivační funkci podél příchozích oblouků, upravenou váhami oblouků.
Neuronová síť je algoritmus strojového učení založený na modelu lidského neuronu. Lidský mozek se skládá z milionů neuronů. Vysílá a zpracovává signály ve formě elektrických a chemických signálů. Tyto neurony jsou propojeny speciální strukturou známou jako synapse. Synapse umožňují neuronům předávat si signály. Z velkého počtu simulovaných neuronů vznikají neuronové sítě.
Umělá neuronová síť je technika zpracování informací. Funguje podobně jako lidský mozek při zpracování informací. ANN zahrnuje velké množství propojených výpočetních jednotek, které spolupracují při zpracování informací. Na jejich základě také generují smysluplné výsledky.
Neurální síť můžeme použít nejen pro klasifikaci. Lze ji použít i pro regresi spojitých cílových atributů.
Neuronové sítě nacházejí velké uplatnění při dolování dat, které se používá v různých odvětvích. Například v ekonomii, kriminalistice atd. a pro rozpoznávání vzorů. Po pečlivém tréninku ji lze použít i pro klasifikaci velkého množství dat.
Neuronová síť může obsahovat tyto 3 vrstvy:
- Vstupní vrstva – Aktivita vstupních jednotek představuje surové informace, které mohou do sítě vstupovat.
- Skrytá vrstva – Pro určení aktivity každé skryté jednotky. Aktivity vstupních jednotek a váhy na spojeních mezi vstupními a skrytými jednotkami. Může existovat jedna nebo více skrytých vrstev.
- Výstupní vrstva – Chování výstupních jednotek závisí na činnosti skrytých jednotek a vahách mezi skrytými a výstupními jednotkami.
Vrstvy umělé neuronové sítě
Umělá neuronová síť je obvykle uspořádána do vrstev. Vrstvy se skládají z mnoha vzájemně propojených „uzlů“, které obsahují „aktivační funkci“. Neuronová síť může obsahovat následující 3 vrstvy:
a. Vstupní vrstva
Účelem vstupní vrstvy je přijímat jako vstup hodnoty vysvětlujících atributů pro každé pozorování. Obvykle je počet vstupních uzlů ve vstupní vrstvě roven počtu vysvětlujících proměnných. ‚Vstupní vrstva‘ předkládá síti vzory, které komunikují s jednou nebo více ‚skrytými vrstvami‘.
Uzly vstupní vrstvy jsou pasivní, což znamená, že nemění data. Na svém vstupu přijímají jedinou hodnotu a duplikují ji do mnoha svých výstupů. Ze vstupní vrstvy duplikuje každou hodnotu a posílá ji do všech skrytých uzlů.
b. Skrytá vrstva
Skryté vrstvy aplikují dané transformace na vstupní hodnoty uvnitř sítě. V ní se ke každému uzlu připojují příchozí oblouky, které jdou z jiných skrytých uzlů nebo ze vstupních uzlů. Spojuje se s vycházejícími oblouky do výstupních uzlů nebo do jiných skrytých uzlů. Ve skryté vrstvě se vlastní zpracování provádí prostřednictvím systému vážených „spojení“. Může existovat jedna nebo více skrytých vrstev. Hodnoty vstupující do skrytého uzlu se násobí váhami, souborem předem určených čísel uložených v programu. Poté se vážené vstupy sečtou a vznikne jediné číslo.
c. Výstupní vrstva
Skryté vrstvy pak navazují na „výstupní vrstvu“. Výstupní vrstva přijímá spojení ze skrytých vrstev nebo ze vstupní vrstvy. Vrací výstupní hodnotu, která odpovídá predikci proměnné odezvy. V klasifikačních problémech je obvykle pouze jeden výstupní uzel. Aktivní uzly výstupní vrstvy kombinují a mění data tak, aby vznikly výstupní hodnoty.
Schopnost neuronové sítě poskytovat užitečnou manipulaci s daty spočívá ve správném výběru vah. Tím se liší od běžného zpracování informací.
Struktura neuronové sítě
Struktura neuronové sítě se také označuje jako její „architektura“ nebo „topologie“. Skládá se z počtu vrstev, elementárních jednotek. Skládá se také z mechanismu nastavení vah Interconchangend. Volba struktury určuje výsledky, kterých se dosáhne. Je to nejkritičtější část implementace neuronové sítě.
Nejjednodušší struktura je ta, ve které jsou jednotky rozmístěny ve dvou vrstvách: Vstupní vrstva a výstupní vrstva. Každá jednotka ve vstupní vrstvě má jeden vstup a jeden výstup, který se rovná vstupu. Výstupní jednotka má ke svému vstupu připojeny všechny jednotky vstupní vrstvy s kombinační funkcí a přenosovou funkcí. Může existovat více než 1 výstupní jednotka. V tomto případě je výsledným modelem lineární nebo logistická regrese. to podle toho, zda je přenosová funkce lineární, nebo logistická. Váhy sítě jsou regresní koeficienty.
Přidáním 1 nebo více skrytých vrstev mezi vstupní a výstupní vrstvu a jednotek v této vrstvě se zvyšuje predikční schopnost neuronové sítě. Počet skrytých vrstev by však měl být co nejmenší. Tím je zajištěno, že neuronová síť neukládá všechny informace z učící se množiny, ale může je zobecnit, aby nedošlo k nadměrnému přizpůsobení.
K nadměrnému přizpůsobení může dojít. K němu dochází, když váhy způsobí, že se systém naučí detaily učící se množiny, místo aby objevil struktury. K tomu dochází, když je velikost učící se množiny příliš malá ve vztahu ke složitosti modelu.
Skrytá vrstva je přítomna nebo ne, výstupní vrstva sítě může mít někdy mnoho jednotek, když je třeba předpovídat mnoho tříd.
Výhody a nevýhody neuronových sítí
Podívejme se na několik výhod a nevýhod neuronových sítí:
- Neuronové sítě dobře pracují s lineárními i nelineárními daty, ale častou kritikou neuronových sítí, zejména v robotice, je, že pro reálné fungování vyžadují velkou rozmanitost tréninku. Je tomu tak proto, že každý učící se stroj potřebuje dostatek reprezentativních příkladů, aby zachytil základní strukturu, která mu umožňuje zobecňovat na nové případy.
- Neuronové sítě fungují, i když jedna nebo několik málo jednotek nereaguje na síť, ale pro implementaci velkých a efektivních softwarových neuronových sítí je třeba vyčlenit mnoho výpočetních a úložných zdrojů. Zatímco mozek má hardware přizpůsobený úkolu zpracovávat signály prostřednictvím grafu neuronů, simulace i té nejjednodušší formy na Von Neumannově technologii může nutit návrháře neuronové sítě vyplnit miliony řádků databáze pro její spojení – což může spotřebovat obrovské množství počítačové paměti a místa na pevném disku.
- Neuronové sítě se učí z analyzovaných dat a nevyžadují přeprogramování, ale jsou označovány jako modely „černé skříňky“ a poskytují jen velmi málo informací o tom, co tyto modely skutečně dělají. Uživatel je musí pouze nakrmit vstupem a sledovat, jak se trénují, a čekat na výstup.
Závěr
ANN jsou považovány za jednoduché matematické modely, které vylepšují stávající technologie analýzy dat. I když se nedají srovnávat s výkonem lidského mozku, přesto jsou základním stavebním kamenem umělé inteligence.
.
Napsat komentář