A százalékok kijátszása
On november 7, 2021 by adminA mesterséges intelligencia (AI) általános értelemben a gépek által demonstrált intelligencia. Ez a definíció azt jelzi, hogy a mesterséges intelligencia számos témakört felölel. Például egy meglehetősen egyszerű, elektronikus áramkörökkel megvalósított algoritmus is AI-nak tekinthető, amint a rendszer intelligens viselkedést kezd mutatni (pl. ha a gép hőmérséklete elér egy bizonyos küszöbértéket, a gép tudja, hogy magától le kell kapcsolnia).
A mesterséges intelligencia fejlődése lehetővé tette, hogy a technológia mélytanulást, képfelismerést és beszédfelismerést végezzen. Bár a mesterséges intelligencia kutatása már az 1940-es évek óta létezik, a számítási teljesítmény fejlődése az elmúlt évtizedekben végre figyelemre méltóbb mérföldkövek eléréséhez vezette a mesterséges intelligenciát. Korábbi változataiban a mesterséges intelligencia 1997-ben legyőzte a legjobb emberi sakkozót. Majd 2017-ben az AI képes volt legyőzni a legjobb emberi Go játékost.
A mesterséges intelligenciát évek óta használják újrahasznosítási alkalmazásokban is. Ami a mesterséges intelligencia gépi látásban való alkalmazását illeti, pontosan hogyan azonosítanak a gépek egy tárgyat, és hogy az valami olyasmi, amit az áramlatban kell tartani vagy el kell távolítani? Ezek a legfontosabb megoldandó kihívások a mesterséges intelligenciának az újrahasznosítható anyagok válogatási technológiáiban való alkalmazásával kapcsolatban.
A mesterséges intelligencia története a válogatásban
A mesterséges intelligencia alkalmazása a válogatásban az 1970-es és 1980-as évek rendszereivel kezdődött. Ezek a rendszerek optikai érzékelőkön és elektronikán alapultak, amelyek szürkeértékeket vagy színeket hasonlítottak össze. A színek közötti arány alapján az elektronikus áramkör szabályalapú döntést hozott arról, hogy megtartja vagy kidobja az anyagot. Az első visszaváltó automata (RVM) például a palack alakját az általa keltett árnyék alapján ismerte fel, amelyet előre elhelyezett optikai érzékelők érzékeltek.
A kilencvenes évek elején a szürke- és színes kameraképek pixelalapú osztályozását használták egyedi elektronikával kombinálva, ami korlátozta a mesterséges intelligencia képességeit a küszöbértékek és a döntések tekintetében. A személyi számítógépek (PC-k) megjelenésével lehetővé vált e technológia alkalmazása a képek osztályozására.
A személyre szabott kameratechnológiát speciális spektrális tulajdonságok és jobb klaszterezési lehetőségek megszerzésére használták, ami az AI pontosságának javulásához vezetett. Ez lehetővé tette, hogy minden egyes képpontot spektrális tartalma alapján egy adott anyagosztályhoz rendeljenek. Többé már nem a szín volt az egyetlen azonosító kritérium.
Ezt a technológiát aztán az 1990-es évek végén kombinálták az objektumfelismeréssel, ami lehetővé tette a különböző, hasonló tulajdonságokkal rendelkező pixelek klaszterezését és objektummá történő egyesítését.
A 2000-es évekre hiperspektrális képalkotó rendszerek váltak elérhetővé, és a számítógépek teljesítménye tovább nőtt. A mesterséges neurális hálózatok (ANN) kezdtek elérhetővé válni az adatfeldolgozás osztályozási problémáihoz. Az adott alkalmazáshoz és géphez korábban betanított minták alapján a mesterséges intelligenciának ez az osztálya már képes volt különböző jellemzőket és tulajdonságokat kombinálni egy osztályozáshoz. Ennek eredményeképpen összetettebb anyagokat lehetett felismerni, és a válogatás pontosságának egy újabb szintjét sikerült elérni.
Később, a 2000-es években váltak elérhetővé az úgynevezett támogató vektoros gépek (SVM). Bár úgy hangzik, mint egy fizikai gép, ezek olyan matematikai modellek, amelyek lehetővé teszik, hogy a gép klasztereket határozzon meg a többdimenziós térben. Az eredmények táblázatokban való tárolása a fizikai rendezőgépen ismét javította a teljesítményt.
A válogatásra használt mesterséges intelligencia minden korábban említett formájának közös jellemzője, hogy a mesterséges intelligencia úgynevezett képzési vagy tanulási szempontjainak felügyeltnek kell lenniük. Az 1970-es évekből származó RVM nagyon egyszerű példájában a mérnöknek fizikailag kellett elhelyeznie az optikai érzékelőt a megfelelő helyre, és egy sor felcímkézett mintának kellett rendelkezésre állnia a rendszer tanításához, mielőtt a szortert üzembe helyezték volna.
AI ma
Most a rendszer kezdeti tanításához a számítógépes látás mérnökének kell meghatározni a válogatási feladat szempontjából releváns jellemzőket. Ez a képadatokból jellemzővektorokat generál, amelyeket aztán a címkékkel együtt az ANN vagy SVM automatikus képzéséhez használnak. Mivel a képzés automatikusan, a mérnök beavatkozása nélkül történik, ezt a megközelítést felügyelet nélküli tanulásnak nevezzük.
A mesterséges intelligencia fejlődésének következő lépése a válogatásban a mélytanulási módszerek alkalmazása, amelyek a 2010-es években váltak elérhetővé, és amelyeket ma már számos alkalmazásban használnak. Az ilyen típusú hálózatokat évtizedekkel ezelőtt találták ki. A modern grafikus feldolgozóegységek feldolgozási teljesítményének hatalmas növekedése és az általánosan elérhető és címkézett képek milliói miatt ma már lehetséges ezeket gyakorlati problémákra alkalmazni.
Az úgynevezett mély konvolúciós neurális hálózatok még mindig ANN-nek számítanak; de a korai levezetésekhez képest sokkal több réteggel és neuronnal rendelkeznek. Következésképpen a hálózatok nagyobb teljesítményűek. Ugyanakkor sokkal több képzési adatot is igényelnek, mint a hagyományos megközelítések.
A konvolúciós neurális hálózatok legnagyobb előnye, hogy a hálózat képzése során a jellemzőkivonási lépés is automatikusan történik. Ennek eredményeként a számítógépes látásmérnöknek már nem kell manuálisan meghatározni a feladat szempontjából releváns jellemzőket. Jellemzően a hálózat első rétegei generálnak jellemzőket, amelyeket a következő rétegekben összetettebb jellemzőkké integrálnak, majd az utolsó rétegekben osztályoznak.
Ezek a hálózatok szinte építőelemekként kombinálhatók, és mindegyik hálózatot egy adott feladatra előzetesen betanítják. Ezáltal a kialakítás az adott alkalmazáshoz igazítható. A mélytanulási technológiáknak különösen a képfelismerésben van nagy hatásuk.
Egy pillantás a jövőbe
A mesterséges intelligencia fejlesztésének jelenlegi szakasza – különösen a mélytanulás aspektusai – lehetővé teszi az újrahasznosító ipar számára, hogy megoldja a jelenleg megoldatlan kihívásokat.
A végtermék minőségének a kívánt szintre történő javításához ma még mindig szükség van egy kézi válogató állomásra a sor végén. Erre példa lehet a szilíciumkazetták, amelyek nem kívánatosak a polietilénáramban. Ahhoz, hogy egy robot felvegye őket, vagy egy utolsó optikai szortírozón keresztül kidobja őket, először fel kellene őket ismerni.
Ezért a képességért a mesterséges intelligencia és a mélytanulás fontos szerepet fog játszani a hatékonyság javításában. Az AI ezen új formáinak kombinálása a big data lehetőségeivel (pl. a gépekről ma már gyűjthető adatokkal) még több lehetőséget nyit a termelés növelésére, a költségek csökkentésére és a minőség javítására.
Van ez az elképzelés, hogy a mai mesterséges intelligencia olyan, mintha egy ingyen ebédet és egy rút kiskacsát találnánk. Mindkét gondolat tényleges matematikai tétel, amely a mesterséges intelligencia témaköréhez kapcsolódik.
Az első tétel alapvetően azt állítja, hogy egyetlen mesterséges intelligencia megoldás sem jobb az összes többinél egy adott alkalmazás esetében. Minden megoldásnak lehetnek bizonyos előnyei, amelyek máshol hátrányokkal járnak – ezért nem létezik olyan, hogy “ingyen ebéd”.
Hasonló a rút kiskacsa-tétel is, amely azt állítja, hogy nem létezik minden alkalmazás számára optimális funkciókészlet. Még ha találnánk is olyan általános mesterséges intelligenciát, amely sokféle kihívást megold, legalább egy alkalmazáshoz vagy problémához nem illeszkedne, és nem nyújtana megfelelő megoldást – így az a “rút kiskacsa”.
Ezt szem előtt tartva szerénynek kell maradnunk a konvolúciós neurális hálózatokkal és a mélytanulással kapcsolatos elvárásainkban. Rengeteg példa áll rendelkezésre, ahol a mélytanulás nehéz, lazán strukturált felismerési problémákat old meg, de más rendezési feladatoknál más AI-megközelítések jobb teljesítményt fognak nyújtani. A különböző típusú mesterséges intelligenciák megfelelő kombinációjának megtalálása a múltban is kulcsfontosságú volt, és a jövőben is kulcsfontosságú lesz az újrahasznosítható anyagok legjobb válogatási teljesítményének biztosításához.
A mesterséges intelligenciát már jó ideje alkalmazzák az újrahasznosítási iparban. Mégis, azok a lehetőségek, amelyeket a mélytanulás kínálhat, amikor a gépi látás és a gépi tanulás területeit egy ernyő alá vonják, újak és izgalmasak az iparág számára.
A szerzők a norvégiai székhelyű TOMRA Systems ASA-hoz tartozó, németországi székhelyű TOMRA Sorting GmbH (www.tomra.com/en/sorting/recycling) kutatási feladatokkal megbízott alelnökei.
Vélemény, hozzászólás?