Spiel mit den Prozenten
On November 7, 2021 by adminAllgemein gesprochen ist künstliche Intelligenz (KI) die Intelligenz, die von Maschinen gezeigt wird. Diese Definition zeigt, dass KI eine Reihe von Themen abdeckt. So könnte beispielsweise ein recht einfacher Algorithmus, der über elektronische Schaltkreise implementiert wird, als KI betrachtet werden, sobald das System intelligentes Verhalten zeigt (z. B. wenn die Temperatur der Maschine einen bestimmten Schwellenwert erreicht, weiß die Maschine, dass sie sich von selbst abschaltet).
Verbesserungen in der KI haben die Technologie in die Lage versetzt, Deep Learning, Bilderkennung und Spracherkennung durchzuführen. Obwohl es die KI-Forschung bereits seit den 1940er Jahren gibt, haben die Fortschritte bei der Rechenleistung in den letzten Jahrzehnten schließlich dazu geführt, dass die KI weitere bemerkenswerte Meilensteine erreicht hat. In ihren früheren Versionen schlug die KI 1997 den besten menschlichen Schachspieler. Im Jahr 2017 konnte die KI dann den besten menschlichen Go-Spieler schlagen.
KI wird seit Jahren auch in Recycling-Anwendungen eingesetzt. Wie genau erkennen Maschinen ein Objekt und wie erkennen sie, ob es sich um etwas handelt, das im Strom verbleiben oder entfernt werden muss, wenn KI im Bereich des maschinellen Sehens eingesetzt wird? Dies sind die wichtigsten Herausforderungen, die es im Zusammenhang mit dem Einsatz von KI in Sortiertechnologien für Wertstoffe zu lösen gilt.
Geschichte der KI in der Sortierung
Der Einsatz von KI in der Sortierung begann mit Systemen in den 1970er bis 1980er Jahren. Diese Systeme basierten auf optischen Sensoren und Elektronik, die Grauwerte oder Farben verglichen. Auf der Grundlage des Verhältnisses zwischen diesen Farben traf die elektronische Schaltung eine regelbasierte Entscheidung, ob das Material behalten oder ausgeworfen werden sollte. Der erste Leergutrücknahmesystem (RVM) erkannte beispielsweise die Form einer Flasche anhand des von ihr erzeugten Schattens, der von vorgelagerten optischen Sensoren erfasst wurde.
In den frühen 1990er Jahren wurde die pixelbasierte Klassifizierung von Grau- und Farbkamerabildern in Verbindung mit speziell angefertigter Elektronik verwendet, was die Fähigkeiten der KI in Bezug auf Schwellenwerte und Entscheidungen begrenzte. Mit dem Aufkommen von Personalcomputern (PCs) wurde es möglich, diese Technologie für die Klassifizierung von Bildern zu nutzen.
Mit Hilfe maßgeschneiderter Kameratechnik wurden spezifische spektrale Eigenschaften und bessere Möglichkeiten der Clusterbildung erworben, was zu einer verbesserten Genauigkeit der KI führte. Dadurch war es möglich, jedes Pixel auf der Grundlage seines Spektralgehalts einer bestimmten Materialklasse zuzuordnen. Die Farbe war nicht mehr das einzige Identifizierungskriterium.
Diese Technologie wurde dann in den späten 1990er Jahren mit der Objekterkennung kombiniert, die es ermöglichte, verschiedene Pixel mit ähnlichen Eigenschaften zu clustern und zu einem Objekt zu kombinieren.
In den 2000er Jahren wurden hyperspektrale Bildgebungssysteme verfügbar, und die Leistung von PCs nahm weiter zu. Künstliche neuronale Netze (ANN) wurden für Klassifizierungsprobleme in der Datenverarbeitung verfügbar. Auf der Grundlage von zuvor für die jeweilige Anwendung und Maschine trainierten Mustern konnte diese Klasse der künstlichen Intelligenz nun verschiedene Merkmale und Eigenschaften kombinieren, um eine Klassifizierung vorzunehmen. Infolgedessen konnten komplexere Materialien erkannt werden, und es wurde eine weitere Stufe der Sortiergenauigkeit erreicht.
Später in den 2000er Jahren kamen die so genannten Support Vector Machines (SVMs) auf. Obwohl es wie eine physikalische Maschine klingt, handelt es sich dabei um mathematische Modelle, die es einer Maschine ermöglichen, Cluster im mehrdimensionalen Raum zu definieren. Die Speicherung der Ergebnisse in Tabellen auf der physischen Sortiermaschine verbesserte die Leistung nochmals.
Gemeinsam mit allen zuvor genannten Formen der KI, die zum Sortieren verwendet werden, ist die Tatsache, dass die so genannten Trainings- oder Lernaspekte der KI überwacht werden müssen. In dem sehr einfachen Beispiel des RVM aus den 1970er Jahren musste der Ingenieur den optischen Sensor physisch an der richtigen Stelle platzieren, und es musste eine Reihe von beschrifteten Proben zur Verfügung stehen, um das System zu trainieren, bevor der Sortierer in Betrieb genommen werden konnte.
AI heute
Heute erfordert das anfängliche Einlernen des Systems, dass ein Computer Vision Ingenieur die relevanten Merkmale für die Sortieraufgabe definiert. Dabei werden aus den Bilddaten Merkmalsvektoren generiert, die dann in Verbindung mit den Beschriftungen für das automatische Training der ANN oder SVM verwendet werden. Da das Training automatisch ohne Interaktion des Ingenieurs erfolgt, wird dieser Ansatz als unüberwachtes Lernen bezeichnet.
Der nächste Schritt in der Entwicklung der KI bei der Sortierung ist der Einsatz von Deep-Learning-Methoden, die in den 2010er Jahren verfügbar wurden und jetzt in einer Reihe von Anwendungen eingesetzt werden. Diese Arten von Netzwerken wurden bereits vor Jahrzehnten erfunden. Aufgrund einer massiven Steigerung der Verarbeitungsleistung moderner Grafikprozessoren und Millionen allgemein verfügbarer und beschrifteter Bilder ist es nun möglich, sie auf praktische Probleme anzuwenden.
So genannte tiefe Faltungsneuronale Netze sind immer noch ein ANN; im Vergleich zu den frühen Ableitungen haben sie jedoch eine viel größere Anzahl von Schichten und Neuronen. Folglich sind die Netze leistungsfähiger. Allerdings benötigen sie auch viel mehr Trainingsdaten als herkömmliche Ansätze.
Der große Vorteil von Faltungsneuronalen Netzen besteht darin, dass der Schritt der Merkmalsextraktion ebenfalls automatisch während des Trainings des Netzes durchgeführt wird. Dadurch muss ein Computer Vision Engineer die für die Aufgabe relevanten Merkmale nicht mehr manuell festlegen. Typischerweise werden in den ersten Schichten des Netzes Merkmale generiert, die in den folgenden Schichten in komplexere Merkmale integriert und dann in den letzten Schichten klassifiziert werden.
Diese Netze können fast wie Bausteine kombiniert werden, wobei jedes einzelne für eine bestimmte Aufgabe vortrainiert wird. Auf diese Weise kann das Design an die jeweilige Anwendung angepasst werden. Deep-Learning-Technologien haben vor allem in der Bilderkennung einen großen Einfluss.
Ein Blick in die Zukunft
Die aktuelle Phase der KI-Entwicklung – insbesondere die Deep-Learning-Aspekte – wird es der Recyclingindustrie ermöglichen, bisher ungelöste Herausforderungen zu bewältigen.
Heute wird noch immer eine Handverlesestation am Ende einer Linie benötigt, um die Qualität des Endprodukts auf das gewünschte Niveau zu bringen. Ein Beispiel dafür sind Silizium-Kartuschen, die in einem Polyethylenstrom nicht erwünscht sind. Um sie mit einem Roboter aufzusammeln oder durch einen letzten optischen Sortierer auszuschleusen, müssten sie zuerst erkannt werden.
Für diese Fähigkeit werden KI und Deep Learning eine wichtige Rolle bei der Verbesserung der Effizienz spielen. Die Kombination dieser neuen Formen der KI mit dem Potenzial von Big Data (z. B. mit den Daten, die wir bereits heute von den Maschinen sammeln können) wird noch mehr Möglichkeiten zur Produktionssteigerung, Kostensenkung und Qualitätsverbesserung eröffnen.
Es gibt diese Idee, dass die heutige KI so etwas wie ein kostenloses Mittagessen und ein hässliches Entlein ist. Beide Ideen sind tatsächliche mathematische Theoreme, die sich auf das Thema der künstlichen Intelligenz beziehen.
Das erste Theorem besagt im Grunde, dass keine einzelne KI-Lösung allen anderen für eine bestimmte Anwendung überlegen ist. Jede Lösung kann bestimmte Vorteile haben, die durch Nachteile an anderer Stelle erkauft werden – so etwas wie ein „kostenloses Mittagessen“ gibt es also nicht.
Das Theorem des hässlichen Entleins ist ähnlich und besagt, dass es keinen optimalen Funktionssatz für alle Anwendungen gibt. Selbst wenn wir eine generische KI finden könnten, die viele verschiedene Herausforderungen löst, würde sie für mindestens eine Anwendung oder ein Problem nicht passen und keine geeignete Lösung bieten – sie wäre das „hässliche Entlein“.
In diesem Sinne sollten wir uns mit unseren Erwartungen an die Möglichkeiten von Faltungsneuronalen Netzen und Deep Learning zurückhalten. Es gibt viele Beispiele, in denen Deep Learning schwierige, locker strukturierte Erkennungsprobleme löst, aber bei anderen Sortieraufgaben werden andere KI-Ansätze bessere Leistungen erbringen. Die richtige Kombination verschiedener Arten von KI zu finden, war in der Vergangenheit entscheidend und wird auch in Zukunft ein Schlüssel sein, um die beste Sortierleistung für Wertstoffe zu gewährleisten.
Künstliche Intelligenz wird in der Recyclingbranche schon seit geraumer Zeit eingesetzt. Doch die Möglichkeiten, die Deep Learning bieten kann, wenn die Bereiche maschinelles Sehen und maschinelles Lernen unter einen Hut gebracht werden, sind neu und aufregend für die Branche.
Die Autoren sind Vizepräsidenten mit Forschungsverantwortung bei der in Deutschland ansässigen TOMRA Sorting GmbH, www.tomra.com/en/sorting/recycling, die zu der in Norwegen ansässigen TOMRA Systems ASA gehört.
Schreibe einen Kommentar