Künstliche Intelligenz: Die „grüne“ Zukunft der Industrie?

Wie grün ist KI eigentlich? Und welche Auswirkungen hat Auto Machine Learning auf die Emissionen? KI-Experte Robert Weber hat die neuesten Entwicklungen zusammengefasst.   

Die Industrie entdeckt das maschinelle Lernen für sich - nicht immer entstehen neue Produkte, aber es wird fleißig gewerkelt bei den Maschinenbauern. In vielen Entwicklungsabteilungen arbeiten Forschende an neuen Modellen für die Maschinen und Anlagen. Wer die Anlagenverfügbarkeit erhöhen will, kommt an Machine Learning (ML)-Modellen kaum mehr vorbei. Data Scientisten und Domänenexperten sitzen zusammen und analysieren Daten. Doch nur wenige wissen, dass maschinelles Lernen und gerechnete Modelle Energiefresser sind. 

Diskussionen um „grüne“ KI

Die Wissenschaftler Emma Strubell, Ananya Ganesh und Andrew McCallum haben es durchgerechnet. Ein durchgerechnetes Modell im Bereich Natural Language Processing (NLP), vereinfacht Sprachsteuerungen, verursacht 280.000 Tonnen Kohlendioxidemissionen. Die Studie hat einige Schwächen, aber sie hat die Branche aufhorchen lassen.

Seit Jahren werben die skandinavischen Länder, allen voran Schweden, um Cloud-Rechenzentren großer Hyperscaler. Die natürliche Kälte und die großen Wasserreserven seien ideal für den Betrieb grüner Rechenzentren. Die Diskussionen um grüne KI sind eröffnet. 

© shutterstock 
Der Blick in eine grüne Zukunft. Die KI könnte das ermöglichen. 

Klimakompensationen sind nicht die Lösung

Die Vordenker kommen unter anderem aus Kanada. Victor Schmidt vom Mila in Montreal kennt die Herausforderungen der Unternehmen. Er arbeitet am Institut von Prof. Yoshua Bengio, Preisträger des Turing Awards 2018. Er gilt neben Schmidhuber, Hochreiter, Le Cun oder Hinton zu den wichtigsten KI-Vordenkern der Welt.

Schmidt forscht seit Jahren an dem Thema Energieverbrauch für KI-Anwendungen. „Der größte Verbraucher in einem Projekt ist das Tunen von Hyperparametern und die Suche nach dem besten Ergebnis.“ Der Kanadier hat zusammen mit seinen Kolleginnen und Kollegen ein Python-Tool geschrieben, das den Energieverbrauch bei diesem Tuning und Searching dem Anwender visualisiert. „Wir überwachen die CPU und GPU Aktivitäten.“ Im Vorfeld muss der User seinen Standort, seine GPU und die Anzahl der Stunden definieren. „Wir haben Testläufe, da ist der Carbon Footprint in Quebec 40 Prozent geringer als in Ohio“, berichtet Schmidt. Da spielen unterschiedliche Faktoren hinein. Er warnt aber: „Klimakompensationen sind nicht die Lösung.“ Man müsse jetzt handeln.

Python Oneliner

Schmidts Oneliner für Python stößt aber auch an Grenzen. Es fehlen noch Daten. Gegenwärtig bedienen sie sich Open Source Daten und NGO-Informationen. Die Forscher haben Daten von den großen Cloudprovidern, doch viele Unternehmen fahren eigene Rechenzentren. „Das ist für uns nicht einzusehen und der Anwender muss selber die Informationen zum Energieverbraucher suchen.“ Das ist nicht praktikabel. Die Kanadier wollen ihr Tool weiter optimieren, noch mehr Data Scientisten zur Verfügung stellen, um in Zukunft Machine Learning nachhaltiger zu betreiben. 

Anwender soll sich auf kreative Aufgaben konzentrieren

Ein Ansatz könnte Auto ML sein. Dem stimmt Schmidt zu. Auch europäische Forscher arbeiten daran. Einer von ihnen ist Lars Kothoff von der University of Wyoming. „Es existieren bis zu einem Dutzend Sortieralgorithmen und der Anwender weiß oft nicht, in welchen Szenarien er welchen einsetzen soll.“ Diese Suche nach dem richtigen Algorithmus will Kothoff dem Anwender erleichtern. Er solle sich auf die kreativen Aufgaben konzentrieren, z. B. Modellierung.

Wenn Anwender den falschen Algorithmus einsetzen, leidet die Performance des Projekts. „Ich denke konkret an solche Anwendungen, wo wir vollständige [Anmerkung: „vermutlich nicht effizient lesbare“] Probleme lösen, wo wir eine Heuristik einsetzen. Wenn diese Heuristik falsch ist, dann dauert es unter Umständen Jahre, das Problem zu lösen, und wenn es die richtige Heuristik ist, dann kann das Problem in wenigen Sekunden gelöst werden.“

Entwicklungen aus Europa

Dr. Albert Krohn von 21data arbeitet genau an solchen Lösungen. Seine Plattform (wie so viele Programme auf der Programmiersprache Python basierend) ist Open Source. Geld verdienen will er mit den Pipelines für die Daten, die er für seine Kunden im ersten Schritt aufsetzt. Komplexe Data Science Pipelines beinhalten viele Verarbeitungsschritte, die in einer Kette zusammengebracht werden müssen.

Da hilft zunächst auch kein Self-Service Analytics, denn der Anwender ist schon mit der Auswahl der Algorithmen überfordert. Das will er ändern: an diesem Schritt setzt Guided Analytics an, bei dieser Technologie ist dann ein Workflow für eine Pipeline vorgegeben und der User kann diesem Workflow mit weniger Freiheiten folgen. „Wir entlasten die Domänenexperten und die Data Scientists“, erklärt er. 

© shutterstock 
Ein funktionierendes Auto Machine Learning kann eine große Bedeutung für weniger Emissionen haben.  

Auto ML könnte für weniger Emissionen sorgen

Cluster, Layer, Lernraten, Input und Output-Abhängigkeiten seien automatisierbar. „Ich will es den Domänenexperten so einfach wie möglich machen. Deshalb orientiert sich das Interface unserer Lösung an den bekannten Systemen aus der Fertigung“, so Albert Krohn. Er meint MES oder SCADA-Anwendungen. Krohn definiert vier Schritte für Guided Analytics: Self-Service Analytics für den Power AI-User, Self-Guided Analytics, Adaptive Analytics und Autonomous Analytics. Automatisierung bei ML-Projekten erleichtere in Zukunft auch das Deployment. Krohn spricht in diesem Zusammenhang von „MLOps“.

„Auto ML kann, wenn es funktioniert, eine große Bedeutung für weniger Emissionen haben“, meint Schmidt. Bis dahin will er weiter für seinen Oneliner werben. Laden Sie sich diesen also hier herunter. 

 

Text von Robert Weber