Der erste von Chat-GPT entwickelte Roboter

EPFL-Forschende haben mit Chat-GPT-3 einen Robotergreifer für die Tomatenernte entwickelt und damit erstmals das Potenzial des Tools für künstliche Intelligenz in der Zusammenarbeit mit Menschen bei der Roboterentwicklung demonstriert.

Celia Luterbacher 07.06.2023

Mit ihrer Fähigkeit, riesige Mengen an Textdaten zu verarbeiten und diese Informationen zur Beantwortung von Aufforderungen zu nutzen, haben neuronale Netze, sogenannte Large Language Models (LLMs) wie Chat-GPT, für Schlagzeilen gesorgt, weil sie die Art und Weise, wie wir schreiben, lernen und sogar Kunst machen, verändern könnten. Nun haben EPFL-Forschende die Technologie auf einen neuen Bereich angewandt: das Design von Robotern.

In einer Fallstudie, die in Nature Machine Intelligence veröffentlicht wurde, haben Josie Hughes, Leiterin des Computational Robot Design & Fabrication Lab in der Fakultät für Ingenieurwesen, der EPFL-Doktorand Francesco Stella und Cosimo Della Santina von der TU Delft Chat-GPT verwendet, um eine funktionierende Roboter-Tomatenerntemaschine zu entwickeln. Die Studie bietet einen Rahmen für Menschen und LLMs, um solche Geräte gemeinsam zu entwickeln. Auf der Grundlage ihrer Erfahrungen beschreiben die Forschenden die Chancen und Risiken der Anwendung von Tools mit künstlicher Intelligenz (KI) auf die Robotik, die ihrer Meinung nach «die Art und Weise, wie wir Roboter entwerfen, verändern und gleichzeitig den Prozess bereichern und vereinfachen könnte».

«Obwohl es sich bei Chat-GPT um ein Sprachmodell handelt und die Codegenerierung textbasiert ist, lieferte es wichtige Erkenntnisse und Intuition für das physische Design und zeigte grosses Potenzial als Resonanzboden, um die menschliche Kreativität anzuregen», sagt Hughes.

Potenzial und Fallstricke der KI als «Erfinderin»

In einer ersten Phase führten die Forschenden und LLM eine Ideendiskussion, um den Zweck, die Designparameter und die Spezifikationen ihres Roboters zu definieren. Eine zweite Phase war der Realisierung des Roboters in der realen Welt gewidmet, was die Verfeinerung des vom LLM generierten Codes, die Herstellung des Geräts und die Fehlersuche in seiner Funktionsweise beinhaltete.

In der ersten Phase begannen die Forschenden auf einer hohen konzeptionellen Ebene, indem sie sich mit dem LLM über zukünftige Herausforderungen für die Menschheit unterhielten und die robotergestützte Ernte als eine Lösung für die Herausforderung der globalen Nahrungsmittelversorgung identifizierten. Dann griffen sie auf den Zugang des LLM zu globalen Daten aus akademischen Veröffentlichungen, technischen Handbüchern, Büchern und Medien zurück, um die «wahrscheinlichste» Antwort auf Fragen wie «Welche Eigenschaften sollte ein Ernteroboter haben?» zu finden.

Sobald ein grundlegendes Roboterformat identifiziert war (ein motorgetriebener Greifer zum Ergreifen reifer Tomaten), konnten die Forschenden dann spezifischere Fragen stellen, wie «Welche Form sollte der Greifer haben?», und das LLM bitten, technische Vorschläge zu machen, einschliesslich Materialien und Computercode für die Steuerung des Geräts.

«Während Berechnungen bisher vor allem dazu dienten, Ingenieurfachleute bei der technischen Umsetzung zu unterstützen, kann ein KI-System zum ersten Mal neue Systeme konzipieren und damit kognitive Aufgaben auf hoher Ebene automatisieren. Dies könnte zu einer Verlagerung menschlicher Aufgaben auf technischere Aufgaben führen», sagt Stella.

Neben der Zuweisung der Rolle des «Erfinders» an Chat-GPT skizzieren die Forschenden in ihrem Papier auch andere mögliche Formen der Zusammenarbeit zwischen Mensch und LGM. Bei der «kollaborativen Erforschung» wird die KI beispielsweise eingesetzt, um das Fachwissen der Forschenden zu erweitern, indem sie weitreichende Kenntnisse über ihr eigenes Gebiet hinaus beisteuert. Die KI kann auch als «Trichter» fungieren, indem sie bei der Verfeinerung des Designprozesses hilft und technischen Input liefert, wobei der Mensch die kreative Kontrolle behält.

Da jede Form der Zusammenarbeit logische und ethische Risiken birgt, warnen die Forschenden, dass die Rolle der LLM in Zukunft sorgfältig bewertet werden muss. So wirft der Einsatz von LLMs beispielsweise Fragen der Voreingenommenheit, des Plagiats und des geistigen Eigentums auf, da unklar ist, ob ein von einem LLM generiertes Design als neuartig angesehen werden kann.

«In unserer Studie identifizierte Chat-GPT Tomaten als die Kultur, deren Erforschung sich für einen Ernteroboter am meisten lohnt. Dies könnte jedoch auf Kulturen zurückzuführen sein, über die in der Literatur mehr berichtet wird, als auf solche, für die ein echter Bedarf besteht. Wenn Entscheidungen ausserhalb des Wissensbereichs des Ingenieurs getroffen werden, kann dies zu erheblichen ethischen, technischen oder sachlichen Fehlern führen», sagt Hughes.

Trotz dieser Bedenken kommen Hughes und ihr Team aufgrund ihrer Erfahrungen zu dem Schluss, dass LLMs grosses Potenzial haben, eine Kraft für das Gute zu sein, wenn sie gut gemanagt werden: «Die Robotikgemeinschaft muss daher herausfinden, wie sie diese mächtigen Werkzeuge nutzen kann, um den Fortschritt von Robotern auf eine ethische, nachhaltige und sozial förderliche Weise zu beschleunigen.»