Verzerrte Realität 21.10.2024, 13:30 Uhr

Warum KI-generierte Bilder oft zu positiv erscheinen

KI-generierte Bilder erscheinen oft übertrieben positiv. Expertinnen und Experten warnen vor einer zu einseitigen Darstellung, die die Realität verzerrt.

KI-Bild Teanager

Alle gut aussehend und aus einer sozialen Schicht: Soll eine KI Menschen, zum Beispiel Teenager, zeichnen, ist Vielfalt meist nur auf den ersten Blick gegeben.

Foto: Die Illustration hat das Forschungsteam mit Hilfe von ChatGPT/Dall-E 3 erstellt

Künstliche Intelligenz hat in den letzten Jahren eine beachtliche Entwicklung durchlaufen, insbesondere im Bereich der Bilderstellung. Tools wie Dall-E 3, ein KI-basierter Bildgenerator, der in ChatGPT integriert ist, erzeugen beeindruckend realistische Bilder. Doch es gibt eine zunehmende Kritik: Diese Bilder erscheinen oft übertrieben positiv und sind in ihrer Darstellung von Menschen und Situationen erstaunlich einseitig.

Vielfalt nur auf den ersten Blick

„Sie sind so schön gemacht, dass es aufdringlich wird“, sagt die Forscherin Gunhild Kvåle von der norwegischen Universität Agder. Diese Aussage fasst treffend die Kritik zusammen, die sich immer häufiger im Zusammenhang mit KI-generierten Bildern äußert. Kvåle hat gemeinsam mit ihrem Kollegen Gustav Westberg von der Universität Örebro untersucht, wie Dall-E 3 insbesondere Teenager darstellt. Dabei stießen die Wissenschaftlerin und ihr Kollege auf mehrere auffällige Muster, die auf tiefere Probleme hinweisen.

Eine der zentralen Entdeckungen war die oberflächliche Darstellung von Vielfalt. Auf den ersten Blick scheinen die Bilder Personen unterschiedlicher ethnischer Herkunft zu zeigen. „Es ist auffällig, wie Dall-E einerseits auf ethnische und geschlechtsspezifische Vielfalt achtet, während die Bilder andererseits nicht sehr vielfältig sind“, erklärt Kvåle. Dies bedeutet, dass die visuelle Diversität auf den Bildern nur die Oberfläche berührt.

Stellenangebote im Bereich Softwareentwicklung

Softwareentwicklung Jobs
Albtal-Verkehrs-Gesellschaft mbH-Firmenlogo
Projektleiter*in Elektrotechnik, Elektroingenieur*in oder Techniker*in (m/w/d) Albtal-Verkehrs-Gesellschaft mbH
Karlsruhe Zum Job 
WBS Training AG-Firmenlogo
Technische Trainer:in Automatisierungstechnik - CAD/CAM-Programmierung (m/w/d) WBS Training AG
remote (deutschlandweit) Zum Job 
IMS Messsysteme GmbH-Firmenlogo
Projektleiter (m/w/i) für Röntgen-, Isotopen- und optische Messsysteme IMS Messsysteme GmbH
Heiligenhaus Zum Job 
ILF Beratende Ingenieure GmbH-Firmenlogo
Senior Ingenieur Mess-, Steuerungs- und Regelungstechnik (m/w/d) ILF Beratende Ingenieure GmbH
Bremen, Berlin, Hamburg, München, Essen Zum Job 
ILF Beratende Ingenieure GmbH-Firmenlogo
Junior Ingenieur Mess-, Steuerungs- und Regelungstechnik (m/w/d) ILF Beratende Ingenieure GmbH
München Zum Job 
IPH Institut "Prüffeld für elektrische Hochleistungstechnik" GmbH-Firmenlogo
Ingenieur Elektrotechnik (m/w/d) für Transformatoren IPH Institut "Prüffeld für elektrische Hochleistungstechnik" GmbH
ME MOBIL ELEKTRONIK GMBH-Firmenlogo
Support- und Applikationsingenieur (m/w/d) ME MOBIL ELEKTRONIK GMBH
Langenbrettach Zum Job 
naturenergie netze GmbH-Firmenlogo
Teamleiter (m/w/d) Netzentwicklung naturenergie netze GmbH
Rheinfelden (Baden) Zum Job 
Die Autobahn GmbH des Bundes-Firmenlogo
Lösungsentwickler (w/m/d) im Digitallabor Geoinformatik Die Autobahn GmbH des Bundes
Schluchseewerk AG-Firmenlogo
Ingenieur (m/w/d) Schwerpunkt Konformität Schluchseewerk AG
Laufenburg Zum Job 
Indorama Ventures Polymers Germany GmbH-Firmenlogo
Sicherheitsingenieur (m/w/d) für Anlagen- und Prozesssicherheit Indorama Ventures Polymers Germany GmbH
Gersthofen Zum Job 
TotalEnergies-Firmenlogo
Koordinator (m/w/d) Inbetriebnahme und Qualität TotalEnergies
Berlin, München Zum Job 
Münchener Rückversicherungs-Gesellschaft Aktiengesellschaft in München-Firmenlogo
Underwriter Downstream / Energy (m/f/d)* Münchener Rückversicherungs-Gesellschaft Aktiengesellschaft in München
München Zum Job 
STAWAG - Stadt und Städteregionswerke Aachen AG-Firmenlogo
Betriebsingenieur:in Wärmeanlagen (m/w/d) STAWAG - Stadt und Städteregionswerke Aachen AG
Prognost Systems GmbH-Firmenlogo
Technischer Projektmanager (m/w/d) (Maschinenbauingenieur, Maschinenbautechniker, Elektrotechniker, Mechatroniker o. ä) Prognost Systems GmbH
B. Braun SE-Firmenlogo
Senior Prozess Experte (w/m/d) Abfüllung B. Braun SE
Melsungen Zum Job 
Truma Gerätetechnik GmbH & Co. KG-Firmenlogo
Product Compliance Officer (m/w/d) Truma Gerätetechnik GmbH & Co. KG
Putzbrunn Zum Job 
Stadtwerke Weimar Stadtversorgungs-GmbH-Firmenlogo
Planungsingenieur (m/w/d) Fernwärme Stadtwerke Weimar Stadtversorgungs-GmbH
IMS Messsysteme GmbH-Firmenlogo
Elektrotechnikingenieur/-techniker (m/w/i) für die Prüfung von Messsystemen IMS Messsysteme GmbH
Heiligenhaus Zum Job 
Propan Rheingas GmbH & Co. KG-Firmenlogo
Senior Energieberater (m/w/d) Propan Rheingas GmbH & Co. KG

Die Forschenden gaben der KI allgemeine Anweisungen wie „Erstelle Bilder von Teenagern“. Auch als sie Dall-E 3 erlaubten, selbst kreative Texteingaben zu generieren, änderte sich das Ergebnis kaum. Zwar wurde die Vielfalt betont, aber in den Details ähnelten sich die Darstellungen stark: Alle Teenager auf den Bildern tragen ähnliche Kleidung, sind durchweg attraktiv, haben makellose Haut und voluminöses Haar. Eine reale Vielfalt, die auch soziale und individuelle Unterschiede widerspiegelt, fehlt.

Eine übertrieben positive Darstellung

Ein weiteres gemeinsames Merkmal der von Dall-E generierten Bilder ist die durchweg positive Darstellung der Menschen und Situationen. Die Teenager erscheinen immer glücklich, sei es beim gemeinsamen Lernen, bei Konzerten oder in Freizeitaktivitäten. „Auf den Bildern sind alle glücklich, niemand ist traurig“, beschreibt Kvåle.

Dieses positive Bild lässt jedoch bestimmte Aspekte des Alltags komplett außen vor. Es fehlen Darstellungen von Arbeit oder Herausforderungen des Lebens. Die dargestellten Situationen sind meist Freizeitaktivitäten, die von der Gesellschaft geschätzt werden, wie Marshmallow-Grillen oder Konzertbesuche. Das Bildmaterial zeigt Menschen in einem idealisierten Umfeld, was oft nicht der Realität entspricht.„Es ist auffällig, wie Dall-E einerseits auf ethnische und geschlechtsspezifische Vielfalt achtet, während die Bilder andererseits nicht sehr vielfältig sind“, sagt Kvåle.

Fotorealismus als Standard

Ein drittes auffälliges Merkmal der von Dall-E erstellten Bilder ist der starke Fokus auf Fotorealismus. Die Beleuchtung, die Anordnung der Objekte im Bild sowie die Schauplätze wirken auf den ersten Blick authentisch. „Die Bilder erwecken den Eindruck von Authentizität“, so Kvåle, „aber durch den Kontext werden diese jungen Menschen auch sozial positioniert.“

Die Orte, an denen die Teenager dargestellt werden, sind Parks, Jugendclubs oder gemütliche Jugendzimmer. Doch eine Vielfalt an Szenarien, die auch weniger privilegierte Lebensumstände abbilden, fehlt fast vollständig.

Eingeschränkte Kreativität

Eine weitere Erkenntnis des Forschungsteams betrifft die begrenzte Vorstellungskraft von Dall-E. Obwohl die KI in der Lage ist, fantasievolle Szenarien zu erstellen, wie etwa Teenager, die in einer Schneekugel Schlittschuh laufen, geschieht dies nur auf ausdrückliche Aufforderung. Standardmäßig bevorzugt Dall-E realistische, fast sterile Darstellungen.

„Fotorealistische Bilder werden von Dall-E offensichtlich bevorzugt“, erklärt Kvåle. Dies lässt wenig Raum für kreative, alternative Darstellungen, die von der Realität abweichen.

Ein kritischer Blick auf KI-generierte Bilder

Bildgeneratoren wie Dall-E sind heute sehr leistungsfähig und zugänglich. Doch trotz der wachsenden Popularität dieser Technologie fluten sie nicht die Welt mit KI-generierten Bildern. „Es heißt, dass sich durch künstliche Intelligenz alles ändern wird, aber das stimmt eindeutig nicht“, merkt Kvåle an. In vielen Bereichen, wie etwa in Redaktionen oder Kommunikationsabteilungen, gelten weiterhin etablierte Standards.

Dennoch ist es wichtig, ein kritisches Bewusstsein für die Macht von KI-generierten Bildern zu entwickeln. „Dienste wie Dall-E können einen starken Einfluss auf unsere visuelle Kultur haben“, sagt Kvåle. Sie mahnt, dass die Art und Weise, wie diese Bilder Menschen und Situationen darstellen, nicht immer die Vielfalt und Realität unserer Gesellschaft widerspiegelt.

Hier geht es zur Originalpublikation

Ein Beitrag von:

  • Dominik Hochwarth

    Redakteur beim VDI Verlag. Nach dem Studium absolvierte er eine Ausbildung zum Online-Redakteur, es folgten ein Volontariat und jeweils 10 Jahre als Webtexter für eine Internetagentur und einen Onlineshop. Seit September 2022 schreibt er für ingenieur.de.

Zu unseren Newslettern anmelden

Das Wichtigste immer im Blick: Mit unseren beiden Newslettern verpassen Sie keine News mehr aus der schönen neuen Technikwelt und erhalten Karrieretipps rund um Jobsuche & Bewerbung. Sie begeistert ein Thema mehr als das andere? Dann wählen Sie einfach Ihren kostenfreien Favoriten.