Verzerrte Realität 21.10.2024, 13:30 Uhr

Warum KI-generierte Bilder oft zu positiv erscheinen

KI-generierte Bilder erscheinen oft übertrieben positiv. Expertinnen und Experten warnen vor einer zu einseitigen Darstellung, die die Realität verzerrt.

KI-Bild Teanager

Alle gut aussehend und aus einer sozialen Schicht: Soll eine KI Menschen, zum Beispiel Teenager, zeichnen, ist Vielfalt meist nur auf den ersten Blick gegeben.

Foto: Die Illustration hat das Forschungsteam mit Hilfe von ChatGPT/Dall-E 3 erstellt

Künstliche Intelligenz hat in den letzten Jahren eine beachtliche Entwicklung durchlaufen, insbesondere im Bereich der Bilderstellung. Tools wie Dall-E 3, ein KI-basierter Bildgenerator, der in ChatGPT integriert ist, erzeugen beeindruckend realistische Bilder. Doch es gibt eine zunehmende Kritik: Diese Bilder erscheinen oft übertrieben positiv und sind in ihrer Darstellung von Menschen und Situationen erstaunlich einseitig.

Vielfalt nur auf den ersten Blick

„Sie sind so schön gemacht, dass es aufdringlich wird“, sagt die Forscherin Gunhild Kvåle von der norwegischen Universität Agder. Diese Aussage fasst treffend die Kritik zusammen, die sich immer häufiger im Zusammenhang mit KI-generierten Bildern äußert. Kvåle hat gemeinsam mit ihrem Kollegen Gustav Westberg von der Universität Örebro untersucht, wie Dall-E 3 insbesondere Teenager darstellt. Dabei stießen die Wissenschaftlerin und ihr Kollege auf mehrere auffällige Muster, die auf tiefere Probleme hinweisen.

Eine der zentralen Entdeckungen war die oberflächliche Darstellung von Vielfalt. Auf den ersten Blick scheinen die Bilder Personen unterschiedlicher ethnischer Herkunft zu zeigen. „Es ist auffällig, wie Dall-E einerseits auf ethnische und geschlechtsspezifische Vielfalt achtet, während die Bilder andererseits nicht sehr vielfältig sind“, erklärt Kvåle. Dies bedeutet, dass die visuelle Diversität auf den Bildern nur die Oberfläche berührt.

Stellenangebote im Bereich Softwareentwicklung

Softwareentwicklung Jobs
Unfallkasse Mecklenburg-Vorpommern-Firmenlogo
Ingenieur / Naturwissenschaftler (m/w/d) für Berufskrankheiten-Ermittlung Unfallkasse Mecklenburg-Vorpommern
Schwerin Zum Job 
ONTRAS Gastransport GmbH-Firmenlogo
Projektmanager für Wasserstoff (m/w/d) ONTRAS Gastransport GmbH
Leipzig Zum Job 
ROBEL Bahnbaumaschinen GmbH-Firmenlogo
Referent Zulassung (m/w/d) ROBEL Bahnbaumaschinen GmbH
Freilassing Zum Job 
THOST Projektmanagement GmbH-Firmenlogo
Ingenieur*in (m/w/d) in der Terminplanung für Großprojekte im Anlagenbau THOST Projektmanagement GmbH
Nürnberg, Berlin, Leipzig, Hamburg, Pforzheim Zum Job 
3M Deutschland GmbH-Firmenlogo
Senior Research Product Development Engineer (R&D) - Electrical Markets (m/f/*) 3M Deutschland GmbH
IMS Röntgensysteme GmbH-Firmenlogo
Entwicklungsingenieur (m/w/i) für digitale Inspektionssysteme IMS Röntgensysteme GmbH
Heiligenhaus Zum Job 
AbbVie Deutschland GmbH & Co. KG-Firmenlogo
Senior Project Engineer - Facility Automation (all genders) AbbVie Deutschland GmbH & Co. KG
Ludwigshafen am Rhein Zum Job 
Stadtwerke Augsburg Holding GmbH-Firmenlogo
Planer*in (m/w/d) für die technische Gebäudeausrüstung - Elektrotechnik Stadtwerke Augsburg Holding GmbH
Augsburg Zum Job 
OST  Ostschweizer Fachhochschule-Firmenlogo
Professor/in für Integrierte Digitale Systeme OST Ostschweizer Fachhochschule
Rapperswil (Schweiz) Zum Job 
Sentronics Metrology (a Nova Company)-Firmenlogo
Service Engineer Commissioning Metrology (m/w/d) Sentronics Metrology (a Nova Company)
Mannheim Zum Job 
Sentronics Metrology (a Nova Company)-Firmenlogo
Teamleiter (m/w/d) Integration & Commissioning Automation Sentronics Metrology (a Nova Company)
Mannheim Zum Job 
Sentronics Metrology (a Nova Company)-Firmenlogo
Elektriker / Industriemechaniker (m/w/d) für optische Messsysteme Sentronics Metrology (a Nova Company)
Mannheim Zum Job 
DB InfraGO-Firmenlogo
Senior Projektingenieur:in Leit- und Sicherungstechnik (w/m/d) DB InfraGO
Frankfurt am Main Zum Job 
DB InfraGO AG / DB Engineering & Consulting GmbH-Firmenlogo
(Senior) Planungsingenieur:in (w/m/d) DB InfraGO AG / DB Engineering & Consulting GmbH
Saarbrücken, Frankfurt am Main, Mainz Zum Job 
io-Firmenlogo
Senior Planungsingenieur/ Fachplaner Elektrotechnik (w/m/d) io
Heidelberg, Kaiserslautern Zum Job 
TÜV Hessen-Firmenlogo
Sachverständige/-r (m/w/d) Elektrotechnik TÜV Hessen
keine Angabe Zum Job 
TÜV Hessen-Firmenlogo
Sachverständige/-r (m/w/d) für EMV und EMF TÜV Hessen
keine Angabe Zum Job 
RHEINMETALL AG-Firmenlogo
Verstärkung für unsere technischen Projekte im Bereich Engineering und IT (m/w/d) RHEINMETALL AG
deutschlandweit Zum Job 
SCI-Selection - A Division of Stanton Chase Bad Homburg GmbH-Firmenlogo
Entwicklungsingenieur elektrische Antriebe (m/w/d) SCI-Selection - A Division of Stanton Chase Bad Homburg GmbH
Mannheim Zum Job 
Stadtwerke Augsburg Holding GmbH-Firmenlogo
Technischer Revisor (m/w/d) Schwerpunkt Prozessprüfung im Bereich Versorgung und ÖPNV Stadtwerke Augsburg Holding GmbH
Augsburg Zum Job 

Die Forschenden gaben der KI allgemeine Anweisungen wie „Erstelle Bilder von Teenagern“. Auch als sie Dall-E 3 erlaubten, selbst kreative Texteingaben zu generieren, änderte sich das Ergebnis kaum. Zwar wurde die Vielfalt betont, aber in den Details ähnelten sich die Darstellungen stark: Alle Teenager auf den Bildern tragen ähnliche Kleidung, sind durchweg attraktiv, haben makellose Haut und voluminöses Haar. Eine reale Vielfalt, die auch soziale und individuelle Unterschiede widerspiegelt, fehlt.

Eine übertrieben positive Darstellung

Ein weiteres gemeinsames Merkmal der von Dall-E generierten Bilder ist die durchweg positive Darstellung der Menschen und Situationen. Die Teenager erscheinen immer glücklich, sei es beim gemeinsamen Lernen, bei Konzerten oder in Freizeitaktivitäten. „Auf den Bildern sind alle glücklich, niemand ist traurig“, beschreibt Kvåle.

Dieses positive Bild lässt jedoch bestimmte Aspekte des Alltags komplett außen vor. Es fehlen Darstellungen von Arbeit oder Herausforderungen des Lebens. Die dargestellten Situationen sind meist Freizeitaktivitäten, die von der Gesellschaft geschätzt werden, wie Marshmallow-Grillen oder Konzertbesuche. Das Bildmaterial zeigt Menschen in einem idealisierten Umfeld, was oft nicht der Realität entspricht.„Es ist auffällig, wie Dall-E einerseits auf ethnische und geschlechtsspezifische Vielfalt achtet, während die Bilder andererseits nicht sehr vielfältig sind“, sagt Kvåle.

Fotorealismus als Standard

Ein drittes auffälliges Merkmal der von Dall-E erstellten Bilder ist der starke Fokus auf Fotorealismus. Die Beleuchtung, die Anordnung der Objekte im Bild sowie die Schauplätze wirken auf den ersten Blick authentisch. „Die Bilder erwecken den Eindruck von Authentizität“, so Kvåle, „aber durch den Kontext werden diese jungen Menschen auch sozial positioniert.“

Die Orte, an denen die Teenager dargestellt werden, sind Parks, Jugendclubs oder gemütliche Jugendzimmer. Doch eine Vielfalt an Szenarien, die auch weniger privilegierte Lebensumstände abbilden, fehlt fast vollständig.

Auch interessant:

Eingeschränkte Kreativität

Eine weitere Erkenntnis des Forschungsteams betrifft die begrenzte Vorstellungskraft von Dall-E. Obwohl die KI in der Lage ist, fantasievolle Szenarien zu erstellen, wie etwa Teenager, die in einer Schneekugel Schlittschuh laufen, geschieht dies nur auf ausdrückliche Aufforderung. Standardmäßig bevorzugt Dall-E realistische, fast sterile Darstellungen.

„Fotorealistische Bilder werden von Dall-E offensichtlich bevorzugt“, erklärt Kvåle. Dies lässt wenig Raum für kreative, alternative Darstellungen, die von der Realität abweichen.

Ein kritischer Blick auf KI-generierte Bilder

Bildgeneratoren wie Dall-E sind heute sehr leistungsfähig und zugänglich. Doch trotz der wachsenden Popularität dieser Technologie fluten sie nicht die Welt mit KI-generierten Bildern. „Es heißt, dass sich durch künstliche Intelligenz alles ändern wird, aber das stimmt eindeutig nicht“, merkt Kvåle an. In vielen Bereichen, wie etwa in Redaktionen oder Kommunikationsabteilungen, gelten weiterhin etablierte Standards.

Dennoch ist es wichtig, ein kritisches Bewusstsein für die Macht von KI-generierten Bildern zu entwickeln. „Dienste wie Dall-E können einen starken Einfluss auf unsere visuelle Kultur haben“, sagt Kvåle. Sie mahnt, dass die Art und Weise, wie diese Bilder Menschen und Situationen darstellen, nicht immer die Vielfalt und Realität unserer Gesellschaft widerspiegelt.

Hier geht es zur Originalpublikation

Ein Beitrag von:

  • Dominik Hochwarth

    Redakteur beim VDI Verlag. Nach dem Studium absolvierte er eine Ausbildung zum Online-Redakteur, es folgten ein Volontariat und jeweils 10 Jahre als Webtexter für eine Internetagentur und einen Onlineshop. Seit September 2022 schreibt er für ingenieur.de.

Zu unseren Newslettern anmelden

Das Wichtigste immer im Blick: Mit unseren beiden Newslettern verpassen Sie keine News mehr aus der schönen neuen Technikwelt und erhalten Karrieretipps rund um Jobsuche & Bewerbung. Sie begeistert ein Thema mehr als das andere? Dann wählen Sie einfach Ihren kostenfreien Favoriten.