Verzerrte Realität 21.10.2024, 13:30 Uhr

Warum KI-generierte Bilder oft zu positiv erscheinen

KI-generierte Bilder erscheinen oft übertrieben positiv. Expertinnen und Experten warnen vor einer zu einseitigen Darstellung, die die Realität verzerrt.

KI-Bild Teanager

Alle gut aussehend und aus einer sozialen Schicht: Soll eine KI Menschen, zum Beispiel Teenager, zeichnen, ist Vielfalt meist nur auf den ersten Blick gegeben.

Foto: Die Illustration hat das Forschungsteam mit Hilfe von ChatGPT/Dall-E 3 erstellt

Künstliche Intelligenz hat in den letzten Jahren eine beachtliche Entwicklung durchlaufen, insbesondere im Bereich der Bilderstellung. Tools wie Dall-E 3, ein KI-basierter Bildgenerator, der in ChatGPT integriert ist, erzeugen beeindruckend realistische Bilder. Doch es gibt eine zunehmende Kritik: Diese Bilder erscheinen oft übertrieben positiv und sind in ihrer Darstellung von Menschen und Situationen erstaunlich einseitig.

Vielfalt nur auf den ersten Blick

„Sie sind so schön gemacht, dass es aufdringlich wird“, sagt die Forscherin Gunhild Kvåle von der norwegischen Universität Agder. Diese Aussage fasst treffend die Kritik zusammen, die sich immer häufiger im Zusammenhang mit KI-generierten Bildern äußert. Kvåle hat gemeinsam mit ihrem Kollegen Gustav Westberg von der Universität Örebro untersucht, wie Dall-E 3 insbesondere Teenager darstellt. Dabei stießen die Wissenschaftlerin und ihr Kollege auf mehrere auffällige Muster, die auf tiefere Probleme hinweisen.

Eine der zentralen Entdeckungen war die oberflächliche Darstellung von Vielfalt. Auf den ersten Blick scheinen die Bilder Personen unterschiedlicher ethnischer Herkunft zu zeigen. „Es ist auffällig, wie Dall-E einerseits auf ethnische und geschlechtsspezifische Vielfalt achtet, während die Bilder andererseits nicht sehr vielfältig sind“, erklärt Kvåle. Dies bedeutet, dass die visuelle Diversität auf den Bildern nur die Oberfläche berührt.

Stellenangebote im Bereich Softwareentwicklung

Softwareentwicklung Jobs
WACKER-Firmenlogo
Betreuungsingenieur (w/m/d) EMR WACKER
Nünchritz Zum Job 
Helmholtz-Zentrum Hereon-Firmenlogo
Systementwicklungsingenieurin (m/w/d) für Mess- und Steuerungssystemen Helmholtz-Zentrum Hereon
Geesthacht (bei Hamburg) Zum Job 
ESFORIN SE-Firmenlogo
Mitarbeiter*in Marktkommunikation & Prozesse (m/w/d) ESFORIN SE
PFISTERER Kontaktsysteme GmbH-Firmenlogo
Entwicklungsingenieur Hochspannungstechnik (m/w/d) PFISTERER Kontaktsysteme GmbH
Winterbach Zum Job 
PFISTERER Kontaktsysteme GmbH-Firmenlogo
Entwicklungsingenieur Hochspannungstechnik - HVDC (m/w/d) PFISTERER Kontaktsysteme GmbH
Winterbach Zum Job 
FCP IBU GmbH-Firmenlogo
Projektingenieur für schalltechnische Gutachten (m/w/d) FCP IBU GmbH
DFS Deutsche Flugsicherung GmbH-Firmenlogo
Consultant (w/m/d) Operational Strategy - TBO (Trajectory Based Operations) DFS Deutsche Flugsicherung GmbH
Bundesamt für Bauwesen und Raumordnung (BBR)-Firmenlogo
Ingenieurinnen und Ingenieure (w/m/d) Elektro-/Informationstechnik oder Nachrichtentechnik Bundesamt für Bauwesen und Raumordnung (BBR)
WISAG Gebäudetechnik Hessen Technischer Service GmbH & Co. KG-Firmenlogo
Projektleiter | Bauleiter (m/w/d) für Sicherheitstechnik WISAG Gebäudetechnik Hessen Technischer Service GmbH & Co. KG
Frankfurt am Main Zum Job 
Albtal-Verkehrs-Gesellschaft (AVG)-Firmenlogo
Instandhaltungsmanagement Strategie (m/w/d) Albtal-Verkehrs-Gesellschaft (AVG)
Karlsruhe Zum Job 
DFS Deutsche Flugsicherung GmbH-Firmenlogo
Referent (m/w/d) Anforderungsmanagement Funktionale Systeme DFS Deutsche Flugsicherung GmbH
Jauss HR-Consulting GmbH & Co. KG-Firmenlogo
Automatisierungstechniker / Ingenieur / Techniker (m/w/d) TIA-Programmierung & Inbetriebnahme - Baustoffanlagenbau Jauss HR-Consulting GmbH & Co. KG
Raum Würzburg Zum Job 
TenneT TSO GmbH-Firmenlogo
Ingenieur als Projektleiter Umspannwerke (m/w/d) TenneT TSO GmbH
Einsatzgebiet Ostniedersachsen Zum Job 
TenneT TSO GmbH-Firmenlogo
Ingenieur Elektrotechnik als Projektleiter Umspannwerke (m/w/d) TenneT TSO GmbH
Raum Südbayern (Oberpfalz, Niederbayern, Oberbayern) Zum Job 
VCDB VerkehrsConsult Dresden-Berlin GmbH-Firmenlogo
Projektingenieur Elektromobilität Bus (m/w/d) VCDB VerkehrsConsult Dresden-Berlin GmbH
Dresden Zum Job 
Verkehrsbetriebe Karlsruhe (VBK)-Firmenlogo
Abteilungsleitung ECM 4 "Instandhaltungserbringung" (m/w/d) Verkehrsbetriebe Karlsruhe (VBK)
Karlsruhe Zum Job 
Draheim Ingenieure-Firmenlogo
Elektroplaner*in (m/w/d) Draheim Ingenieure
Hamburg, Hamm, Aachen Zum Job 
Universität zu Köln-Firmenlogo
Projektingenieur*in (TGA) im Bereich Elektrotechnik Universität zu Köln
Die Autobahn GmbH des Bundes-Firmenlogo
Ingenieur als Projektleitung (w/m/d) Großprojekte Die Autobahn GmbH des Bundes
Frankfurt am Main Zum Job 
WACKER-Firmenlogo
Betriebsingenieur EMR (w/m/d) WACKER
Nünchritz Zum Job 
WACKER-Firmenlogo
Betreuungsingenieur (w/m/d) EMR WACKER
Nünchritz Zum Job 
Helmholtz-Zentrum Hereon-Firmenlogo
Systementwicklungsingenieurin (m/w/d) für Mess- und Steuerungssystemen Helmholtz-Zentrum Hereon
Geesthacht (bei Hamburg) Zum Job 
ESFORIN SE-Firmenlogo
Mitarbeiter*in Marktkommunikation & Prozesse (m/w/d) ESFORIN SE
PFISTERER Kontaktsysteme GmbH-Firmenlogo
Entwicklungsingenieur Hochspannungstechnik (m/w/d) PFISTERER Kontaktsysteme GmbH
Winterbach Zum Job 

Die Forschenden gaben der KI allgemeine Anweisungen wie „Erstelle Bilder von Teenagern“. Auch als sie Dall-E 3 erlaubten, selbst kreative Texteingaben zu generieren, änderte sich das Ergebnis kaum. Zwar wurde die Vielfalt betont, aber in den Details ähnelten sich die Darstellungen stark: Alle Teenager auf den Bildern tragen ähnliche Kleidung, sind durchweg attraktiv, haben makellose Haut und voluminöses Haar. Eine reale Vielfalt, die auch soziale und individuelle Unterschiede widerspiegelt, fehlt.

Eine übertrieben positive Darstellung

Ein weiteres gemeinsames Merkmal der von Dall-E generierten Bilder ist die durchweg positive Darstellung der Menschen und Situationen. Die Teenager erscheinen immer glücklich, sei es beim gemeinsamen Lernen, bei Konzerten oder in Freizeitaktivitäten. „Auf den Bildern sind alle glücklich, niemand ist traurig“, beschreibt Kvåle.

Dieses positive Bild lässt jedoch bestimmte Aspekte des Alltags komplett außen vor. Es fehlen Darstellungen von Arbeit oder Herausforderungen des Lebens. Die dargestellten Situationen sind meist Freizeitaktivitäten, die von der Gesellschaft geschätzt werden, wie Marshmallow-Grillen oder Konzertbesuche. Das Bildmaterial zeigt Menschen in einem idealisierten Umfeld, was oft nicht der Realität entspricht.„Es ist auffällig, wie Dall-E einerseits auf ethnische und geschlechtsspezifische Vielfalt achtet, während die Bilder andererseits nicht sehr vielfältig sind“, sagt Kvåle.

Fotorealismus als Standard

Ein drittes auffälliges Merkmal der von Dall-E erstellten Bilder ist der starke Fokus auf Fotorealismus. Die Beleuchtung, die Anordnung der Objekte im Bild sowie die Schauplätze wirken auf den ersten Blick authentisch. „Die Bilder erwecken den Eindruck von Authentizität“, so Kvåle, „aber durch den Kontext werden diese jungen Menschen auch sozial positioniert.“

Die Orte, an denen die Teenager dargestellt werden, sind Parks, Jugendclubs oder gemütliche Jugendzimmer. Doch eine Vielfalt an Szenarien, die auch weniger privilegierte Lebensumstände abbilden, fehlt fast vollständig.

Eingeschränkte Kreativität

Eine weitere Erkenntnis des Forschungsteams betrifft die begrenzte Vorstellungskraft von Dall-E. Obwohl die KI in der Lage ist, fantasievolle Szenarien zu erstellen, wie etwa Teenager, die in einer Schneekugel Schlittschuh laufen, geschieht dies nur auf ausdrückliche Aufforderung. Standardmäßig bevorzugt Dall-E realistische, fast sterile Darstellungen.

„Fotorealistische Bilder werden von Dall-E offensichtlich bevorzugt“, erklärt Kvåle. Dies lässt wenig Raum für kreative, alternative Darstellungen, die von der Realität abweichen.

Ein kritischer Blick auf KI-generierte Bilder

Bildgeneratoren wie Dall-E sind heute sehr leistungsfähig und zugänglich. Doch trotz der wachsenden Popularität dieser Technologie fluten sie nicht die Welt mit KI-generierten Bildern. „Es heißt, dass sich durch künstliche Intelligenz alles ändern wird, aber das stimmt eindeutig nicht“, merkt Kvåle an. In vielen Bereichen, wie etwa in Redaktionen oder Kommunikationsabteilungen, gelten weiterhin etablierte Standards.

Dennoch ist es wichtig, ein kritisches Bewusstsein für die Macht von KI-generierten Bildern zu entwickeln. „Dienste wie Dall-E können einen starken Einfluss auf unsere visuelle Kultur haben“, sagt Kvåle. Sie mahnt, dass die Art und Weise, wie diese Bilder Menschen und Situationen darstellen, nicht immer die Vielfalt und Realität unserer Gesellschaft widerspiegelt.

Hier geht es zur Originalpublikation

Ein Beitrag von:

  • Dominik Hochwarth

    Redakteur beim VDI Verlag. Nach dem Studium absolvierte er eine Ausbildung zum Online-Redakteur, es folgten ein Volontariat und jeweils 10 Jahre als Webtexter für eine Internetagentur und einen Onlineshop. Seit September 2022 schreibt er für ingenieur.de.

Zu unseren Newslettern anmelden

Das Wichtigste immer im Blick: Mit unseren beiden Newslettern verpassen Sie keine News mehr aus der schönen neuen Technikwelt und erhalten Karrieretipps rund um Jobsuche & Bewerbung. Sie begeistert ein Thema mehr als das andere? Dann wählen Sie einfach Ihren kostenfreien Favoriten.