Verzerrte Realität 21.10.2024, 13:30 Uhr

Warum KI-generierte Bilder oft zu positiv erscheinen

KI-generierte Bilder erscheinen oft übertrieben positiv. Expertinnen und Experten warnen vor einer zu einseitigen Darstellung, die die Realität verzerrt.

KI-Bild Teanager

Alle gut aussehend und aus einer sozialen Schicht: Soll eine KI Menschen, zum Beispiel Teenager, zeichnen, ist Vielfalt meist nur auf den ersten Blick gegeben.

Foto: Die Illustration hat das Forschungsteam mit Hilfe von ChatGPT/Dall-E 3 erstellt

Künstliche Intelligenz hat in den letzten Jahren eine beachtliche Entwicklung durchlaufen, insbesondere im Bereich der Bilderstellung. Tools wie Dall-E 3, ein KI-basierter Bildgenerator, der in ChatGPT integriert ist, erzeugen beeindruckend realistische Bilder. Doch es gibt eine zunehmende Kritik: Diese Bilder erscheinen oft übertrieben positiv und sind in ihrer Darstellung von Menschen und Situationen erstaunlich einseitig.

Vielfalt nur auf den ersten Blick

„Sie sind so schön gemacht, dass es aufdringlich wird“, sagt die Forscherin Gunhild Kvåle von der norwegischen Universität Agder. Diese Aussage fasst treffend die Kritik zusammen, die sich immer häufiger im Zusammenhang mit KI-generierten Bildern äußert. Kvåle hat gemeinsam mit ihrem Kollegen Gustav Westberg von der Universität Örebro untersucht, wie Dall-E 3 insbesondere Teenager darstellt. Dabei stießen die Wissenschaftlerin und ihr Kollege auf mehrere auffällige Muster, die auf tiefere Probleme hinweisen.

Eine der zentralen Entdeckungen war die oberflächliche Darstellung von Vielfalt. Auf den ersten Blick scheinen die Bilder Personen unterschiedlicher ethnischer Herkunft zu zeigen. „Es ist auffällig, wie Dall-E einerseits auf ethnische und geschlechtsspezifische Vielfalt achtet, während die Bilder andererseits nicht sehr vielfältig sind“, erklärt Kvåle. Dies bedeutet, dass die visuelle Diversität auf den Bildern nur die Oberfläche berührt.

Top Stellenangebote

Zur Jobbörse
Clees Wohnimmobilien GmbH & Co. KG-Firmenlogo
Bauingenieur (m/w/d) Clees Wohnimmobilien GmbH & Co. KG
Düsseldorf Zum Job 
Schleifring GmbH-Firmenlogo
Head of Sales and Project Management (m/w/d) Schleifring GmbH
Fürstenfeldbruck Zum Job 
ERGO Group AG-Firmenlogo
Technischer Objektmanager (m/w/d) ERGO Group AG
Schmoll Maschinen GmbH-Firmenlogo
Support-Techniker/-Ingenieur (m/w/d) LED-Lithographieanlagen Schmoll Maschinen GmbH
Rödermark Zum Job 
Stadt Hemer-Firmenlogo
Architekt/in bzw. Ingenieur/in (w/m/d) für unseren Hochbau in Vollzeit oder Teilzeit Stadt Hemer
Schmoll Maschinen GmbH-Firmenlogo
Projektingenieur / Maschinenbauingenieur (m/w/d) im Bereich Digitale LED-Anlagen Schmoll Maschinen GmbH
Rödermark Zum Job 
ASG Abwasserentsorgung Salzgitter GmbH-Firmenlogo
Geschäftsführung (m/w/d) der Abwasserentsorgung ASG Abwasserentsorgung Salzgitter GmbH
Salzgitter Zum Job 
Freie und Hansestadt Hamburg Behörde für Verkehr und Mobilitätswende-Firmenlogo
Projektingenieur:in Brückenbau Hamburg Freie und Hansestadt Hamburg Behörde für Verkehr und Mobilitätswende
Hamburg Zum Job 
Titan Umreifungstechnik GmbH & Co. KG-Firmenlogo
Technischer Einkäufer (m/w/d/) Titan Umreifungstechnik GmbH & Co. KG
Schwelm Zum Job 
SWR Südwestrundfunk Anstalt des öffentlichen Rechts-Firmenlogo
Fachgruppenleiter / Fachgruppenleiterin (w/m/d) Klimatechnik im Gebäudemanagement Baden-Baden SWR Südwestrundfunk Anstalt des öffentlichen Rechts
Baden-Baden Zum Job 
Excelitas Deutschland GmbH-Firmenlogo
Qualitätsingenieur (w/m/d) Produktentwicklung Excelitas Deutschland GmbH
Feldkirchen Zum Job 
Die Autobahn GmbH des Bundes-Firmenlogo
Abteilungsleitung Umweltplanung (w/m/d) Die Autobahn GmbH des Bundes
Schleifring GmbH-Firmenlogo
Konstruktionsingenieur mit Projektverantwortung (m/w/d) Schleifring GmbH
Fürstenfeldbruck Zum Job 
SWR Südwestrundfunk Anstalt des öffentlichen Rechts-Firmenlogo
Experte / Expertin Bauwesen (w/m/d) in der Abteilung Gebäudemanagement / Verwaltung Mainz SWR Südwestrundfunk Anstalt des öffentlichen Rechts
Heraeus Site Operations GmbH & Co. KG-Firmenlogo
Projektleiter (m/w/d) für Bauprojekte Heraeus Site Operations GmbH & Co. KG
Brandenburgischer Landesbetrieb für Liegenschaften und Bauen (BLB)-Firmenlogo
Projektleitung (m/w/d) für Hochbaumaßnahmen (Architekt/in o. Ingenieur/in) Brandenburgischer Landesbetrieb für Liegenschaften und Bauen (BLB)
Frankfurt (Oder) Zum Job 
Universitätsklinikum Leipzig-Firmenlogo
Projektleitung / Fachingenieur (m/w/d) - Schwachstromtechnik im Bereich 5 - Bau und Gebäudetechnik Universitätsklinikum Leipzig
Leipzig Zum Job 
ai6 SOLUTIONS GmbH-Firmenlogo
Entwickler Mechanik / Konstruktion (m/w/d) ai6 SOLUTIONS GmbH
Dessau-Roßlau Zum Job 
Schleifring GmbH-Firmenlogo
Key Account Manager Sicherheit und Verteidigung (m/w/d) Schleifring GmbH
Fürstenfeldbruck Zum Job 
J.P. Sauer & Sohn Maschinenbau GmbH-Firmenlogo
Elektroingenieur (m/w/d) Produktindustrialisierung J.P. Sauer & Sohn Maschinenbau GmbH

Die Forschenden gaben der KI allgemeine Anweisungen wie „Erstelle Bilder von Teenagern“. Auch als sie Dall-E 3 erlaubten, selbst kreative Texteingaben zu generieren, änderte sich das Ergebnis kaum. Zwar wurde die Vielfalt betont, aber in den Details ähnelten sich die Darstellungen stark: Alle Teenager auf den Bildern tragen ähnliche Kleidung, sind durchweg attraktiv, haben makellose Haut und voluminöses Haar. Eine reale Vielfalt, die auch soziale und individuelle Unterschiede widerspiegelt, fehlt.

Eine übertrieben positive Darstellung

Ein weiteres gemeinsames Merkmal der von Dall-E generierten Bilder ist die durchweg positive Darstellung der Menschen und Situationen. Die Teenager erscheinen immer glücklich, sei es beim gemeinsamen Lernen, bei Konzerten oder in Freizeitaktivitäten. „Auf den Bildern sind alle glücklich, niemand ist traurig“, beschreibt Kvåle.

Dieses positive Bild lässt jedoch bestimmte Aspekte des Alltags komplett außen vor. Es fehlen Darstellungen von Arbeit oder Herausforderungen des Lebens. Die dargestellten Situationen sind meist Freizeitaktivitäten, die von der Gesellschaft geschätzt werden, wie Marshmallow-Grillen oder Konzertbesuche. Das Bildmaterial zeigt Menschen in einem idealisierten Umfeld, was oft nicht der Realität entspricht.„Es ist auffällig, wie Dall-E einerseits auf ethnische und geschlechtsspezifische Vielfalt achtet, während die Bilder andererseits nicht sehr vielfältig sind“, sagt Kvåle.

Fotorealismus als Standard

Ein drittes auffälliges Merkmal der von Dall-E erstellten Bilder ist der starke Fokus auf Fotorealismus. Die Beleuchtung, die Anordnung der Objekte im Bild sowie die Schauplätze wirken auf den ersten Blick authentisch. „Die Bilder erwecken den Eindruck von Authentizität“, so Kvåle, „aber durch den Kontext werden diese jungen Menschen auch sozial positioniert.“

Die Orte, an denen die Teenager dargestellt werden, sind Parks, Jugendclubs oder gemütliche Jugendzimmer. Doch eine Vielfalt an Szenarien, die auch weniger privilegierte Lebensumstände abbilden, fehlt fast vollständig.

Auch interessant:

Eingeschränkte Kreativität

Eine weitere Erkenntnis des Forschungsteams betrifft die begrenzte Vorstellungskraft von Dall-E. Obwohl die KI in der Lage ist, fantasievolle Szenarien zu erstellen, wie etwa Teenager, die in einer Schneekugel Schlittschuh laufen, geschieht dies nur auf ausdrückliche Aufforderung. Standardmäßig bevorzugt Dall-E realistische, fast sterile Darstellungen.

„Fotorealistische Bilder werden von Dall-E offensichtlich bevorzugt“, erklärt Kvåle. Dies lässt wenig Raum für kreative, alternative Darstellungen, die von der Realität abweichen.

Ein kritischer Blick auf KI-generierte Bilder

Bildgeneratoren wie Dall-E sind heute sehr leistungsfähig und zugänglich. Doch trotz der wachsenden Popularität dieser Technologie fluten sie nicht die Welt mit KI-generierten Bildern. „Es heißt, dass sich durch künstliche Intelligenz alles ändern wird, aber das stimmt eindeutig nicht“, merkt Kvåle an. In vielen Bereichen, wie etwa in Redaktionen oder Kommunikationsabteilungen, gelten weiterhin etablierte Standards.

Dennoch ist es wichtig, ein kritisches Bewusstsein für die Macht von KI-generierten Bildern zu entwickeln. „Dienste wie Dall-E können einen starken Einfluss auf unsere visuelle Kultur haben“, sagt Kvåle. Sie mahnt, dass die Art und Weise, wie diese Bilder Menschen und Situationen darstellen, nicht immer die Vielfalt und Realität unserer Gesellschaft widerspiegelt.

Hier geht es zur Originalpublikation

Ein Beitrag von:

  • Dominik Hochwarth

    Redakteur beim VDI Verlag. Nach dem Studium absolvierte er eine Ausbildung zum Online-Redakteur, es folgten ein Volontariat und jeweils 10 Jahre als Webtexter für eine Internetagentur und einen Onlineshop. Seit September 2022 schreibt er für ingenieur.de.

Zu unseren Newslettern anmelden

Das Wichtigste immer im Blick: Mit unseren beiden Newslettern verpassen Sie keine News mehr aus der schönen neuen Technikwelt und erhalten Karrieretipps rund um Jobsuche & Bewerbung. Sie begeistert ein Thema mehr als das andere? Dann wählen Sie einfach Ihren kostenfreien Favoriten.