KI-ANWENDUNGEN 24.03.2023, 07:18 Uhr

Künstliche Intelligenz: Diese 15 KI-Tools sollten Sie kennen

Der Einsatz künstlicher Intelligenz hat sich längst etabliert. KI revolutioniert unseren Alltag und unser Berufsleben auf vielfältige Weise. Doch welche konkreten Anwendungen gibt es und welche KI-Tools sollten Sie kennen?

KI-Tools erleichtern auf vielfältige Weise Alltag und Berufsleben.

Foto: Panthermedia.net/Unimages2527 (YAYMicro)

KI-Tools erleichtern auf vielfältige Weise Alltag und Berufsleben.

Foto: Panthermedia.net/Unimages2527 (YAYMicro)

KI begegnet uns inzwischen überall. Angefangen bei der Nutzung von Sprachassistenten wie Alexa oder Siri, die auf KI-Algorithmen basieren, um Fragen zu beantworten oder einfache Aufgaben erledigen bis hin zu vergleichsweise komplexen Herausforderungen im Bereich der Medizin, bei dem künstliche Intelligenz z. B. zur Diagnosestellung herangezogen wird. Ferner hilft sie, Prozesse in Unternehmen zu optimieren oder spätestens seit der Salonfähigkeit von ChatGPT Schülern und Schülerinnen bzw. Studierenden Zeit bei den Hausarbeiten zu sparen. Manchmal mit mehr oder weniger korrekten Inhalten. Aber wer braucht schon Fakten, wenn Satzbau und Orthografie stimmen?

Selbstverständlich stecken KI-Modelle, welche die Grundlage für die Entwicklung und Nutzung von KI-basierten Tools bilden, noch in den Kinderschuhen. Dennoch nehmen uns solche Anwendungen teilweise heute schon Arbeit ab, bereichern uns und sorgen hier und da für den ein oder anderen Lacher.

Top Stellenangebote

Zur Jobbörse
FH Münster-Firmenlogo
Mitarbeiter/in (w/m/d) zur Koordination der Schulkontakte FH Münster
Steinfurt Zum Job 
über ifp l Personalberatung Managementdiagnostik-Firmenlogo
Stellvertretende Leitung Bau- und Gebäudetechnik (m/w/d) über ifp l Personalberatung Managementdiagnostik
Rhein-Main-Gebiet Zum Job 
Die Autobahn GmbH des Bundes-Firmenlogo
Bauingenieur (w/m/d) Brückenprüfung Die Autobahn GmbH des Bundes
TAUW GmbH-Firmenlogo
Projektingenieur:in (m/w/d) Hydro(geo)logische Modellierungen TAUW GmbH
verschiedene Standorte Zum Job 
PNE AG-Firmenlogo
Experte Technischer Einkauf für Windenergieanlagen (m/w/d) PNE AG
Hamburg, Husum, Cuxhaven Zum Job 
Stadtwerke München GmbH-Firmenlogo
Instandhaltungsmanager*in (m/w/d) Stadtwerke München GmbH
München Zum Job 
Rittal GmbH & Co. KG-Firmenlogo
Maschinenbauingenieur / Prüfingenieur (m/w/d) Dynamik / Schwingungstechnik Rittal GmbH & Co. KG
Herborn Zum Job 
Fraunhofer-Institut für Angewandte Festkörperphysik IAF-Firmenlogo
Wissenschaftler (m/w/d) - angewandte NV-Magnetometrie und Laserschwellen-Magnetometer Fraunhofer-Institut für Angewandte Festkörperphysik IAF
Freiburg im Breisgau Zum Job 
Deutsche Rentenversicherung Bund-Firmenlogo
Teamleiter*in Bauprojekte Elektrotechnik (m/w/div) Deutsche Rentenversicherung Bund
Stadtwerke Frankenthal GmbH-Firmenlogo
Energieberater (m/w/d) Stadtwerke Frankenthal GmbH
Frankenthal Zum Job 
Griesemann Gruppe-Firmenlogo
Lead Ingenieur Elektrotechnik / MSR (m/w/d) Griesemann Gruppe
Köln, Wesseling Zum Job 
Vita Zahnfabrik H. Rauter GmbH & Co. KG-Firmenlogo
Konstrukteurin / Konstrukteur Maschinen und Anlagen Vita Zahnfabrik H. Rauter GmbH & Co. KG
Bad Säckingen Zum Job 
PARI Pharma GmbH-Firmenlogo
Senior Projekt-/Entwicklungsingenieur (m/w/d) in der Konstruktion von Medizingeräten PARI Pharma GmbH
Gräfelfing Zum Job 
ABO Wind AG-Firmenlogo
Projektleiter (m/w/d) Umspannwerke 110kV für erneuerbare Energien ABO Wind AG
verschiedene Standorte Zum Job 
Berliner Wasserbetriebe-Firmenlogo
Bauingenieur:in Maßnahmenentwicklung Netze (w/m/d) Berliner Wasserbetriebe
Die Autobahn GmbH des Bundes-Firmenlogo
Abteilungsleitung (m/w/d) Umweltmanagement und Landschaftspflege Die Autobahn GmbH des Bundes
Residenzstadt Celle-Firmenlogo
Abteilungsleitung (d/m/w) für die Stadtplanung im Fachdienst Bauordnung Residenzstadt Celle
Die Autobahn GmbH des Bundes-Firmenlogo
Ingenieur (w/m/d) Verkehrsbeeinflussungsanlagen Die Autobahn GmbH des Bundes
Hamburg Zum Job 
VIVAVIS AG-Firmenlogo
Projektleiter (m/w/d) Angebotsmanagement VIVAVIS AG
Ettlingen, Berlin, Bochum, Koblenz Zum Job 
Die Autobahn GmbH des Bundes-Firmenlogo
Projektingenieur (w/m/d) Telematik-Infrastruktur Die Autobahn GmbH des Bundes
Frankfurt am Main Zum Job 

KI ist nicht gleich KI

KI-Tools nutzen eine Vielzahl von KI-Modellen, um eine breite Palette von Aufgaben und Anwendungen zu bewältigen. Es gibt verschiedene Arten von KI-Modellen, die in KI-Tools weit verbreitet sind. Im Folgenden sind einige der gängigsten KI-Modelle aufgeführt.

  1. Supervised Learning (überwachtes Lernen) beschreibt eine Methode, bei der Modellen Trainingsdaten mit Eingabe-Ausgabe-Paaren zur Verfügung gestellt werden. Auf diese Weise können die Modelle die Beziehung zwischen Eingaben und Ausgaben erlernen. Dieser Ansatz wird oft bei Klassifizierungs- und Regressionsproblemen eingesetzt.
  2. Unsupervised Learning (unüberwachtes Lernen) ist ein Ansatz, bei dem Modelle eigenständig aus einem Datenpool lernen, ohne dass ihnen vorgegebene Kategorien oder Labels zur Verfügung stehen. Hierbei werden Methoden wie Clustering und Dimensionsreduktion angewendet.
  3. Beim Reinforcement Learning (bestärkendes Lernen) erwerben Modelle die Fähigkeit, Entscheidungen zu treffen, indem sie Handlungen ausführen und Rückmeldungen in Form von Belohnungen oder Sanktionen erhalten. Dieser Ansatz ist besonders geeignet für Aufgaben, die eine Optimierung von Entscheidungen erfordern, wie beispielsweise in Spielsituationen oder bei der Kontrolle von Robotern.
  4. Deep Learning (tiefes Lernen) ist eine fortschrittliche Methode des maschinellen Lernens, die auf künstlichen neuronalen Netzen mit zahlreichen Schichten basiert. Diese Technologie ermöglicht es, komplexe Muster und Hierarchien in Daten zu erkennen und ist besonders effektiv bei der Bild- und Spracherkennung, Übersetzung und Textanalyse.
  5. Transfer Learning (Transferlernen) nutzt Modelle, die bereits durch umfangreiche Datenmengen trainiert wurden, um schnell ähnliche, aber neue Aufgaben zu bewältigen. Dieser Ansatz beschleunigt den Trainingsprozess erheblich und ermöglicht es, Modelle mit weniger Daten anzupassen.
  6. Generative Adversarial Networks (GANs) sind ein innovatives Konzept, bei dem zwei neuronale Netze in einem Wettstreit gegeneinander antreten. Während eines der Netze künstliche Daten kreiert, ist es die Aufgabe des anderen Netzes, die Authentizität dieser Daten zu evaluieren. GANs sind besonders geeignet für Anwendungen wie die Synthese von Bildern und Videos oder die Erzeugung von Texten.

Diese KI-Modelle lassen sich je nach spezifischen Anforderungen und Aufgaben in verschiedenen KI-Tools und -Anwendungen einsetzen. Wir stellen Ihnen 15 bemerkenswerte KI-Tools vor, die Sie unbedingt kennen sollten.

Vorschlag #1: Brain.fm für KI-generierte Musik

Die Künstliche Intelligenz hinter Brain.fm generiert musikalische Stimmungen und soll dabei helfen, Konzentration, Entspannung oder Schlaf zu fördern. Dabei wird Musik abgespielt, die bestimmte Reize ansprechen und dabei die gewünschte Wirkung entfachen soll. Bereits nach etwa 15 Minuten tritt den Entwicklern zufolge eine Änderung im eigenen Verhalten und Befinden ein.

Das Online-Musik-Tool verwendet aber nicht ausschließlich KI zur Generierung von Musikstücken. Vielmehr komponieren Menschen die musikalischen Inhalte und legen Melodien, Instrumente, Harmonien und Akkordfolgen fest. Die künstliche Intelligenz fügt diese anschließend zu einem (mitunter langem) Musikstück zusammen und addiert Modulationen, die die Gehirnaktivität entsprechend der Auswahl verändern sollen.

Brain.fm arbeitet mit Neurologen zusammen und will mit diesem Schachzug sichergehen, mit den generierten Schallwelten die richtigen Bereiche im menschlichen Gehirn anzusprechen. Die positive Auswirkung wird nicht nur durch zahlreiche Nutzerrezensionen belegt, sondern auch durch wissenschaftliche Messdaten untermauert. Dabei wurden in einer Studie drei Arten unterschiedlicher Hintergrundbedingungen abgespielt und in Experimenten per EEG und fMRT analysiert, um auf diesem Weg die Gehirnaktivität mit der Musik in Beziehung setzen zu können.

Vorschlag #2: Auphonic zur Optimierung von Audioinhalten und Tonspuren

Das KI-basierte Audiobearbeitungstool Auphonic ist seit 2011 auf dem Markt und unterstützt Medienschaffende in der Audio-Postproduktion. Mit der Anwendung können Nutzer ihre Audiodateien automatisch bearbeiten lassen. Dabei werden verschiedene Parameter wie Lautstärke, Rauschen oder Störgeräusche analysiert und nach gängigen Standards entsprechend angepasst.

Die zugrunde liegende Technologie von Auphonic stützt sich auf maschinelles Lernen, wodurch das Tool kontinuierlich weiterentwickelt wird. Die Ergebnisse können sich durchaus sehen lassen: Selbst bei schlechter Ausgangsqualität kann Auphonic das Klangbild deutlich verbessern. Besonders interessant ist Auphonic im semiprofessionellen Bereich, zum Beispiel für Podcaster, YouTuber und Journalisten, die regelmäßig Audioaufnahmen produzieren.

Selbst im privaten Gebrauch kann Auphonic eine nützliche Ergänzung sein, um zum Beispiel Familienaufnahmen oder selbst aufgenommene Musikstücke qualitativ ins bessere Licht zu rücken. Die Bedienung der Plattform ist dabei simpel gestaltet, sodass sich auch technisch weniger versierte Nutzer schnell zurechtfinden.

Vorschlag #3: Beautiful.ai für Präsentationen

Die Online-App Beautiful.ai vereint künstliche Intelligenz mit einer auf das Wesentliche reduzierten Präsentationssoftware. Mit slides that design themselves ermöglicht das Tool den Entwicklern zufolge jedem noch so unversierten Präsentations-Designer, ansprechende Folien in sauberem Layout zu entwerfen und anschließend zu exportieren. Neben einer webbasierenden App stehen außerdem Plug-ins für diverse Präsentationsanwendungen bereit, sodass sich Beautiful.ai beispielsweise auch in Microsoft PowerPoint nutzen lässt.

Die verfügbaren Layouts sind dabei so gestaltet, dass diese sich automatisch dem Inhalt anpassen. Dies reduziert nicht nur den Zeitaufwand beim Verschieben von Elementen, sondern gewährleistet auch, dass alle Bildelemente und Texte in einer ansprechenden und ästhetischen Anordnung platziert sind. Darüber hinaus bringt Beautiful.ai eine Sammlung lizenzfreier Bilder mit, die direkt in die Präsentation integriert werden können.

Die KI übernimmt aber nicht nur das Layout, sondern kann bei Bedarf auch automatische Animationen erstellen. Eine individuelle Positionierung der Elemente auf der Folie ist aber nur eingeschränkt möglich. Das Tool richtet sich laut Angaben des Entwicklers an Best Practices für gelungenes Präsentationsdesign und orientiert sich vordergründig an sauberen, professionellen und modernen ästhetischen Richtlinien.

Vorschlag #4: LanguageTool für KI-Lektorat

Während zahlreiche Werkzeuge zur Rechtschreib- und Grammatikprüfung nur an der Oberfläche textlichen Contents kratzen, ist die Browsererweiterung LanguageTool in der Lage, das geschriebene Wort auch inhaltlich zu erfassen. Daraus resultiert die Möglichkeit, kontextuelle Fehler zu finden und die Korrekturmöglichkeiten nicht nur auf simple Rechtschreibung und Grammatik in mehr als 30 Sprachen und Dialekten zu beschränken – wie beispielsweise Wortverwechslungen oder inhaltliche Fehler. Dieses Feature geht so weit, dass etwa sogar Wochentage bei Datumsangaben auf ihre Korrektheit geprüft werden.

Das Tool steht als Browser-Erweiterung für Microsoft Edge, Mozilla Firefox, Google Chrome und Apple Safari zur Verfügung und lässt sich auch in bekannte Office-Anwendungen wie Microsoft Word und Google Docs integrieren. Darüber hinaus steht eine eigenständige Desktop-App für Windows und Mac OS zur Verfügung sowie ein Plug-in für diverse E-Mail-Clients.

LanguageTool eignet sich darüber hinaus auch, um Sätze durch künstliche Intelligenz umformulieren zu lassen und ganze Haus- bis Masterarbeiten in einen möglichst fehlerfreien Zustand zu verwandeln – ein manuelles, finales Korrekturlesen legen wir dennoch ans Herz.

Vorschlag #5: Jasper.ai für kreative Texte in 25 Sprachen

Jasper.ai ist eine KI-gestützte Anwendung, die auf Machine Learning und Natural Language Processing basiert, um automatisch ansprechende Texte zu generieren. Jasper.ai analysiert dabei den Kontext und das Ziel der Texte und generiert dann passende Formulierungen in durchaus brauchbarer Qualität. Dabei werden nicht nur Grammatik und Rechtschreibung, sondern auch Stilistik berücksichtigt.

Jasper.ai verfügt über eine Anpassungsfunktion, die es dem Benutzer ermöglicht, den generierten Text dem Stil bekannter Persönlichkeiten anzupassen oder einen bestimmten Tonfall zu treffen. Es ist jedoch wichtig zu beachten, dass die Richtigkeit der Informationen noch einmal separat überprüft werden sollte, um sicherzustellen, dass diese auch korrekt sind.

Zudem verfügt Jasper.ai über Funktionen zur Textoptimierung. Durch die eingebaute Analysefunktion für Schlüsselbegriffe und -phrasen kann die App Empfehlungen zur Verbesserung des Textes geben. Die KI-basierte Anwendung kann ebenfalls Texte hinsichtlich der Befolgung von SEO-Vorgaben anpassen, um zu gewährleisten, dass der Inhalt von Suchmaschinen besser wahrgenommen wird. Außerdem lassen sich mit Jasper Art KI-generierte Bilder erstellen.

Vorschlag #6: Murf als Text-to-Speech-Generator

Voice-Overs für Videoclips oder Podcasts zu erstellen ist in der Regel häufig mit größeren Anforderungen an das Budget geknüpft. Nicht jeder nennt ein professionelles Aufnahmestudio sein Eigen und Kontakte zu professionellen Synchronsprechern finden sich ebenfalls nur mit größerem Aufwand. Das KI-Tool Murf soll für diese Szenarien Abhilfe schaffen und Text in natürliche Sprache verwandeln.

Murf setzt auf eine dahinterliegende Cloud-Infrastruktur und benötigt demnach keine spezielle Hard- oder Software Seiten des Nutzers. Direkt über den Browser lassen sich sämtliche Parameter festlegen, Text einfügen und als Ergebnis eine natürlich klingende Audiodatei herunterladen.

Diverse Werkzeuge wie eine individuelle Betonung einzelner Silben sowie Regler für Geschwindigkeit und Tonhöhe lassen geschriebene Scripts durchaus realistisch wirken. Ferner besteht die Möglichkeit, Audiodateien mit der eigenen Stimme hochzuladen und daraus eine KI-generierte Stimme zu erzeugen.

Vorschlag #7: Fireflies für Notizen im Business-Meeting

Fireflies wurde speziell für Business-Meetings entwickelt. Die App ermöglicht es den Teilnehmern, ihre Notizen und Aufgaben automatisch aufzuzeichnen und zu organisieren. Dadurch werden Mitschriften und Notizen während eines Meetings überflüssig.

Dabei nutzt die KI-Anwendung Spracherkennungstechnologie, um alle Gespräche im Meeting aufzunehmen und in Textform umzuwandeln. Diese Transkriptionen können dann einfach durchsucht oder als Zusammenfassung an alle Teilnehmer gesendet werden. Ferner kann die App auch Aktionselemente wie To-do-Listen erstellen oder wichtige Informationen markieren. Dies kann nicht nur die Aufarbeitung des Meetings vereinfachen, sondern beispielsweise auch Protokollführern bei der Anfertigung von Berichten und Protokollen Arbeit abnehmen.

Unterm Strich ist Fireflies eine App, die dazu dient, die Produktivität bei Business-Meetings zu steigern und den Informationsaustausch zwischen den Teilnehmern zu erleichtern. Die KI-Anwendung ermöglicht eine einfache Aufzeichnung von Notizen und Aufgaben, ohne dass die Teilnehmer einen Notizblock dabeihaben müssen.

Vorschlag #8: BHuman für personalisierte Videos

BHuman ist eine Anwendung, die es Benutzern ermöglicht, personalisierte Videos zu generieren. Dies wird durch die Verwendung von KI-Technologie ermöglicht, die Daten wie Namen, Standorte und andere relevante Informationen in die Videos einfügt. Die generierten personalisierten Videos können dann für eine Vielzahl von Zwecken genutzt werden.

Um ein individuelles Video zu erstellen, muss der Anwender zunächst eine Vorlage aufnehmen. Wichtig ist, dass an relevanten Stellen Pausen eingelegt werden, sodass die Software weiß, wann personalisierte Daten eingesetzt werden sollen. Die Vorlage wird anschließend von der künstlichen Intelligenz analysiert und genutzt, um das personalisierte Video zu generieren. Die benötigten Informationen können über eine Tabelle, eine Erweiterung oder direkt über die API der Anwendung bereitgestellt werden.

Zudem bietet die Anwendung eine Vielzahl an Optionen, um die Videos für den vorgesehenen Zweck anzupassen. Das betrifft neben den eingefügten Daten unter anderem das Format, die Länge, den Stil und die Hintergrundmusik.

Vorschlag #9: Browse AI für das Website-Monitoring

Mit Browse AI ist es möglich, Informationen aus Webseiten zu extrahieren und diese anschließend in eine Tabelle einzufügen. Was auf den ersten Blick vielleicht nicht unbedingt nach einer häufig genutzten Funktion im World Wide Web klingt, bietet bei genauerer Betrachtung einige Möglichkeiten.

Während auf konventionellem Weg für diese Art von Vorhaben mindestens erweiterte Grundkenntnisse in Tabellenkalkulation und vielmehr Programmierung ratsam sind, übernimmt bei Browse AI die KI. Dabei ist es irrelevant, ob sich die gewünschten Daten hinter einer tief verschachtelten Seitenstruktur oder gar einem Login verstecken. Außerdem stehen bereits vorgefertigte „Roboter“ zur Auswahl, beispielsweise für die automatisierte Auflistung von Jobangeboten auf LinkedIn.

Darüber hinaus ist Browse AI in der Lage, durch Benutzereingaben und Makros selbst zu lernen und auf nahezu jeder Webseite die gewünschten Informationen zu extrahieren. Während dieses Vorgangs überlagert als nettes Gimmick ein kugelrunder Roboterkopf die Webseite und folgt der Auswahl einzelner Tabellenfelder für die spätere Datenextraktion.

ChatGPT

Mit dem freien Zugang von ChatGPT konnten viele Menschen erstmals selbst testen, was KI leisten kann.

Foto: Panthermedia.net/naretsaiipan@gmail.com

Vorschlag #10: ChatGPT zum Texten und Programmieren auf Kommando

ChatGPT ist eine künstliche Intelligenz, die auf der GPT-Architektur von OpenAI basiert und speziell für das Texten und Programmieren auf Kommando entwickelt wurde. Mit ChatGPT lassen sich schnell und einfach Texte oder Programme erstellen, indem Anfragen in natürlicher Sprache eingeben werden.

Die KI lernt kontinuierlich dazu und passt sich an neue Sprachmuster an, wodurch sie im Laufe der Zeit noch leistungsfähiger wird. Sie kann sogar kreatives Schreiben unterstützen, indem sie Geschichten oder Gedichte generiert, die auf den Eingaben des Benutzers basieren. Mithilfe neuronaler Netzwerktechnologie und maschinellem Lernen erlaubt ChatGPT natürliche und präzise Interaktionen mit Benutzern. Das System kann verschiedene Aufgaben bewältigen, wie das Beantworten von Fragen, Empfehlungen geben, Texte verfassen und Probleme in unterschiedlichen Bereichen, wie zum Beispiel in der Programmierung lösen.

ChatGPT analysiert eingegebene Texte, versteht den Kontext und generiert entsprechend relevante Antworten. Obwohl die KI über ein umfangreiches Wissen (bis 2021) verfügt, hat sie auch Grenzen und ist möglicherweise nicht immer aktuell oder in der Lage, bestimmte Spezialthemen tiefgehend zu behandeln.

Vorschlag #11: ClipDrop als intelligenter Designassistent

ClipDrop ist eine Anwendung, die es dem Nutzer ermöglicht, Bilder aus der realen Welt zu scannen und im Anschluss per Drag-and-drop in verschiedenen digitalen Formaten zu verwenden.

Darüber hinaus stellt ClipDrop ein Sammelsurium KI-basierter Tools zur Erstellung und Bearbeitung von Bildmaterial zur Verfügung. Zu den Tools gehören unter anderem das automatische Freistellen von Objekten, das Hinzufügen von Schatten und Reflexionen, das Ändern von Farben und Helligkeit sowie das Entfernen von Text und Personen.

Im Vergleich zu anderen Grafikprogrammen bietet ClipDrop den Vorteil einer intuitiven Bedienbarkeit, sodass auch Nutzer ohne umfangreiche Vorerfahrung in der Bildbearbeitung schnell mit der Anwendung arbeiten können. ClipDrop richtet sich aber nicht nur an Einsteiger, sondern auch an Experten, die sich die Arbeit vielleicht etwas erleichtern möchten. Pixel-perfektes Design und Layout liegen jedoch immer noch nicht im Auge der KI, sondern in jenem des Grafikers.

Vorschlag #12: Compose AI zum Auto-Vervollständigen von Sätzen

Auto-Vervollständigen ist für viele Anwendungsfälle eine praktische Ergänzung zum natürlichen Schreibfluss und kann die Schreibgeschwindigkeit vor allem auf Mobilgeräten steigern. Dennoch reichen die Vorhersagen häufig von nicht ganz passend bis völlig fehl am Platz. Compose AI nimmt sich dieses Problems an und soll durch KI-gestützte Autovervollständigung das eigene Schreibtempo erhöhen.

Aktuell steht das KI-Tool für Google Docs und Gmail sowie als Plug-in für Google Chrome (und demzufolge auch für Opera oder Microsoft Edge) zur Verfügung, soll aber bald für weitere Anwendungsgebiete freigegeben werden. Die Autovervollständigen-Funktion sieht ähnlich aus wie jene aus der Google-Suchzeile und ermöglicht eine Auswahl mehrerer Vorschläge zur Vollendung des aktuellen Satzes. Außerdem bietet Compose AI die Möglichkeit, Sätze umschreiben oder sogar Textpassagen generieren zu lassen.

Die Autovervollständigen-Funktion analysiert dabei den bisherigen Textinhalt sowie den persönlichen Schreibstil und trifft dadurch bessere Vorhersagen als die meisten konventionellen Bildschirmtastaturen.

Vorschlag #13: DALL-E2 für das Malen auf Befehl

Als Nachfolger von DALL-E bringt Version 2 zahlreiche Neuerungen und vor allem größeren Fotorealismus sowie höhere Auflösungen mit. Die Namensgebung lässt bereits vermuten, dass es sich bei diesem KI-Werkzeug um einen Bildgenerator handelt, auf den der Künstler Salvador Dalí bestimmt neidisch gewesen wäre.

Dall-E2 bietet Nutzern die Möglichkeit, durch eine simple textliche Beschreibung eines oder mehrere Bilder zu generieren. Das Endergebnis kann sich in Version 2 durchaus sehen lassen, erlaubt aber maximal eine Bildgröße von 1024 x 1024 Pixeln – welche etwa für ein Storyboard oder die Skizzierung einer Idee völlig ausreicht, aber entgegen der weitläufigen Meinung keine Bedrohung für Grafiker und Kreativschaffende darstellen sollte.

Unter der Haube steckt bei DALL-E2 ein mächtiger Unterbau, nämlich eine multimodale Implementierung von GPT-3. Diese ist in der Lage, Texte zu interpretieren und durch Pixel zu ersetzen. GPT-3 selbst wurde mit mehreren Hundert Gigabyte an Texten trainiert und zählt zu den aktuell umfangreichsten Sprachmodellen.

Vorschlag #14: Descript Overdub zum Klonen von Stimmen

Descript Overdub ist wohl das umstrittenste KI-Tool aus unserer Liste. Ethisch äußerst fragwürdig, aber faszinierend zugleich. Die Anwendung ermöglicht es dem Nutzer, seine eigene Stimme zu klonen und beliebige Texte zu sprechen. Dabei wird die KI trainiert, die individuellen Sprachmuster des Nutzers zu erkennen und zu imitieren.

Während Descript Overdub für einige Anwendungsbereiche wie beispielsweise Podcasts oder Hörbücher durchaus nützlich sein kann, gibt es auch Bedenken hinsichtlich der möglichen Missbrauchsmöglichkeiten. So könnte das Tool beispielsweise dazu genutzt werden, gefälschte Audioaufnahmen von Politikern oder anderen Personen des öffentlichen Lebens anzufertigen. Es bleibt abzuwarten, wie sich diese Technologie weiterentwickelt und welche Auswirkungen sie auf unsere Gesellschaft haben wird. Sowohl Entwickler als auch Nutzer sollten verantwortungsvoll handeln und ethische Standards beachten, um Innovationen zu fördern und Sicherheit sowie Privatsphäre zu schützen.

Neben der Generierung von synthetischer Sprache bietet Descript Overdub auch umfassende Audio-Editing-Tools und Transkriptionsdienste.

Vorschlag #15: Kaiber für Videos auf Knopfdruck

Während sich Bildgeneratoren wie DALL-E2 nur sinnvoll für Einzelbilder einsetzen lassen, geht die KI von Kaiber einen Schritt weiter. Das Online-Tool erlaubt nämlich die Erstellung von Videoclips mithilfe künstlicher Intelligenz. Dabei dienen einige wenige hochgeladene Bilder beziehungsweise eine detaillierte textliche Beschreibung als Vorlage. Die KI bastelt daraufhin ein Videoclip aus dem vorhandenen Material.

Darüber hinaus erlaubt das Werkzeug, eigene Textinhalte manuell im Video zu platzieren – bekanntlich ist KI damit noch etwas überfordert. Ferner kann der Benutzer aus der integrierten Musikbibliothek die passende Untermalung für das Video auswählen. Letzteres funktioniert aber auch umgekehrt. Kaiber wird gerne auch für die Erstellung von Musikvideos genutzt. Beispielsweise entstand mit diesem Tool das offizielle Musikvideo zu Lost von Linkin Park. Der bis dato noch nicht erschienene Titel wurde anlässlich des 20-jährigen Jubiläums des in Deutschland mit Platin ausgezeichneten Albums Meteora veröffentlicht.

Das gerenderte Video sieht am Ende durchaus homogen und, je nach Vorgaben, realistisch aus. Dennoch lässt sich bereits ab dem zweiten Einzelbild erkennen, dass das Werk einer KI entstammt. Die Einzelbilder werden hier zwar mit großer Übereinstimmung ausgegeben, dennoch wird jedes Bild einzeln generiert und dadurch entstehen Abweichungen und unruhige Bildfolgen – was aber natürlich auch gewollt sein kann.

KI-gestützte Tools und ihre Weiterentwicklung

Künstliche Intelligenz hat zweifellos das Potenzial, unsere Arbeitsweise grundlegend zu verändern und Einfluss auf die Lebensqualität eines jeden zu nehmen. Deshalb ist es unerlässlich, ethische Überlegungen in den Vordergrund zu stellen, um sicherzugehen, dass der Fortschritt nachhaltig und verantwortungsbewusst erfolgt.

In diesem Sinne sollte die Entwicklung von KI-basierten Tools stets darauf abzielen, den Menschen in den Mittelpunkt zu stellen und das Wohl der Gesellschaft als Ganzes zu betrachten. Durch die Schaffung von Richtlinien, die sowohl die technische als auch die ethische Weiterentwicklung berücksichtigen, können wir sicherstellen, dass KI-gestützte Tools in einer Weise genutzt werden, die dem Fortschritt förderlich ist und gleichzeitig die Werte, die uns als Menschheit ausmachen, wahrt.

Ein Beitrag von:

  • Silvia Hühn

    Silvia Hühn ist freie Redakteurin mit technischem Fokus. Sie schreibt unter anderem über die Rekorde dieser Welt und verfasst Ratgeber.

Zu unseren Newslettern anmelden

Das Wichtigste immer im Blick: Mit unseren beiden Newslettern verpassen Sie keine News mehr aus der schönen neuen Technikwelt und erhalten Karrieretipps rund um Jobsuche & Bewerbung. Sie begeistert ein Thema mehr als das andere? Dann wählen Sie einfach Ihren kostenfreien Favoriten.