Datenbanksysteme 12.11.2020, 07:01 Uhr

Neues Tool macht Datenbanken sicherer

Schneller und mehr Leistung – diese Anforderungen werden zunehmend an Datenbanken gestellt. Der Nachteil: Die Zuverlässigkeit sinkt. Forscher der ETH Zürich haben nun drei verschiedene Methoden entwickelt, mit denen sich automatisch logische Fehler in Datenbanken aufspüren lassen. Schließlich sind sie das Rückgrat der Informatik.

Datenbank

Forscher der ETH Zürich haben ein Tool entwickelt, mit dem sie automatisch logische Fehler in SQL-Datenbanken finden.

Foto: Panthermedia.com/Smlyubov

Manuel Rigger, Informatiker an der ETH Zürich, testete zwei Wochen lang neue Methoden, wertete relevante Daten aus und fasste Ergebnisse zusammen. Am Ende musste er feststellen: Ein Fehler im Datenbank-Management-System hatte dafür gesorgt, dass seine gesamte Arbeit aus den zwei Wochen verlorengegangen war. Sein Ärger wurde zur Motivation: Gemeinsam suchte der Testing-Spezialist mit dem Leiter des Advanced Software Technologie Labs, Zhendong Su, nach einer Lösung für das Problem.

Bei ihrer Recherche waren die Wissenschaftler überrascht, wie viele logische Fehler es in Datenbank-Management-Systemen (DBMS) tatsächlich gibt. „Mit unseren Methoden haben wir beispielsweise in der auf fast allen Smartphones und auch in vielen Web-Browsern laufenden SQLite-Datenbank über 150 Programmierfehler entdeckt. Und das ist kein extremer Fall. Die Quote ist in allen Systemen, die wir bisher untersucht haben, ähnlich groß“, erklärt Rigger.

Datenbanken können unbemerkt falsche Antworten liefern

Nutzer eines Smartphones gehen automatisch davon aus, dass darin abgespeicherte Informationen mit der richtigen Abfrage auch zu finden sind – beispielsweise Adressen oder Telefonnummern. Das ist vergleichbar mit der Suche in einem Online-Shop: Man gibt den passenden Suchbegriff ein und findet den gewünschten Artikel. Allerdings ist es möglich, dass im dem Datenbank-Management-System ein Fehler vorliegt. In dem System werden nicht nur die gespeicherten Informationen verwaltet, sondern von dort aus kommen auch die Antworten zu der Suchanfrage. Nun kann es durchaus passieren, dass falsche Antworten geliefert werden, ohne dass wir als Nutzer diesen Fehler bemerken.

ETH-Informatiker Rigger vermutet folgende Gründe für die hohe Anzahl an Fehlern: Einerseits seien Datenbanken heute sehr komplex und umfassen bis zu mehrere Millionen Zeilen Programm-Code. Bei einer solchen Fülle seien Programmierfehler kaum zu vermeiden. Auf der anderen Seite könne man logische Fehler nicht ganz so einfach finden, da sie im Gegensatz zu Bugs, die meist das ganze System zum Absturz bringen, eher selten offensichtlich zu erkennen sind. Oftmals muss man einen Vergleich zum richtigen Ergebnis ziehen, um diese Fehler zu finden.

Dahinter stand bisher allerdings ein erheblicher Aufwand und die dazu gängige Praxis wurde bereits vor über 20 Jahren entwickelt. Sie vergleicht Abfragen unterschiedlicher Datenbanksysteme. Das Knifflige daran: Hersteller nutzen für ihre Datenbanken sehr individuelle Erweiterungen oder Anpassungen. Dadurch sind eindeutig vergleichbare Fragen auf einen kleinen Kernbereich der Systeme beschränkt. Die Abfragesprachen der Hersteller sind vergleichbar mit Dialekten in unserer Sprache. Das bedeutet: Sie unterscheiden sich zum Teil erheblich voneinander. Nach Riggers persönlicher Einschätzung sei die Fehlersuche in Datenbanken wenig attraktiv. Vor allem, wenn man berücksichtigt, dass der Trend aktuell besonders in die Richtung geht, solche Systeme mithilfe künstlicher Intelligenz noch leistungsfähiger zu machen.

Drei Lösungsmethoden in einem Tool vereint

Das Forscher-Duo hat als Lösung drei verschiedene Methoden entwickelt, mit denen sich zuverlässige Vergleichsabfragen finden lassen. Sie bedienen sich dafür erstens des sogenannten „Query Partitioning“. Dabei werden Abfragen automatisch in mehrere Teile zerlegt. Im nächsten Schritt wird kontrolliert, ob das Ganze und die Summe der Teile das Gleiche ergeben. Fehler gezielt aufzuspüren, die sich durch Optimierungs-Mechanismen in den Datenbanken ergeben, damit beschäftigt sich die zweite Methode. Die Lösung: Die Wissenschaftler wandeln Abfragen für den Vergleich so ab, dass der Optimierungs-Mechanismus nicht mehr funktionieren kann. Der Vorteil dieser beiden Methoden liegt vor allem darin, dass diese Arten der Fehlersuche gut funktionieren, auch wenn der Anwender nicht über detaillierte Kenntnisse der Datenbanken verfügt.

Das ist bei der dritten Methode anders. Hier ist unbedingt spezifisches Datenbankwissen gefragt. Gemäß der sogenannten „Pivoted Query Sythesis“ wählt man eine ganze Reihe in der Datenbanktabelle aus. Dazu wird nun eine Abfrage erstellt, die genau diese ausgewählte Reihe als Ergebnis liefert. Auf diese Art und Weise lassen sich logische Fehler effizienter identifizieren als auf bisherigem Weg, der Analyse von Hand. Die beiden Informatiker haben nun das Tool „SQLancer“ erstellt, das auf Basis ihrer Methoden funktioniert. Die Nachfrage ist wenige Tage nach Start des Tools sehr groß. „Diverse Hersteller haben bereits zahlreiche Bugs in ihren Systemen gefunden und den SQLLancer fest in ihr Testing eingebaut“, sagt Rigger.

 

Mehr zum Thema Datenbanksysteme:

Ein Beitrag von:

  • Nina Draese

    Nina Draese hat Geschichte und Kunstgeschichte (M.A.) studiert. Unter anderem hat sie für die dpa gearbeitet, die Presseabteilung von BMW, für die Autozeitung und den MAV-Verlag. Sie ist selbstständige Journalistin und gehört zum Team von Content Qualitäten. Ihre Themen: Automobil, Energie, Klima, KI, Technik, Umwelt.

Themen im Artikel

Stellenangebote im Bereich Softwareentwicklung

Reiser Simulation and Training GmbH-Firmenlogo
Reiser Simulation and Training GmbH Softwareentwickler C/C++ (m/w/x) Berg
ALTEN GmbH-Firmenlogo
ALTEN GmbH Softwareentwickler (m/w/d) C/C++ München, Ingolstadt, Manching
Blickfeld GmbH-Firmenlogo
Blickfeld GmbH Full Stack Software Engineer (m/f/d) point cloud München
Blickfeld GmbH-Firmenlogo
Blickfeld GmbH Field Application Engineer (m/f/d) Smart City München
Blickfeld GmbH-Firmenlogo
Blickfeld GmbH Embedded Software Engineer (m/f/d) LiDAR sensor München
Mercedes-AMG GmbH-Firmenlogo
Mercedes-AMG GmbH Entwicklungsingenieure Plattformentwicklung und -integration Basis-SW (m/w/d) Affalterbach bei Stuttgart
Rohde & Schwarz-Firmenlogo
Rohde & Schwarz Software-Entwicklungsingenieur (m/w/d) Vektorielle Netzwerkanalyse München
Uniper SE-Firmenlogo
Uniper SE Working student Perfomance Team Gas Turbine Fleet (m/f/d) Düsseldorf
JH Norderstedt-Firmenlogo
JH Norderstedt Ingenieur (m/w/d) Elektrotechnik Simulation von Fahrzeugen / Komponenten Norderstedt
RUETZ SYSTEM SOLUTIONS GmbH-Firmenlogo
RUETZ SYSTEM SOLUTIONS GmbH Engineering Consultant / Test Design (m/w/d) Systemintegration, Car Infotainment, Fahrerassistenz und Telematik Systeme München

Alle Softwareentwicklung Jobs

Top 5 IT & T…

Zu unseren Newslettern anmelden

Das Wichtigste immer im Blick: Mit unseren beiden Newslettern verpassen Sie keine News mehr aus der schönen neuen Technikwelt und erhalten Karrieretipps rund um Jobsuche & Bewerbung. Sie begeistert ein Thema mehr als das andere? Dann wählen Sie einfach Ihren kostenfreien Favoriten.