Sehr große Datenbanken sehr schnell kopieren

1 minute read

Sehr große produktive Datenbanken als schreibbare Test-DBs den Entwicklern in Sekunden zu Verfügung stellen

Das Problem

Im Rahmen einer großen Webapps-Entwicklung braucht das SW-Entwicklerteam zum Debuggen die “echten” Daten der Datenbank. Wenn diese aber leider mehrere 100 Gigabyte oder mehrere Terabyte groß ist, führt das zu sehr langen Wartezeiten in der Größenordnung von Stunden oder Tagen, bis die DB vom Produktionssystem exportiert und im Test-System wieder importiert ist. Weiterhin müssen ggf. einzelne Teile der kopierten Datenbank anonymisiert werden um dem Datenschutz zu genügen.

Die Lösung: ZFS und Docker

Die Grundidee ist:

Ein ZFS-Dateisystem¹ (z.B. “ZFS on Linux”²) erstellt Snapshots des Dateisystem auf dem die Datenbankengine operiert. (Dauert unter einer Sekunde)
Aus dem ZFS - Snapshot wird eine lese- und schreibbarer “Clone” des Dateisystem erzeugt (Dauerte unter einer Sekunde)
dieser Clone wird einem Dockerconteiner mit der DB-Engine (z.B. ein MySql-Dockercontainer)
Der Dockercontainer wird gestartet und seine IP - Adresse in einem Nameserver registiriert (z.B. mit “Bind”)
Die einzelnen Schritte werden dann per Script automatisiert und
mit Hilfe eines Jenkins-Job den Entwicklern zu verfügung gestellt.
Damit können die Entwickler das ganze mit wenigen Mouseklicks bedienen und jederzeit innerhalb von Sekunden oder wenige Minuten einen schreibbaren DB-test - Clone der Produktiven Daten erzeugen.
ggf. lässt sich ein Anonymisierungsscript sehr leicht via Script noch ergänzen.

Share on

X Facebook LinkedIn Bluesky

Bodo Teichmann

Sehr große Datenbanken sehr schnell kopieren

Sehr große produktive Datenbanken als schreibbare Test-DBs den Entwicklern in Sekunden zu Verfügung stellen

Das Problem

Die Lösung: ZFS und Docker

Share on

You May Also Enjoy

TDD Vorträge bei ‘Nürnberg Ditigal Festival 2025’

TDD Book Tip

TDD Video Tips

The Trouble With Server Send Events