Grundlegendes zur Müllabfuhr in Amazon DocumentDB Prozess der Müllabfuhr Speicherarchitektur und erweiterter Speicher Überwachung der Müllabfuhr Beispiel für eine CollStats-Ausgabe Häufig gestellte Fragen

Müllabfuhr in Amazon DocumentDB

Amazon DocumentDB implementiert eine MVCC-Datenbankarchitektur (Multi-Version Concurrency Control), die für jeden Aktualisierungsvorgang neue Versionen von Dokument- und Indexeinträgen erstellt. Diese Architektur ermöglicht die Isolierung von Transaktionen und verhindert so, dass die Änderungen einer Transaktion in einer anderen erscheinen.

Topics

Grundlegendes zur Müllabfuhr in Amazon DocumentDB
Prozess der Müllabfuhr
Speicherarchitektur und erweiterter Speicher
Überwachung der Müllabfuhr
Beispiel für eine CollStats-Ausgabe
Häufig gestellte Fragen

Grundlegendes zur Müllabfuhr in Amazon DocumentDB

Garbage Collection (GC) ist ein automatisierter Hintergrundprozess, der eine optimale Systemleistung und Verfügbarkeit in Amazon DocumentDB gewährleistet. Wie viele moderne Datenbanken erstellt auch die MVCC-Architektur von Amazon DocumentDB mit jeder Aktualisierung neue Dokument- und Indexversionen. Jeder Schreibvorgang verbraucht eine eindeutige MVCC-ID aus einem endlichen Zähler. Diese IDs geben an, zu welcher Transaktion eine Dokumentversion gehört und ob sie festgeschrieben oder zurückgesetzt wurde. Im Laufe der Zeit IDs häufen sich diese alten Versionen und ihr MVCC an, sodass eine Bereinigung erforderlich ist, um Leistungseinbußen vorzubeugen.

Funktionen der Müllabfuhr

Der Müllsammler erfüllt drei wesentliche Funktionen:

Gewinnt Speicherplatz zurück — Es entfernt veraltete Dokument- und Indexversionen, die für aktive Abfragen nicht mehr benötigt werden, und gibt so Speicherplatz für future Schreibvorgänge frei.
Beugt einem MVCC-ID-Überlauf vor — Es verhindert einen MVCC-ID-Überlauf, indem der endliche Zähler von MVCC verwaltet wird. IDs Ohne diese Verwaltung würde der Zähler irgendwann sein Limit erreichen und die Datenbank in einen temporären Nur-Lese-Modus zwingen, bis sie recycelt werden. IDs
Beibehaltung der Abfrageleistung — Es sorgt für eine optimale Abfrageleistung, indem veraltete Dokumentversionen entfernt werden, die sich andernfalls ansammeln und die Abfrageverarbeitung verlangsamen würden.

Prozess der Müllabfuhr

Der GC-Prozess wird pro Sammlung ausgeführt und es können mehrere Prozesse gleichzeitig in verschiedenen Sammlungen ausgeführt werden. Der Prozess besteht aus vier aufeinanderfolgenden Phasen:

Identifizierung — Das System identifiziert Dokument- und Indexversionen, auf die in aktiven Transaktionen oder Abfragen nicht mehr verwiesen wird.
Laden des Speichers — Alte Dokumente und Indexeinträge werden in den Speicher geladen, sofern sie nicht bereits vorhanden sind.
Löschen — Veraltete Versionen werden dauerhaft gelöscht, um Speicherplatz zurückzugewinnen.
MVCC-ID-Recycling — Das System recycelt MVCC IDs aus gelöschten Versionen für neue Operationen.

Wenn die Garbage-Collection die Verarbeitung alter Dokumentversionen abgeschlossen hat, entfernt es das älteste MVCC IDs aus dem System. Diese Bereinigung ist entscheidend, um einen MVCC-ID-Überlauf zu verhindern IDs, indem MVCC recycelt und für neue Schreibvorgänge im gesamten Cluster verfügbar gemacht werden. Ohne diesen Recyclingprozess würde das System irgendwann seinen begrenzten MVCC-ID-Zähler erschöpfen und in einen schreibgeschützten Zustand übergehen.

Planung der Müllabfuhr

Die Müllabfuhr wird in regelmäßigen Abständen automatisch im Hintergrund ausgeführt. Das Timing und die Frequenz passen sich dynamisch an die Systemlast, die verfügbaren Ressourcen, das Schreibvolumen und den MVCC-ID-Verbrauch an. Bei hoher Schreibaktivität wird der GC-Prozess häufiger ausgeführt, um die erhöhte Anzahl von Dokumentversionen zu bewältigen.

Speicherarchitektur und erweiterter Speicher

Amazon DocumentDB verwendet eine ausgeklügelte Speicherarchitektur, die den Dokumentenspeicher in zwei unterschiedliche Segmente unterteilt:

Basisspeichersegment

Das Basisspeichersegment enthält die primären Dokumentdaten und Metadaten. In diesem Segment wird Folgendes gespeichert:

Dokumentinhalt, der in die Standardseitengröße (8 KB) passt.
Metadaten und Strukturinformationen des Dokuments.
Primärindizes und ihre Einträge.
Statistiken und Konfiguration auf Sammlungsebene.

Erweitertes Speichersegment

Das erweiterte Speichersegment verwendet einen speziellen Objektspeicher für große Dokumente, der für die Verarbeitung von Dokumenten konzipiert ist, die die Standardspeicherseitengröße überschreiten. Dieses Segment bietet:

Effizienter Umgang mit großen Dokumenten — Dokumente, die den Basisspeicherschwellenwert überschreiten, werden automatisch in das erweiterte Speichersegment verschoben.
Optimiertes Speicherlayout — Das Segment verwendet ein anderes Speicherformat, das für große Objekte optimiert ist, wodurch die Fragmentierung reduziert und die Zugriffsmuster verbessert werden.
Unabhängige Speicherbereinigung — Das erweiterte Speichersegment verfügt über einen eigenen Speicherbereinigungsprozess, der unabhängig von der Bereinigung des Basisspeichers ausgeführt werden kann.
Transparenter Zugriff — Anwendungen greifen problemlos auf große Dokumente zu, ohne wissen zu müssen, welches Speichersegment die Daten enthält.

Das erweiterte Speichersegment ist besonders vorteilhaft für:

Sammlungen mit Dokumenten, die große eingebettete Arrays enthalten.
Dokumente mit umfangreichen verschachtelten Strukturen.
Sammlungen, die Binärdaten oder große Textfelder speichern.
Anwendungen mit gemischten Dokumentengrößen, bei denen einige Dokumente die durchschnittliche Größe deutlich überschreiten.

Überwachung der Müllabfuhr

Metriken auf Clusterebene

AvailableMVCCIds

Standort — Amazon CloudWatch
Beschreibung — Ein Zähler, der die Anzahl der verbleibenden Schreibvorgänge anzeigt, die ab einer Höchstgrenze von 1,8 Milliarden verfügbar sind. Wenn dieser Zähler Null erreicht, wechselt Ihr Cluster in den schreibgeschützten Modus, bis die Daten zurückgewonnen und IDs recycelt werden. Der Zähler nimmt mit jedem Schreibvorgang ab und steigt, wenn alte MVCCs bei der Garbage-Collection recycelt werden. IDs
Empfehlung — Stellen Sie einen Alarm ein, wenn der Wert unter 1,3 Milliarden fällt. Diese Frühwarnung ermöglicht es Ihnen, empfohlene Maßnahmen zu ergreifen, die später besprochen werden.

LongestActiveGCRuntime

Standort — Amazon CloudWatch
Beschreibung — Dauer des längsten aktiven Müllsammelvorgangs in Sekunden. Wird jede Minute aktualisiert und verfolgt nur aktive Vorgänge, ausgenommen Prozesse, die innerhalb des Zeitfensters von einer Minute abgeschlossen werden.
Empfehlung: Vergleichen Sie mit gcRuntimeStats historischen Daten, um ungewöhnliches Verhalten bei der Speicherbereinigung zu ermitteln, z. B. längere Laufzeiten bei Massenlöschungen.

Kennzahlen auf Erfassungsebene

MVCCIDStats: MVCCIdScale

Standort — Datenbankbefehl CollStats
Beschreibung — Misst das Alter der MVCC-ID auf einer Skala von 0 bis 1, wobei 1 das maximale Alter angibt, bevor ein Cluster in den schreibgeschützten Zustand übergeht. Verwenden Sie diese Metrik zusammenAvailableMVCCIds, um Sammlungen zu identifizieren, die die ältesten MVCCs enthalten IDs , die den Cluster altern lassen.
Empfehlung — Behalten Sie für jede Sammlung Werte unter 0,3 bei.

gcRuntimeStats

Standort — Datenbankbefehl CollStats
Beschreibung — Stellt eine zweimonatige Historie von Messdaten zur Garbage-Collection bereit, einschließlich der Gesamtzahl der Durchläufe, der durchschnittlichen Dauer und der Höchstdauer. Schließt nur Müllabfuhr ein, die länger als fünf Minuten dauern, um aussagekräftige Statistiken zu gewährleisten.

Wichtig

gcRuntimeStatsdocumentFragmentStats, und die Aufteilung der Metriken auf Sammlungsebene in Amazon DocumentDB storageSegmentBase 8.0 und storageSegmentExtended sind nur für Amazon DocumentDB 8.0 verfügbar.

storageSizeStats

Standort — Datenbankbefehl CollStats
Beschreibung — Bietet eine detaillierte Aufschlüsselung der Speichernutzung in verschiedenen Speichersegmenten:
- storageSegmentBase— Speicher, der vom Basisspeichersegment für Standarddokumente verwendet wird
- storageSegmentExtended— Speicher, der vom erweiterten Speichersegment für große Dokumente verwendet wird
Nutzung — Hilft bei der Identifizierung von Sammlungen mit sehr großem Dokumentenbestand und hilft dabei, die Speicherverteilungsmuster zu verstehen.

unusedStorageSize(Sammlungsebene)

Standort — Datenbankbefehl CollStats
Beschreibung — Schätzt den ungenutzten Speicherplatz in einer Sammlung auf der Grundlage von Stichprobenstatistiken. Es umfasst Speicherplatz aus gelöschten Dokumenten und leeren Segmenten. Die Metrik bietet sowohl kombinierte Gesamtwerte als auch Aufschlüsselungen pro Segment:
- Kombiniert unusedBytes und für unusedPercent alle Speichersegmente
- storageSegmentBase— Ungenutzter Speicherplatz speziell im Basisspeichersegment
- storageSegmentExtended— Ungenutzter Speicherplatz speziell im erweiterten Speichersegment

documentFragmentStats

Standort — Datenbankbefehl CollStats
Beschreibung — Stellt detaillierte Informationen über Dokumentfragmente und tote Daten in Sammlungen bereit. Dokumentfragmente stellen die internen Speichereinheiten dar, die von der Datenbank-Engine verwendet werden, und tote Fragmente weisen auf Daten hin, auf die nicht mehr zugegriffen werden kann, die aber noch nicht zurückgewonnen wurden. Diese Metrik beinhaltet:
- totalDocFragmentsCount— Gesamtzahl der Dokumentfragmente in der Sammlung
- deadDocFragmentsCount— Anzahl der Fragmente, die tote (unzugängliche) Daten enthalten
- deadDocFragmentsPercent— Prozentsatz der Fragmente, die tote Daten enthalten
- deadDocFragmentBytes— Geschätzter Byteverbrauch durch tote Dokumentfragmente
- Aufschlüsselung nach Segmenten für und storageSegmentBase storageSegmentExtended
Nutzung — Überwachen Sie diese Kennzahl, um sich ein Bild von der Effektivität der Müllabfuhr zu machen und um Sammlungen zu identifizieren, die von Wartungsarbeiten profitieren könnten. Ein hoher Prozentsatz an toten Fragmenten deutet darauf hin, dass die Müllabfuhr möglicherweise ins Hintertreffen gerät oder dass die Sammlung von Optimierungen profitieren würde.

Kennzahlen auf Indexebene

unusedStorageSize(Indexebene)

Standort — Befehl IndexStats für die Datenbank
Beschreibung — Schätzt den ungenutzten Speicherplatz in einem Index auf der Grundlage von Stichprobenstatistiken. Es beinhaltet Speicherplatz aus veralteten Indexeinträgen und leeren Segmenten.
Empfehlung — Verwenden Sie den reIndex Befehl, um Indizes ohne Ausfallzeiten neu zu erstellen und ungenutzten Speicherplatz zurückzugewinnen. Weitere Informationen finden Sie unter Indizes verwalten.

Beispiel für eine CollStats-Ausgabe

Das folgende Beispiel zeigt eine typische collStats Ausgabe mit Metriken zur Garbage-Collection und Speicherung:


{
    "ns" : "Mvcc_consumption_test_db.mvcc_test_collection",
    "MVCCIdStats" : {
        "MVCCIdScale" : 0.03
    },
    "gcRuntimeStats" : {
        "numRuns" : 1,
        "historicalAvgRuntime" : 3295,
        "historicalMaxRuntime" : 3295,
        "lastRuntime" : 3295,
        "lastRuntimeStart" : ISODate("2025-06-24T08:47:14Z")
    },
    "documentFragmentStats" : {
        "totalDocFragmentsCount" : 45000000,
        "deadDocFragmentsCount" : 2250000,
        "deadDocFragmentsPercent" : 5.0,
        "deadDocFragmentBytes" : 98304000,
        "storageSegmentBase" : {
            "totalDocFragmentsCount" : 30000000,
            "deadDocFragmentsCount" : 1500000,
            "deadDocFragmentsPercent" : 5.0,
            "deadDocFragmentBytes" : 65536000
        },
        "storageSegmentExtended" : {
            "totalDocFragmentsCount" : 15000000,
            "deadDocFragmentsCount" : 750000,
            "deadDocFragmentsPercent" : 5.0,
            "deadDocFragmentBytes" : 32768000
        }
    },
    "collScans" : 14,
    "count" : 30000000,
    "size" : 1320000000,
    "avgObjSize" : 44,
    "storageSize" : 6461497344,
    "storageSizeStats" : {
        "storageSegmentBase" : 4307664896,
        "storageSegmentExtended" : 2153832448
    },
    "capped" : false,
    "nindexes" : 2,
    "totalIndexSize" : 9649553408,
    "indexSizes" : {
        "_id_" : 1910661120,
        "c_1" : 7738892288
    },
    "unusedStorageSize" : {
        "unusedBytes" : 4201881600,
        "unusedPercent" : 65.05,
        "storageSegmentBase" : {
            "unusedBytes" : 2801254400,
            "unusedPercent" : 65.05
        },
        "storageSegmentExtended" : {
            "unusedBytes" : 1400627200,
            "unusedPercent" : 65.05
        }
    },
    "cacheStats" : {
        "collBlksHit" : 171659016,
        "collBlksRead" : 754061,
        "collHitRatio" : 99.5627,
        "idxBlksHit" : 692563636,
        "idxBlksRead" : 1177921,
        "idxHitRatio" : 99.8303
    },
    "idxScans" : 41823984,
    "opCounter" : {
        "numDocsIns" : 0,
        "numDocsUpd" : 20911992,
        "numDocsDel" : 0
    },
    "lastReset" : "2025-06-24 05:57:08.219711+00",
    "ok" : 1,
    "operationTime" : Timestamp(1750968826, 1)
}

Häufig gestellte Fragen

Wie erkenne ich, ob die Müllabfuhr nicht effizient funktioniert?

Achten Sie auf diese Warnzeichen, die auf eine ineffiziente Müllabfuhr hinweisen:

Übermäßiges Aufblähen von Datensammlungen — Stetig steigende unusedStorageSize Messwerte bei umfangreichen Schreibvorgängen oder Massenlöschungen, insbesondere bei großen Indizes.
Hoher Prozentsatz an toten Fragmenten — documentFragmentStats zeigt konstant hohe deadDocFragmentsPercent Werte (über 10-15%).
Verminderte Abfragelatenz — Erhöhte Abfragelatenz aufgrund der Anhäufung toter Dokumente.
Verlängerte GC-Dauer — Die Müllabfuhr dauert länger als der historische Durchschnitt ingcRuntimeStats.
Erhöhte GC-Verarbeitung — Hoch LongestActiveGCRuntime bedeutet, dass der Garbage Collector nicht mit den Systemanforderungen Schritt halten kann.

Beeinträchtigt die Garbage-Collection die Leistung meiner Datenbank?

Unter normalen Bedingungen hat die Garbage-Collection nur minimale Auswirkungen auf die Leistung. Wenn die Müllabfuhr jedoch ins Hintertreffen gerät, kann es zu folgenden Problemen kommen:

Erhöhte Speicherkosten aufgrund angesammelter toter Dokumente.
Langsamere Abfrageleistung aufgrund veralteter Indexeinträge.
Temporärer Nur-Lese-Modus, wenn MVCC IDs aufgebraucht sind.
Höherer Ressourcenverbrauch bei intensiven Erfassungsläufen, insbesondere bei kleineren Instanzen.
Geringere Effizienz bei Operationen mit erweiterten Speichersegmenten für große Dokumente.

Kann ich die Müllabfuhr manuell auslösen?

Nein, die Speicherbereinigung in Amazon DocumentDB kann nicht manuell ausgelöst werden. Das System verwaltet die Müllabfuhr im Rahmen seiner internen Wartungsarbeiten automatisch.

Welche Alarme sollte ich als bewährte Methode für den Betrieb einrichten?

Wir empfehlen, die Überwachung sowohl auf Cluster- als auch auf Sammlungsebene einzurichten, um eine optimale Leistung Ihres Amazon DocumentDB-Systems sicherzustellen.

Für die Überwachung auf Clusterebene erstellen Sie zunächst einen CloudWatch Amazon-Alarm für die AvailableMVCCIds Metrik mit einem Schwellenwert von 1,3 Milliarden. Auf diese Weise haben Sie ausreichend Zeit, um Maßnahmen zu ergreifen, bevor die Metrik Null erreicht. Ab diesem Zeitpunkt würde Ihr Cluster in den schreibgeschützten Modus wechseln. Denken Sie daran, dass diese Kennzahl je nach Ihren spezifischen Nutzungsmustern schwanken kann. Manche Kunden gehen davon aus, dass sie unter 1,3 Milliarden fällt und sich dann wieder auf über 1,5 Milliarden erholt, sobald die Garbage-Collection ihre Arbeit abgeschlossen hat.

Es ist auch wichtig, die LongestActiveGCRuntime Metrik über Amazon zu überwachen CloudWatch. Diese Metrik hilft IhnengcRuntimeStats, zu verstehen, wie effizient die Speicherbereinigung in Ihrem gesamten System funktioniert.

Konzentrieren Sie sich bei der Überwachung auf Sammlungsebene auf die folgenden wichtigen Kennzahlen:

MVCCIdScale— Achten Sie auf steigende Werte, die darauf hindeuten, dass MVCC IDs altern und möglicherweise Aufmerksamkeit erfordern.
gcRuntimeStats— Identifizieren Sie Prozesse zur Müllabfuhr, die ungewöhnlich lange dauern oder sich über mehrere Tage erstrecken.
documentFragmentStats— deadDocFragmentsPercent Werte überwachen — konstant hohe Prozentsätze (über 10-15%) können darauf hindeuten, dass die Müllabfuhr hinterherhinkt.
storageSizeStatsund unusedStorageSize — Verfolgen Sie die Muster der Speichernutzung und identifizieren Sie Sammlungen mit erheblichem ungenutztem Speicherplatz in beiden Speichersegmenten.

Sammlungen mit häufigen Schreibvorgängen erfordern besondere Aufmerksamkeit, da sie mehr Arbeit für den Garbage-Collector bedeuten. Wir empfehlen, diese Metriken bei Sammlungen mit starker Schreibaktivität häufiger zu überprüfen, um sicherzustellen, dass die Garbage-Collection mit Ihrer Arbeitslast Schritt hält.

Beachten Sie, dass diese Überwachungsempfehlungen als Ausgangspunkt dienen. Wenn Sie mit dem Verhalten Ihres Systems besser vertraut sind, sollten Sie diese Schwellenwerte möglicherweise anpassen, um sie besser an Ihre spezifischen Nutzungsmuster und Anforderungen anzupassen.

Was sollte ich tun, wenn mein Wert unter 1,3 Milliarden `AvailableMVCCIds` fällt?

Wenn Ihre AvailableMVCCIds Metrik unter 1,3 Milliarden fällt, empfehlen wir, sofort Maßnahmen zu ergreifen, um zu verhindern, dass Ihr Cluster in den schreibgeschützten Modus wechselt. Wir empfehlen, zunächst Ihre Instance-Größe zu vergrößern, um dem Garbage Collector mehr Rechenressourcen zur Verfügung zu stellen. Dies ist unsere wichtigste Empfehlung, da es Ihrer Anwendung ermöglicht, den normalen Betrieb fortzusetzen und gleichzeitig dem Garbage Collector die zusätzliche Leistung zu geben, die er zum Aufholen benötigt.

Wenn eine Skalierung allein die Situation nicht verbessert, empfehlen wir, eine Reduzierung Ihrer Schreibvorgänge in Betracht zu ziehen. Identifizieren Sie anhand der MVCCIdScale Metrik, welche spezifischen Sammlungen ältere MVCCs enthalten IDs , die bearbeitet werden müssen. Überwachen Sie außerdem Sammlungen mit einem hohen Prozentsatz documentFragmentStats an toten Fragmenten, die möglicherweise zur Ineffizienz der Müllsammlung beitragen.

Sobald Sie diese Sammlungen identifiziert haben, müssen Sie möglicherweise vorübergehend die Schreibvorgänge auf sie reduzieren, damit die Garbage-Collection aufholen kann. Während der Erholungsphase empfehlen wir, die AvailableMVCCIds Metrik genau zu beobachten, um sicherzustellen, dass Ihre Maßnahmen die gewünschte Wirkung haben. Ihr Cluster gilt als fehlerfrei, sobald der AvailableMVCCIds Wert wieder 1,5 Milliarden oder höher erreicht.

Denken Sie daran, dass es sich bei diesen Schritten um vorbeugende Maßnahmen handelt, mit denen Ihr System wiederhergestellt werden kann, bevor es einen kritischen Zustand erreicht. Je früher Sie Maßnahmen ergreifen, nachdem der Wert unter 1,3 Milliarden gesunken ist, desto wahrscheinlicher ist es, dass Sie jegliche Auswirkungen auf Ihre Schreibvorgänge vermeiden.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Leistung und Ressourcennutzung

API-Referenz zur Ressourcenverwaltung