Verteilter Datenspeicher - Distributed data store

Ein verteilter Datenspeicher ist ein Computernetzwerk, in dem Informationen auf mehr als einem Knoten gespeichert werden , oft in replizierter Weise. Es wird normalerweise speziell verwendet, um entweder auf eine verteilte Datenbank zu verweisen, in der Benutzer Informationen auf mehreren Knoten speichern , oder auf ein Computernetzwerk, in dem Benutzer Informationen auf mehreren gleichrangigen Netzwerkknoten speichern .

Verteilte Datenbanken

Verteilte Datenbanken sind normalerweise nicht relationale Datenbanken , die einen schnellen Zugriff auf Daten über eine große Anzahl von Knoten ermöglichen. Einige verteilte Datenbanken bieten umfangreiche Abfragefähigkeiten, während andere auf eine Schlüsselwertspeicher- Semantik beschränkt sind. Beispiele für begrenzte verteilten Datenbanken sind Google ‚s Bigtable , die viel mehr als eine ist verteiltes Dateisystem oder einem Peer-to-Peer - Netzwerk , Amazon ‘ s Dynamo und Microsoft Azure Storage .

Da die Möglichkeit beliebiger Abfragen nicht so wichtig ist wie die Verfügbarkeit , haben Entwickler von verteilten Datenspeichern letztere auf Kosten der Konsistenz erhöht. Der schnelle Lese-/Schreibzugriff führt jedoch zu einer verringerten Konsistenz, da es nicht möglich ist, sowohl Konsistenz als auch Verfügbarkeit in einem partitionierten Netzwerk zu garantieren , wie im CAP-Theorem angegeben .

Peer-Netzwerkknoten-Datenspeicher

In Peer-Netzwerk-Datenspeichern kann sich der Benutzer normalerweise revanchieren und anderen Benutzern gestatten, ihren Computer ebenfalls als Speicherknoten zu verwenden. Abhängig vom Design des Netzwerks können Informationen für andere Benutzer zugänglich sein oder nicht.

Die meisten Peer-to-Peer- Netzwerke verfügen nicht über verteilte Datenspeicher, da die Daten des Benutzers nur verfügbar sind, wenn sich sein Knoten im Netzwerk befindet. Diese Unterscheidung ist jedoch in einem System wie BitTorrent etwas verwischt , bei dem es möglich ist, dass der Ursprungsknoten offline geht, der Inhalt jedoch weiterhin bereitgestellt wird. Dies gilt jedoch nur für einzelne Dateien, die von den Weiterverteilern angefordert werden, im Gegensatz zu Netzwerken wie Freenet , Winny , Share und Perfect Dark, in denen jeder Knoten einen Teil der Dateien im Netzwerk speichern kann.

Verteilte Datenspeicher verwenden normalerweise eine Fehlererkennungs- und -korrekturtechnik . Einige verteilte Datenspeicher (wie Parchive über NNTP) verwenden Vorwärtsfehlerkorrekturtechniken , um die Originaldatei wiederherzustellen, wenn Teile dieser Datei beschädigt oder nicht verfügbar sind. Andere versuchen erneut, diese Datei von einem anderen Spiegel herunterzuladen.

Beispiele

Verteilte nicht relationale Datenbanken

Produkt Lizenz Hohe Verfügbarkeit Anmerkungen
Apache Accumulo AL2
Aerospike AGPL
Apache Kassandra AL2 Ja früher von Facebook verwendet
Apache entzünden AL2
Großer Tisch Proprietär von Google verwendet
Couchbasis AL2 wird von LinkedIn , PayPal und eBay verwendet
CrateDB AL2 Ja
Apache Druide AL2 von Netflix und Yahoo verwendet
Dynamo Proprietär von Amazon verwendet
Hazelcast AL2 , proprietär
HBase AL2 Ja früher von Facebook verwendet
Hypertable GPL 2 Baidu
MongoDB SSPL
Riak AL2 Ja
Redis BSD-Lizenz Ja
Skylla AGPL
Voldemort AL2 von LinkedIn verwendet

Peer-Netzwerkknoten-Datenspeicher

Siehe auch

Verweise