Inhaltsverzeichnis
Kassandra ist eine Datenbank NoSQL leistungsstark und skalierbar. Es ist Open Source und seine Architektur ist als verteiltes System konzipiert, in dem alle Knoten gleich sind, sodass Daten über alle Knoten im Cluster verteilt werden können.Lagerung in Kassandra ist definiert als Schlüsselwert wobei ein Schlüssel einem oder mehreren Werten zugeordnet werden kann. Ist ein Datenbank orientiert an Zeilendatensätzen, wobei jede Zeile durch ihren Schlüssel identifiziert wird und die Besonderheit dieses Systems darin besteht, dass eine Zeile in mehr als einem Knoten gespeichert werden kann.
Bevor Sie mit der Installation von Kassandra in unserem System müssen wir ein wenig über die Architektur davon wissen Datenbank, Auf diese Weise wissen wir, was wir haben und was wir erreichen können.
Wenn wir über Informationsreplikation sprechen, stellen wir uns als erstes die Frage: Wie viele Kopien brauchen wir? Dies ist in Cassandra keine leicht zu beantwortende Frage, aber wir müssen bedenken, dass dieser Faktor die Anzahl der Knoten angibt, die in derselben Zeile gespeichert sind.
Ein Replikationsfaktor von 2 garantiert beispielsweise, dass es zwei Kopien der Informationen der Knoten im Cluster gibt. Die Wahl des Werts zwei für den Replikationsfaktor ist gut, um Fehler in einem Knoten in der Entwicklungsumgebung abzudecken, und kann das Minimum für Produktionsumgebungen sein, da, wenn ein Knoten ausfällt, der andere alle Anfragen verarbeitet, also müssen wir dies bedenken sorgfältig vor der Umsetzung.
SchlüsselraumKassandra ermöglicht es uns, die Informationen in etwas namens . zu gruppieren Schlüsselräume, wo können wir sagen, dass diese Schlüsselräume sie sind Container für Anwendungsinformationen. Ein Cluster hat jedoch einen Schlüsselraum pro Anwendung Kassandra benutze diese Schlüsselräume für den Umgang mit der Replikation.
SäulenfamilieNach der Definition unserer Schlüsselraum, darin haben wir etwas namens Spaltenfamilie, sind dies gleiche Container, jedoch für eine Sammlung von Zeilen. Jede Zeile ist eine geordnete Sammlung von Spalten und wir können eine Analogie in Bezug auf relationale Datenbanken machen, bei denen die Spaltenfamilie sie sind Tabellen ähnlich.
ReplikationsstrategieIn Kassandra Es gibt zwei Strategien für die Replikation von Informationen, eine davon und die, die wir bereits angesprochen haben, ist die einfache Strategie oder Einfache Strategie der dafür verantwortlich ist, die Informationen auf den nächsten Knoten zu kopieren, bis der definierte Replikationsfaktor erfüllt ist. Die zweite Strategie heißt NetzwerkTopologieStrategie, wo dies die beste Option ist, wenn wir die Informationen über mehrere Rechenzentren verteilen möchten.
Das von verwendete Protokoll Kassandra um den Standort der Knoten zu teilen, und die Informationen dieser im Cluster werden aufgerufen Tratsch. Wo diese Knoten ständig "murmeln" und Informationen mit bis zu 3 Knoten im Cluster austauschen.
Dieses Protokoll hat, wie auch andere, seine Regeln, um Anfragen an andere Knoten zu senden, wo wir drei Schritte dafür sehen können, und jeder Knoten wiederholt diese Schritte immer:
1- Murmeln Sie zu einem zufälligen aktiven Knoten.
2- Initiieren Sie ein Murmeln in Richtung eines zufälligen Abwärtsknotens.
3- Dieser Schritt ist optional und definiert, dass, wenn der in Schritt eins ausgewählte Knoten kein Seed-Knoten ist, zu einem anderen zufälligen Seed-Knoten gemurmelt wird.
Aber um die Informationen zu verschieben und die Kommunikation zwischen den Knoten durchzuführen Kassandra Verwenden Sie eine Komponente namens SpitzelMal sehen was du meinst.
Grundsätzlich ist diese Komponente für die Verwaltung der Informationsbewegung zwischen Knoten verantwortlich, die andere Knoten für Abfragen und Replikation basierend auf verschiedenen Metriken verwenden. Diese Konfiguration ist für alle Knoten innerhalb des Clusters gleich, sie kann jedoch in ihrem Typ variieren. Schauen wir uns an, welche wir zur Verfügung haben:
SimpleSnitchWird in einfachen Rechenzentrumsbereitstellungen verwendet und a Spitzel auf diese Weise konfiguriert, verwendet keine Informationen aus dem Rechenzentrum. Sein Verhalten ist einfach, und es besteht darin, den nächsten Knoten zu finden.
Dynamisches SchnüffelnDiese Konfiguration überwacht die Leistung der Replikate und wählt die beste auf der Grundlage einer einfachen Metrik aus, die lange Antwortzeiten benachteiligt und Knoten vermeidet, die Ihre Informationen komprimieren.
RackInferingSnitchDiese Konfiguration verwendet die IP-Adresse, um den Standort der Knoten zu bestimmen, wobei der letzte Teil der IP den Knoten identifiziert, der zweite die Racks und der dritte die Rechenzentren.
PropertyFileSnitchDies ermöglicht die Definition der Clustertopologie in einer Eigenschaftendatei, im Allgemeinen wird diese Konfiguration verwendet, wenn RackInferingSnitch nicht anwendbar.
GossipingPropertyFileSnitchEs verwendet eine Eigenschaftendatei für die Erstkonfiguration und fährt mit dem Murmeln fort, um Informationen an andere Knoten zu senden.
Die Installation von Kassandra Wir machen es im Team mit Windows 8, bei der wir vorher bestimmte Anforderungen erfüllen müssen, mal sehen, was wir brauchen:
1- Wir brauchen mindestens Java 7 in unserem System installiert haben, können wir die neueste Version unter folgendem Link herunterladen.
2- Wir brauchen zusätzlich Microsoft Visual C++ 2008 Redistributable Package (x86).
3- Endlich Internetverbindung zum Herunterladen des Pakets DataStax.
Nachdem wir unsere Anforderungen überprüft haben, gehen wir auf die Projektseite und suchen nach der 32- oder 64-Bit-Version, die zu unserem System passt:
VERGRÖSSERN
Wenn wir einen Blick auf die Konnektivitätsdokumentation für Kassandra Mit den verschiedenen Programmiersprachen können wir die Seite durchgehen und sehen, was wir dafür brauchen. Nach dem Download installieren wir wie jede Windows-Anwendung. Wo es wichtig zu erwähnen ist, dass nach dieser Installation, Kassandra es wird standardmäßig einen Testcluster erstellen.Bei der Installation werden mehrere Tools in unserem System installiert, eines davon ist das Webinterface von Kassandra Forderung OpsCenter, in die wir eingeben können, wenn wir in unserem Browser folgende Adresse eingeben:
http: // localhost: 8888 / opscenter / index.htmlDiese Schnittstelle ermöglicht es uns, einige interessante Dinge zu tun, aber es ist nicht die optimalste, um damit zu arbeiten Kassandra, aber für die Zwecke dieses Tutorials ist es wichtig, es zu kennen, zu sehen, was es uns bietet, und somit einen Ausgangspunkt zu haben, um die Struktur der Datenbank zu kennen.
Das erste, was wir beim Betreten dieser Schnittstelle finden, ist der Abschnitt von Armaturenbrett, wo wir verschiedene Leistungsmetriken wie Knotenzustand, Speicherkapazität oder Schreibanforderungen visualisieren können:
VERGRÖSSERN
In dieser Schnittstelle können wir einen neuen Cluster erstellen, dazu gehen wir zum oberen rechten Teil und drücken Neuer Cluster, wodurch der folgende Bildschirm geöffnet wird:Wir geben die angeforderten Daten ein und klicken auf Cluster erstellen, außerdem können wir Knoten gleichermaßen in der Dropdown-Liste von . hinzufügen Cluster-Aktionen, oben rechts. Im Bereich Gib nicht, können wir die verfügbaren Knoten und Rechenzentren sowie bestimmte Parameter wie den Zustand, die Größe der Daten und sogar die generierten Warnungen sehen:
VERGRÖSSERN
Im Bereich Aktivitäten Wir können eine Liste der im Cluster durchgeführten Aktivitäten sowie ein Ereignisprotokoll sehen, was sehr nützlich ist, wenn wir die Administratoren der Datenbank:VERGRÖSSERN
Dann haben wir den wichtigsten Abschnitt in unserem Webinterface, und das ist Daten, hier können wir unsere Informationscontainer definieren, besser bekannt als Schlüsselräume und die "Tabellen" oder Spaltenfamilien.Um ein zu erstellen Schlüsselraum, zuerst müssen wir zum Abschnitt gehen Daten und dort die Option auswählen Hinzufügen, geben wir den Namen, die Replikationsstrategie, die wir als einfache oder Netzwerktopologie erklären können, und den Replikationsfaktor ein.
Wir haben gespart und wir hätten schon unsere erstellt Schlüsselraum, wie wir uns erinnern, haben diese Container eine Schlüsselfunktion in Kassandra y soll den Replikationsfaktor definieren. Wenn unser Container definiert ist, werden wir a . hinzufügen Spaltenfamilie, dazu geben wir den Schlüsselraum ein und wählen die Option Hinzufügen. Hier geben wir den Namen, den Spaltentyp und den Vergleichertyp ein.
Damit haben wir bereits unsere SpaltenfamilieWie wir sehen, ist es extrem einfach, aber diese Schnittstelle schränkt uns in vielen Dingen ein und ist nur ein guter Ausgangspunkt für Anfänger, die verstehen möchten, wie die Struktur von Kassandra und wie geht er damit um? Cluster, Knoten, Schlüsselräume und Spaltenfamilien.
Damit haben wir dieses Tutorial abgeschlossen, in dem wir sehen konnten, was die Architektur von Kassandra, sein Protokoll, seine Komponenten und seine Installation. Wir haben die Struktur über das Webinterface kennengelernt, aber damit haben wir nur die Spitze des Eisbergs berührt, in zukünftigen Tutorials werden wir vollständig mit einsteigen CQL und wie man professionell damit arbeitet Kassandra.