cassandraDémarrer avec Cassandra


Remarques

La base de données Apache Cassandra est le bon choix lorsque vous avez besoin d’évolutivité et de haute disponibilité sans compromettre les performances. L'évolutivité linéaire et la tolérance aux pannes éprouvée sur le matériel ou l'infrastructure cloud, en font la plate-forme idéale pour les données critiques. Le support de Cassandra pour la réplication sur plusieurs centres de données est le meilleur de sa catégorie, offrant une latence plus faible pour vos utilisateurs et la tranquillité d'esprit de savoir que vous pouvez survivre aux pannes régionales.

ÉPROUVÉ

Cassandra est utilisée par Constant Contact, CERN, Comcast, eBay, GitHub, GoDaddy, Hulu, Instagram, Intuit, Netflix, Reddit, The Weather Channel et plus de 1500 autres entreprises qui disposent de grands ensembles de données actifs.

TOLÉRANCE DE PANNE

Les données sont automatiquement répliquées sur plusieurs nœuds pour la tolérance aux pannes. La réplication entre plusieurs centres de données est prise en charge. Les nœuds en échec peuvent être remplacés sans interruption.

PERFORMANT

Cassandra dépasse systématiquement les alternatives NoSQL les plus répandues dans les tests de performances et les applications réelles, principalement en raison des choix architecturaux fondamentaux.

DÉCENTRALISÉ

Il n'y a pas de points de défaillance uniques. Il n'y a pas de goulots d'étranglement sur le réseau. Chaque nœud du cluster est identique.

SCALABLE

Parmi les plus importants déploiements de production, notons Apple, avec plus de 75 000 nœuds stockant plus de 10 Go de données, Netflix (2 500 nœuds, 420 To, plus de 1 000 milliards de requêtes par jour), le moteur de recherche chinois Easou (270 nœuds, 300 To, plus de 800 millions reqests par jour) et eBay (plus de 100 nœuds, 250 To).

DURABLE

Cassandra convient aux applications qui ne peuvent pas se permettre de perdre des données, même en cas de panne d'un centre de données entier.

VOUS ÊTES EN CONTRÔLE

Choisissez entre une réplication synchrone ou asynchrone pour chaque mise à jour. Les opérations asynchrones hautement disponibles sont optimisées avec des fonctionnalités telles que le transfert interposé et la réparation en lecture.

ÉLASTIQUE

Le débit de lecture et d'écriture augmente de manière linéaire à mesure que de nouvelles machines sont ajoutées, sans interruption ni interruption des applications.

Soutenu professionnellement

Les contrats et services de support de Cassandra sont disponibles auprès de tiers.

Versions

Version Date de sortie
1.1.12 2013-11-19
1.1.9 2013-02-11
1.2.12 2013-11-28
1.2.13 2013-12-19
1.2.15 2014-02-19
1.2.16 2014-04-22
1.2.17 2014-06-25
1.2.18 2014-07-04
1.2.19 2014-11-14
1.2.6 2013-07-02
1.2.8 2013-07-27
2.0.10 2014-08-12
2.0.11 2014-10-17
2.0.12 2015-01-14
2.0.13 2015-03-20
2.0.14 2015-04-02
2.0.15 2015-06-01
2.0.16 2015-07-08
2.0.17 2015-09-18
2.0.5 2014-02-13
2.0.6 2014-04-02
2.0.7 2014-04-24
2.0.8 2014-06-13
2.0.9 2014-07-22
2.1.11 2015-10-12
2.1.12 2015-10-22
2.1.2 2014-11-20
2.1.3 2015-03-03
2.1.4 2015-04-02
2.1.5 2015-03-31
2.1.6 2015-06-09
2.1.7 2015-06-18
2.1.8 2015-07-03
2.1.9 2015-09-03
2.2.0 2015-05-14
2.2.0-beta1 2015-05-19
2.2.0-rc1 2015-06-04
2.2.0-rc2 2015-06-30
2.2.1 2015-08-25
2.2.2 2015-09-25
2.2.3 2015-10-12
2.2.4 2015-12-02
3.0.0 2015-01-26
3.0.0-alpha 2015-07-29
3.0.0-alpha1 2015-07-18
3.0.0-beta1 2015-07-10
3.0.0-beta2 2015-09-04
3.0.0-rc1 2015-07-16
3.0.0-rc2 2015-10-16
3.0.1 2015-12-04
3.0.2 2016-01-21
3.0.3 2015-11-24
3,0.4 2016-02-05
3.0.5 2016-04-02
3.0.6 2016-03-31
3.0.7 2016-05-24
3.0.8 2016-05-25
3.2.819 2016-01-05
3.4.950 2016-03-08
3.6.1076 2016-05-02
3.8.1199 2016-06-27
3.10.3004 2016-08-10

(J'ai obtenu ceci en utilisant un peu awk: git log --tags --simplify-by-decoration --pretty="format:%ai %d" |egrep "\(tag: [0-9]"| awk -F" " '{ print $1 " " $5}'|awk -F"." '{print $1 "." $2 "." $3}'| awk -F" " '{print $2 " |" $1}'| sed 's/)//'|sed 's/,//'| sort -n|sort -u -t" " -k1,1 | awk '{print "|" $0 "|"}' )

Installation ou configuration

Installation d'un nœud unique

  1. Pré-installer NodeJS, Python et Java
  2. Sélectionnez votre document d'installation en fonction de votre plate-forme http://docs.datastax.com/en/cassandra/3.x/cassandra/install/installTOC.html
  3. Téléchargez les binaires Cassandra depuis http://cassandra.apache.org/download/
  4. Décompressez le fichier téléchargé dans <installation location>
  5. Lancez Cassandra en utilisant <installation location>/bin/cassandra OU démarrez Cassandra en tant que service - [sudo] service cassandra start
  6. Vérifiez si Cassandra est opérationnel avec le <installation location>/bin/nodetool status .

Ex:

  1. Dans l'environnement Windows, exécutez le fichier cassandra.bat pour démarrer le serveur Cassandra et cqlsh.bat pour ouvrir le terminal client CQL afin d'exécuter des commandes CQL.

L'installation d'un seul nœud peut être effectuée de deux manières.

Vous devriez avoir Oracle Java 8 ou OpenJDk 8 (préféré pour les versions de Cassandra> 3.0)

1. Installer un paquet Debian (installe Cassandra en tant que service)

Ajoutez la version de Cassandra au référentiel (remplacez le 22x par votre propre version, par exemple pour 27x utilisation)

echo "deb-src http://www.apache.org/dist/cassandra/debian 22x main" | sudo tee -a /etc/apt/sources.list.d/cassandra.sources.list
# Update the repository  
sudo apt-get update
# Then install it
sudo apt-get install cassandra cassandra-tools
 

Maintenant, Cassandra peut être démarré et arrêté en utilisant:

sudo service cassandra start
sudo service cassandra stop
 

Vérifiez le statut en utilisant:

nodetool status
 

Les répertoires de journaux et de données sont respectivement /var/log/cassandra et /var/lib/cassandra .

2. Installer une version de Cassandra sous forme d'archive binaire (installe Cassandra en tant que processus autonome)

Téléchargez la version Datastax:

curl -L  http://downloads.datastax.com/community/dsc-cassandra-version_number-bin.tar.gz | tar xz
 

Ou l'archive binaire Apache Cassandra manuellement (à partir du site http://www.apache.org/dist/cassandra/)

Maintenant, lancez ceci:

tar -xvzf dsc-cassandra-version_number-bin.tar.gz
 

Changez le répertoire pour installer l'emplacement:

cd install_location
 

Commencez Cassandra en utilisant:

sudo sh ./bin/cassandra 
 

Arrête d'utiliser:

sudo kill -9 pid
 

Vérifier:

./bin/nodetool status
 

Et alto, vous avez un cluster de test à nœud unique pour Cassandra. Il suffit donc d'utiliser cqlsh dans le terminal pour le shell Cassandra.

La configuration de Cassandra peut être faite dans le dossier cassandra.yaml dans conf dans install_location .

Installation multi-nœuds

Installation en cluster multi-cc