cassandraIniziare con Cassandra


Osservazioni

Il database Apache Cassandra è la scelta giusta quando hai bisogno di scalabilità e alta disponibilità senza compromettere le prestazioni. Scalabilità lineare e comprovata tolleranza agli errori su hardware di base o infrastruttura cloud ne fanno la piattaforma perfetta per i dati mission-critical. Il supporto di Cassandra per la replica su più datacenter è il migliore della sua classe, fornendo una minore latenza per gli utenti e la tranquillità di sapere che si può sopravvivere alle interruzioni regionali.

COLLAUDATA

Cassandra è in uso presso Constant Contact, CERN, Comcast, eBay, GitHub, GoDaddy, Hulu, Instagram, Intuit, Netflix, Reddit, The Weather Channel e oltre 1500 aziende che hanno set di dati grandi e attivi.

TOLLERANTE AGLI ERRORI

I dati vengono automaticamente replicati su più nodi per la tolleranza agli errori. È supportata la replica su più data center. I nodi guasti possono essere sostituiti senza tempi di fermo.

PERFORMANT

Cassandra supera costantemente le alternative popolari NoSQL in benchmark e applicazioni reali, principalmente a causa di scelte architettoniche fondamentali.

DECENTRATA

Non ci sono singoli punti di errore. Non ci sono colli di bottiglia nella rete. Ogni nodo nel cluster è identico.

SCALABILE

Alcune delle più grandi implementazioni di produzione includono Apple, con oltre 75.000 nodi che memorizzano oltre 10 PB di dati, Netflix (2.500 nodi, 420 TB, oltre 1 trilione di richieste al giorno), motore di ricerca cinese Easou (270 nodi, 300 TB, oltre 800 milioni richieste al giorno) e eBay (oltre 100 nodi, 250 TB).

DUREVOLE

Cassandra è adatto per applicazioni che non possono permettersi di perdere dati, anche quando un intero data center non funziona.

SEI IN CONTROLLO

Scegli tra replica sincrona o asincrona per ogni aggiornamento. Le operazioni asincrone altamente disponibili sono ottimizzate con funzioni come Hinted Handoff e Read Repair.

ELASTICO

Il throughput di lettura e scrittura aumenta entrambi in modo lineare man mano che vengono aggiunte nuove macchine, senza tempi di inattività o interruzioni delle applicazioni.

SUPPORTATO PROFESSIONALMENTE

I contratti ei servizi di supporto di Cassandra sono disponibili da terze parti.

Versioni

Versione Data di rilascio
1.1.12 2013/11/19
1.1.9 2013/02/11
1.2.12 2013/11/28
1.2.13 2013/12/19
1.2.15 2014/02/19
1.2.16 2014/04/22
1.2.17 2014/06/25
1.2.18 2014/07/04
1.2.19 2014/11/14
1.2.6 2013/07/02
1.2.8 2013/07/27
2.0.10 2014/08/12
2.0.11 2014/10/17
2.0.12 2015/01/14
2.0.13 2015/03/20
2.0.14 2015/04/01
2.0.15 2015/06/01
2.0.16 2015/07/08
2.0.17 2015/09/18
2.0.5 2014/02/13
2.0.6 2014/04/02
2.0.7 2014/04/24
2.0.8 2014/06/13
2.0.9 2014/07/22
2.1.11 2015/10/12
2.1.12 2015/10/22
2.1.2 2014/11/20
2.1.3 2015/03/03
2.1.4 2015/04/01
2.1.5 2015/03/31
2.1.6 2015/06/09
2.1.7 2015/06/18
2.1.8 2015/07/03
2.1.9 2015/09/03
2.2.0 2015/05/14
2.2.0-beta1 2015/05/19
2.2.0-rc1 2015/06/04
2.2.0-RC2 2015/06/30
2.2.1 2015/08/25
2.2.2 2015/09/25
2.2.3 2015/10/12
2.2.4 2015/12/02
3.0.0 2015/01/26
3.0.0-alpha 2015/07/29
3.0.0-alpha1 2015/07/18
3.0.0-beta1 2015/07/10
3.0.0-beta2 2015/09/04
3.0.0-rc1 2015/07/16
3.0.0-RC2 2015/10/16
3.0.1 2015/12/04
3.0.2 2016/01/21
3.0.3 2015/11/24
3.0.4 2016/02/05
3.0.5 2016/04/02
3.0.6 2016/03/31
3.0.7 2016/05/24
3.0.8 2016/05/25
3.2.819 2016/01/05
3.4.950 2016/03/08
1076/06/03 2016/05/02
1199/08/03 2016/06/27
3.10.3004 2016/08/10

(Ottenuto questo usando un po 'di awk: git log --tags --simplify-by-decoration --pretty="format:%ai %d" |egrep "\(tag: [0-9]"| awk -F" " '{ print $1 " " $5}'|awk -F"." '{print $1 "." $2 "." $3}'| awk -F" " '{print $2 " |" $1}'| sed 's/)//'|sed 's/,//'| sort -n|sort -u -t" " -k1,1 | awk '{print "|" $0 "|"}' )

Installazione o configurazione

Installazione a singolo nodo

  1. Preinstallare NodeJS, Python e Java
  2. Seleziona il documento di installazione in base alla tua piattaforma http://docs.datastax.com/en/cassandra/3.x/cassandra/install/installTOC.html
  3. Scarica i binari di Cassandra da http://cassandra.apache.org/download/
  4. Decomprimere il file scaricato in <installation location>
  5. Avviare la cassandra usando <installation location>/bin/cassandra OPPURE avviare Cassandra come servizio - [sudo] service cassandra start
  6. Controllare se cassandra è attivo e funzionante utilizzando lo stato <installation location>/bin/nodetool status .

Ex:

  1. In ambiente Windows, esegui il file cassandra.bat per avviare il server Cassandra e cqlsh.bat per aprire il terminale client CQL per eseguire i comandi CQL.

Esistono due modi in cui è possibile eseguire l'installazione per un nodo singolo .

Dovresti avere Oracle Java 8 o OpenJDk 8 (preferito per le versioni di Cassandra> 3.0)

1. Installazione di un pacchetto Debian (installa Cassandra come servizio)

Aggiungi la versione di Cassandra al repository (sostituisci il 22x con la tua versione ad esempio per 2.7 usa 27x)

echo "deb-src http://www.apache.org/dist/cassandra/debian 22x main" | sudo tee -a /etc/apt/sources.list.d/cassandra.sources.list
# Update the repository  
sudo apt-get update
# Then install it
sudo apt-get install cassandra cassandra-tools
 

Ora Cassandra può essere avviato e interrotto utilizzando:

sudo service cassandra start
sudo service cassandra stop
 

Controlla lo stato usando:

nodetool status
 

Le directory dei registri e dei dati sono /var/log/cassandra e /var/lib/cassandra rispettivamente.

2. Installazione di qualsiasi versione di Cassandra in forma di tarball binario (installa Cassandra come processo autonomo)

Scarica la versione Datastax:

curl -L  http://downloads.datastax.com/community/dsc-cassandra-version_number-bin.tar.gz | tar xz
 

Oppure manualmente il tarball binario di Apache Cassandra (dal sito http://www.apache.org/dist/cassandra/)

Ora decomprimi questo:

tar -xvzf dsc-cassandra-version_number-bin.tar.gz
 

Cambia la directory per installare il percorso:

cd install_location
 

Avvia Cassandra usando:

sudo sh ./bin/cassandra 
 

Smettere di usare:

sudo kill -9 pid
 

Dai un'occhiata:

./bin/nodetool status
 

E viola, hai un cluster di test a nodo singolo per Cassandra. Quindi usa solo cqlsh nel terminale per la shell di Cassandra.

Configurazione di Cassandra può essere fatto in cassandra.yaml in conf cartella in install_location .

Installazione multi-nodo

Installazione Multi Cluster DC