cassandraНачало работы с cassandra


замечания

База данных Apache Cassandra является правильным выбором, когда вам нужна масштабируемость и высокая доступность без ущерба для производительности. Линейная масштабируемость и проверенная отказоустойчивость на товарном оборудовании или облачной инфраструктуре делают ее идеальной платформой для критически важных данных. Поддержка Cassandra для тиражирования в нескольких центрах обработки данных является лучшей в своем классе, обеспечивая меньшую задержку для ваших пользователей и спокойствие, зная, что вы можете пережить региональные сбои.

ПРОВЕРЕННАЯ

Cassandra используется в постоянных контактах, CERN, Comcast, eBay, GitHub, GoDaddy, Hulu, Instagram, Intuit, Netflix, Reddit, Weather Channel и более чем 1500 других компаний с большими активными наборами данных.

ОТКАЗОУСТОЙЧИВОЙ

Данные автоматически реплицируются на несколько узлов для отказоустойчивости. Поддерживается репликация в нескольких центрах обработки данных. Неудачные узлы могут быть заменены без простоя.

производительный

Cassandra последовательно превосходит популярные альтернативы NoSQL в тестах и ​​реальных приложениях, прежде всего из-за фундаментальных архитектурных решений.

ДЕЦЕНТРАЛИЗОВАННОЕ

Нет никаких точек отказа. Отсутствуют узкие места в сети. Каждый узел в кластере идентичен.

МАСШТАБИРУЕМАЯ

Некоторые из крупнейших производственных развертываний включают в себя Apple, с более чем 75 000 узлов, хранящими более 10 PB данных, Netflix (2500 узлов, 420 ТБ, более 1 трлн запросов в день), китайская поисковая система Easou (270 узлов, 300 ТБ, более 800 миллионов reqests в день) и eBay (более 100 узлов, 250 ТБ).

DURABLE

Cassandra подходит для приложений, которые не могут потерять данные, даже когда весь центр обработки данных опускается.

ВЫ В КОНТРОЛЕ

Выберите между синхронной или асинхронной репликацией для каждого обновления. Высокодоступные асинхронные операции оптимизируются с такими функциями, как Hinted Handoff и Read Repair.

ЭЛАСТИЧНЫЙ

Производительность чтения и записи также увеличивается линейно по мере добавления новых машин без простоя или прерывания приложений.

ПРОФЕССИОНАЛЬНО ПОДДЕРЖИВАЕТСЯ

Контракт и услуги Cassandra предоставляются от третьих лиц.

Версии

Версия Дата выхода
1.1.12 2013-11-19
1.1.9 2013-02-11
1.2.12 2013-11-28
1.2.13 2013-12-19
1.2.15 2014-02-19
1.2.16 2014-04-22
1.2.17 2014-06-25
1.2.18 2014-07-04
1.2.19 2014-11-14
1.2.6 2013-07-02
1.2.8 2013-07-27
2.0.10 2014-08-12
2.0.11 2014-10-17
2.0.12 2015-01-14
2.0.13 2015-03-20
2.0.14 2015-04-01
2.0.15 2015-06-01
2.0.16 2015-07-08
2.0.17 2015-09-18
2.0.5 2014-02-13
2.0.6 2014-04-02
2.0.7 2014-04-24
2.0.8 2014-06-13
2.0.9 2014-07-22
2.1.11 2015-10-12
2.1.12 2015-10-22
2.1.2 2014-11-20
2.1.3 2015-03-03
2.1.4 2015-04-01
2.1.5 2015-03-31
2.1.6 2015-06-09
2.1.7 2015-06-18
2.1.8 2015-07-03
2.1.9 2015-09-03
2.2.0 2015-05-14
2.2.0-beta1 2015-05-19
2.2.0-rc1 2015-06-04
2.2.0-RC2 2015-06-30
2.2.1 2015-08-25
2.2.2 2015-09-25
2.2.3 2015-10-12
2.2.4 2015-12-02
3.0.0 2015-01-26
3.0.0-альфа 2015-07-29
3.0.0-альфа1 2015-07-18
3.0.0-beta1 2015-07-10
3.0.0-beta2 2015-09-04
3.0.0-rc1 2015-07-16
3.0.0-RC2 2015-10-16
3.0.1 2015-12-04
3.0.2 2016-01-21
3.0.3 2015-11-24
3.0.4 2016-02-05
3.0.5 2016-04-02
3.0.6 2016-03-31
3.0.7 2016-05-24
3.0.8 2016-05-25
3.2.819 2016-01-05
3.4.950 2016-03-08
3.6.1076 2016-05-02
3.8.1199 2016-06-27
3.10.3004 2016-08-10

(Получил это, используя бит awk: git log --tags --simplify-by-decoration --pretty="format:%ai %d" |egrep "\(tag: [0-9]"| awk -F" " '{ print $1 " " $5}'|awk -F"." '{print $1 "." $2 "." $3}'| awk -F" " '{print $2 " |" $1}'| sed 's/)//'|sed 's/,//'| sort -n|sort -u -t" " -k1,1 | awk '{print "|" $0 "|"}' )

Установка или настройка

Установка одного узла

  1. Предварительная установка NodeJS, Python и Java
  2. Выберите свой установочный документ на основе вашей платформы http://docs.datastax.com/en/cassandra/3.x/cassandra/install/installTOC.html
  3. Загрузите двойные файлы Cassandra с http://cassandra.apache.org/download/
  4. Отпустите загруженный файл в <installation location>
  5. Запустите cassandra, используя <installation location>/bin/cassandra ИЛИ запустите Cassandra в качестве сервиса - [sudo] service cassandra start
  6. Убедитесь, что cassandra запущен и работает с использованием <installation location>/bin/nodetool status .

Пример:

  1. В среде Windows запустить cassandra.bat файл для запуска сервера Кассандры и cqlsh.bat открыть клиентский терминал CQL для выполнения команд CQL.

Существует два способа установки для одиночного узла .

У вас должен быть Oracle Java 8 или OpenJDk 8 (предпочтительнее для версий Cassandra> 3.0)

1. Установка пакета Debian (установка Cassandra в качестве сервиса)

Добавьте версию Cassandra в репозиторий (замените 22x своей собственной версией, например, для 2.7 используйте 27x)

echo "deb-src http://www.apache.org/dist/cassandra/debian 22x main" | sudo tee -a /etc/apt/sources.list.d/cassandra.sources.list
# Update the repository  
sudo apt-get update
# Then install it
sudo apt-get install cassandra cassandra-tools
 

Теперь Cassandra можно запустить и остановить, используя:

sudo service cassandra start
sudo service cassandra stop
 

Проверьте состояние, используя:

nodetool status
 

Журналы и каталоги данных - это /var/log/cassandra и /var/lib/cassandra соответственно.

2. Установка любой версии Cassandra в виде бинарного tarball (устанавливает Cassandra как отдельный процесс)

Загрузите версию Datastax:

curl -L  http://downloads.datastax.com/community/dsc-cassandra-version_number-bin.tar.gz | tar xz
 

Или бинарный tarball Apache Cassandra вручную (с сайта http://www.apache.org/dist/cassandra/)

Теперь отмените это:

tar -xvzf dsc-cassandra-version_number-bin.tar.gz
 

Измените каталог для установки местоположения:

cd install_location
 

Запустите Cassandra, используя:

sudo sh ./bin/cassandra 
 

Прекратить использование:

sudo kill -9 pid
 

Проверьте:

./bin/nodetool status
 

И альт, у вас есть одноузловой тестовый кластер для Cassandra. Поэтому просто используйте cqlsh в терминале для оболочки Cassandra.

Конфигурация Cassandra может быть выполнена в папке cassandra.yaml в папке conf в install_location .

Установка нескольких узлов

Multi DC Cluster Installation