cassandracassandra入门


备注

当您需要可扩展性和高可用性而不影响性能时,Apache Cassandra数据库是正确的选择。商用硬件或云基础架构的线性可扩展性和经过验证的容错使其成为关键任务数据的完美平台。 Cassandra对跨多个数据中心进行复制的支持是同类产品中最好的,可以为您的用户提供更低的延迟,并让您高枕无忧,因为他们知道您可以在区域停电中幸存下来。

经过验证

Cassandra在Constant Contact,CERN,Comcast,eBay,GitHub,GoDaddy,Hulu,Instagram,Intuit,Netflix,Reddit,The Weather Channel以及超过1500家拥有大型活跃数据集的公司中使用。

容错

数据会自动复制到多个节点以实现容错。支持跨多个数据中心的复制。可以替换失败的节点,无需停机。

高性能

Cassandra在基准测试和实际应用程序中始终优于流行的NoSQL替代品,主要是因为基础架构选择。

下放

没有单点故障。没有网络瓶颈。集群中的每个节点都是相同的。

可扩展

一些最大的生产部署包括Apple,超过75,000个节点存储超过10 PB的数据,Netflix(2,500个节点,420 TB,每天超过1万亿请求),中文搜索引擎Easou(270个节点,300 TB,超过8亿)每天要求)和eBay(超过100个节点,250 TB)。

耐用

即使整个数据中心出现故障,Cassandra也适用于无法承受数据丢失的应用程序。

你控制住了

为每个更新选择同步或异步复制。高度可用的异步操作通过Hinted Handoff和Read Repair等功能进行了优化。

弹性

随着新机器的添加,读写吞吐量也会线性增加,无需停机或中断应用程序。

专业支持

Cassandra支持合同和服务可从第三方获得。

版本

发布日期
1.1.12 2013年11月19日
1.1.9 2013年2月11日
1.2.12 2013年11月28日
1.2.13 二零一三年十二月十九日
1.2.15 2014年2月19日
1.2.16 2014年4月22日
1.2.17 2014-06-25
1.2.18 2014年7月4日
1.2.19 二〇一四年十一月十四日
1.2.6 2013-07-02
1.2.8 2013年7月27日
2.0.10 2014年8月12日
2.0.11 2014年10月17日
2.0.12 2015年1月14日
2.0.13 2015年3月20日
2.0.14 2015-04-01
2.0.15 2015年6月1日
2.0.16 2015年7月8日
2.0.17 2015年9月18日
2.0.5 2014年2月13日
2.0.6 2014年4月2日
2.0.7 2014年4月24日
2.0.8 2014年6月13日
2.0.9 2014年7月22日
2.1.11 2015年10月12日
2.1.12 2015年10月22日
2.1.2 2014年11月20日
2.1.3 2015年3月3日
2.1.4 2015-04-01
2.1.5 2015年3月31日
2.1.6 2015-06-25
2.1.7 2015年6月18日
2.1.8 2015年7月3日
2.1.9 2015年9月3日
2.2.0 2015年5月14日
2.2.0-β1 2015年5月19日
2.2.0-RC1 选择月份
2.2.0-RC2 二零一五年六月三十零日
2.2.1 2015年8月25日
2.2.2 2015年9月25日
2.2.3 2015年10月12日
2.2.4 2015年12月2日
3.0.0 2015年1月26日
3.0.0-α 2015年7月29日
3.0.0-α1 2015年7月18日
3.0.0-β1 2015年7月10日
3.0.0-β2 2015年9月4日
3.0.0-RC1 2015-07-17
3.0.0-RC2 二〇一五年十月一十六日
3.0.1 2015年12月4日
3.0.2 2016年1月21日
3.0.3 2015年11月24日
3.0.4 2016年2月5日
3.0.5 2016年4月2日
3.0.6 2016年3月31日
3.0.7 2016年5月24日
3.0.8 2016年5月25日
3.2.819 2016年1月5日
3.4.950 2016年3月8日
1076年3月6日 2016年5月2日
1199年3月8日 2016年6月27日
3.10.3004 2016年8月10日

(使用了一点awk: git log --tags --simplify-by-decoration --pretty="format:%ai %d" |egrep "\(tag: [0-9]"| awk -F" " '{ print $1 " " $5}'|awk -F"." '{print $1 "." $2 "." $3}'| awk -F" " '{print $2 " |" $1}'| sed 's/)//'|sed 's/,//'| sort -n|sort -u -t" " -k1,1 | awk '{print "|" $0 "|"}'

安装或设置

单节点安装

  1. 预安装NodeJS,Python和Java
  2. 根据您的平台选择安装文档http://docs.datastax.com/en/cassandra/3.x/cassandra/install/installTOC.html
  3. http://cassandra.apache.org/download/下载Cassandra二进制文件
  4. 将下载的文件解压缩到<installation location>
  5. 使用<installation location>/bin/cassandra 启动<installation location>/bin/cassandra 或者启动Cassandra作为服务 - [sudo] service cassandra start
  6. 使用<installation location>/bin/nodetool status 检查cassandra是否已启动并正在运行。

例如:

  1. 在Windows环境中运行cassandra.bat 文件以启动Cassandra服务器和cqlsh.bat 以打开CQL客户端终端以执行CQL命令。

有两种方法可以执行单节点的安装。

您应该拥有Oracle Java 8或OpenJDk 8(Cassandra版本> 3.0的首选)

1.安装Debian软件包(将Cassandra安装为服务)

将Cassandra版本添加到存储库(将22x替换为您自己的版本,例如2.7使用27x)

echo "deb-src http://www.apache.org/dist/cassandra/debian 22x main" | sudo tee -a /etc/apt/sources.list.d/cassandra.sources.list
# Update the repository  
sudo apt-get update
# Then install it
sudo apt-get install cassandra cassandra-tools
 

现在可以使用以下命令启动和停止Cassandra:

sudo service cassandra start
sudo service cassandra stop
 

使用以下方法检查状态

nodetool status
 

日志和数据目录分别是/var/log/cassandra/var/lib/cassandra

2.以二进制tarball的形式安装任何版本的Cassandra(将Cassandra安装为独立进程)

下载Datastax版本:

curl -L  http://downloads.datastax.com/community/dsc-cassandra-version_number-bin.tar.gz | tar xz
 

或手动Apache Cassandra二进制tarball(来自网站http://www.apache.org/dist/cassandra/)

现在解读这个:

tar -xvzf dsc-cassandra-version_number-bin.tar.gz
 

将目录更改为安装位置:

cd install_location
 

使用以下命令启动Cassandra:

sudo sh ./bin/cassandra 
 

停止使用:

sudo kill -9 pid
 

校验:

./bin/nodetool status
 

而且,中提琴,你有一个Cassandra的单节点测试集群。所以只需在终端中使用cqlsh for Cassandra shell。

Cassandra的配置可以在install_location conf 文件夹中的cassandra.yaml 中完成。

多节点安装

多DC群集安装