Cassandra | 技术 | 社区

Cassandra

强大的支持力量

商业

大公司

生态周边

引 言  

在本次 ApacheCon2019年的会议上,Cassandra的议题多达 30 场次: https://www.apachecon.com/acna19/s/#/schedule?search=Cassandra ,与最火的Spark类似。其它一些项目只有个位数的分享。

这么多的分享,背后必然有一个强大的生态社区,本文将梳理下Cassandra的商业公司、云公司、全球使用的大公司及相关生态的支持。另外有份资料表明,从事Cassandra职业的薪水非常可观,排名第五!

商业公司 

Datastax https://www.datastax.com/ ,是一家位于加州的初创公司,提供了一个商业版本的Apache Cassandra数据库,公司目前已经接近1亿美元的融资。创始人也是Cassandra作者之一,是社区Cassandra较大贡献者。Datastax的Cassandra核心集成了Solr提供检索服务;另外集成Spark,与Cassandra一起搭配,提供流、存储、计算、机器学习一体化的存储计算分析服务。根据一些公开的资料,目前服务了较多世界500强的公司。

InstaClustr :提供了开源的Cassandra、ES、Spark、Kafka,并且以Cassandra为核心。Cassandra、ES、Spark、Kafka也被称之为新大数据4组件。

Thelastpickle :一家做Cassandra咨询的公司,公司也有不少的PMC及Committer。其开源了很多外围的工具,比如cassandra-reaper等,可以关注Thelastpickle的首页: https://thelastpickle.com

scylladb :支持CQL协议的,号称是C++版本的Cassandra,参考: https://www.scylladb.com

Strapdata :是cassandra + ES结合背后的商业公司,参考: https://www.strapdata.com/

这些商业公司,看起来也是分工合作,有的结合其他组件,有的提供工具,有的不断增强内核,共同把社区做大。

云公司 

AWS :DynamoDB,本身Cassandra就是参考DynamoDB做的,社区也流行Cassandra就是DynamoDB的开源实现。因为AWS已经有DynamoDB,所以并没有支持Cassandra。不过AWS官方支持从Cassandra迁移到DynamoDB。另外一股潮流是 阿里云、Datastax、scylladb都在支持DynamoDB的协议。

Azure :CosmosDB,号称宇宙数据库,支持CQL的接口。

Google :Google面临跟AWS及Azure的竞争,他选择的路是直接与各大Paas的商业公司合作,比如:Datastax、Mongo等公司,也会提供Cassandra的支持。

阿里云 :在数据库的一方产品类别,直接提供原生的Cassandra服务,另外阿里云近期也重点在国内宣传Cassandra及积极贡献社区,是非常有诚意的,参考:https://www.aliyun.com/product/cds

华为云 :最近华为出了一个多模数据库,宣传是可以支持Cassandra与MongoDB

腾讯云 :貌似没有支持,不过迫于全球的云公司都对Cassandra有一定的支持,或许后续有一定的动作

 全球较大使用Cassandra 的公司 

根据不完全统计,在全球有超过10w公司在使用Cassandra,国内至少有5000家企业在使用。列举一些较大的使用的非云公司。(排除 阿里、华为、腾讯、京东等做云的公司)。

具体可以参考文章: https://developer.aliyun.com/article/718156

•Apple :目前有16w台的规模,使用在各个业务线,也是Cassandra社区较为活跃的贡献者

•Netflix :目前有数千台在使用,社区比较活跃,这片文章也了 netflix为什么选择cassandra: https://www.jcount.com/7-reasons-netflix-uses-cassandra-databases/

•Facebook :主导了cassandra+rocksdb的研发: https://thenewstack.io/instagram-supercharges-cassandra-pluggable-rocksdb-storage-engine/

•360 :之前主要用在云盘的业务,也是国内较早的使用者之一,规模也比较大。

•思科 :主要使用在设备制造等场景

与Cassandra结合的生态 

Cassandra + Spark :Datastax维护的项目,目前有1000+的star。参考: https://github.com/datastax/spark-cassandra-connector 。Cassandra从10年就开始跟Hadoop结合,后续Cassandra与Spark结合的更加紧密。

Cassandra + ES :es的每个节点放到了Cassandra的进程里面,同时提供CQL及ES api的接口。参考: https://www.elassandra.io/

Cassandra + Kafka :支持把Kafka的数据直接写到Cassandra

Cassandra + RocksDB :RocksDB 与Cassandra同是Facebook开源的项目,两者做加法是天然的结合。CASSANDRA-13476目前也在推进之中,另外Facebook也开源了一个Cassandra与Rocksdb结合的项目Rocksandra

Cassandra + Datax :Datax是阿里开源的项目,阿里云Cassandra团队即将提交Patch支持Cassandra,包括MySQL写到Cassandra

Cassandra + Flink :Flink社区支持了Cassandra的connector,参考: https://github.com/apache/flink/tree/master/flink-connectors/flink-connector-cassandra

Cassandra + Spring :支持spring写到Cassandra,此项目还是比较活跃的,参考: https://github.com/spring-projects/spring-data-cassandra 

Cassandra + Lucene :Lucene可以作为Cassandra本地二级索引。参考: https://github.com/Stratio/cassandra-lucene-index

Cassandra + JanusGraph :图数据库,JanusGraph支持以Cassandra为底座提供图服务

Cassandra + GeoMesa :时空数据库,GeoMesa支持以Cassandra为底座提供时空数据服务

Cassandra + KairosDB :时序数据库,KairosDB支持以Cassandra为底座提供时序服务

Cassandra + heroic :时序数据库,heroic支持以Cassandra为底座提供时序服务

thingsboard :物联网平台,仅仅支持Cassandra作为存储引擎

devicehive :物联网平台,支持Cassandra作为存储引擎

如果有其它的生态对接,欢迎反馈给社区~

总结

Cassandra背后的力量是很强大的,有全球最大的公司的支持,有数个商业公司支持,大部分的云都支持或者支持CQL语法,另外有数不清楚的其它生态的力量在跟Cassandra做加法。Cassandra真实火的不得了。希望后续Cassandra在 中国Cassandra技术社区、阿里云、各大公司、爱好者的推动下,火起来。 Cassandra你值得拥有~

原文链接: https://yq.aliyun.com/articles/719587?spm=a2c4e.11153959.0.0.711a1378Y2RheT

入群邀约

为了营造一个开放的 Cassandra 技术交流环境,社区建立了微信群公众号和钉钉群,为广大用户提供专业的技术分享及问答,定期开展专家技术直播,欢迎大家加入。另外阿里云提供免费Cassandra试用: https://www.aliyun.com/product/cds

相关文章