1. spark之上提供了四种应用库:

1)Spark SQL 是为处理结构化数据而设计的模块

2)Spark Streaming 可以很容易地创建可扩展和容错性的流式应用

3) MLlib 是Spark的可扩展机器学习库

4) GraphX 是Spark的并行图计算API

查看原文 >>
相关文章