1. spark之上提供了四种应用库:
1)Spark SQL 是为处理结构化数据而设计的模块
2)Spark Streaming 可以很容易地创建可扩展和容错性的流式应用
3) MLlib 是Spark的可扩展机器学习库
4) GraphX 是Spark的并行图计算API