|
关于我们
书单推荐 更多 新书推荐 更多 |
Spark大数据处理与分析
本教材重点介绍了Linux集群环境的完全分布式环境搭建、SparkCore(RDD)、SparkSQL数据处理编程(DataFrame)、SparkStreaming编程模型(LegacyDStream)、StructuredStreaming编程模型、SparkMLlib(DataFrame-based、RDD-based),以帮助学生初步掌握大数据平台的数据接入、处理、分析和挖掘工作,理解Spark生态的大数据离线/实时处理平台的设计、开发及持续优化和数据模型的建立、设计与算法实现,以及模型效果的追踪、检验及优化。
你还可能感兴趣
|