Hadoop及Spark学习路线及资源收纳

前言

本人大数据专业方向,收集学习一些相关文章,汇总如下。有些资源来源网络,出处不明,如有错误请告知,谢谢

Hadoop

18.11.18




一、学习路线图

二、编程实践

三、案例分析

  • 海量Web日志分析 用Hadoop提取KPI统计指标
  • 用Hadoop构建电影推荐系统
  • 用Mahout构建职位推荐引擎
  • Mahout构建图书推荐系统
  • PeopleRank从社交网络中发现个体价值

    作者:Lincoln
    链接:https://www.zhihu.com/question/19795366/answer/24524910
    来源:知乎

    18.11.20 我来更新了

  • 推荐博文、博主
  • 我还搜到一本书,豆瓣上说不错,《Mapreduce2.0源码分析与编程实战》(那个,你们谁有csdn会员啊,csdn上有这个下载,50积分下不起啊。没找到完整版的,你们有的话分享我一下呗。。。)

    Spark

    18.11.18

  • 书籍
    • 《Spark快速大数据分析》[美] Holden Karau [美] Andy Konwinski [美] Patrick Wendell [加] Matei Zaharia 著
    • 《Spark大数据处理:技术、应用与性能优化》
    • 《Spark快速数据处理·美 Holden Karau著》

      18.11.20 我来更新了

  • 上面推荐的书籍,我一一粗略的翻了一下,最好先看第一本《Spark快速大数据分析》
  • 本人是选用scala作为开发语言,最近也在看这门编程语言。说实话,scala写起来真的是不习惯。。。无语。
    • 最近在看厦大林子雨老师的书和视频——《spark 编程基础·scala版》,书是图书馆借的,挺薄一本讲义类型的书,感觉快速上手scala没问题,他也有配套视频Spark编程基础。有些资料可以上厦大的官网上找到,总之一句话,挺适合小白
    • 慕课网有一门课程《学习Scala 进击大数据Spark生态圈》,收费的,当然你也懂(要善于使用网络资源),我个人是支持知识付费的。这门课我也跟进看了,是讲的scala语言。我感觉单看书就可以了,视频太费时间了
  • 博客资源
  • Spark Overview,这是官方文档,最新的2.4.0版本全英文版。一句话比那些书啊、博客啊好太多了。如果英文不好的话,这里有Spark Overvoew·中文版
  • 就我个人而言,了解scala基础后,在翻完《Spark快速大数据分析》,然后刷文档是非常不错的

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://josonle.github.io

觉得有帮助的话,不妨加个鸡腿,O(∩_∩)O哈哈~