前言
本人大数据专业方向,收集学习一些相关文章,汇总如下。有些资源来源网络,出处不明,如有错误请告知,谢谢
Hadoop
18.11.18
- 有的旧的官方文档盖楼:Hadoop 0.18文档
- Hadoop新手学习指导
(出处: about云开发) - 零基础学习hadoop到上手工作线路指导(初级篇)
(出处: about云开发)
- 推荐一个博客分类博主LanceToBigData:Hadoop
一、学习路线图
二、编程实践
- Hadoop历史版本安装
- 用Maven构建Hadoop项目
- Hadoop编程调用HDFS
- 用Maven构建Mahout项目
- Mahout推荐算法API详解
- 用MapReduce实现矩阵乘法
- 从源代码剖析Mahout推荐引擎
- Mahout分步式程序开发 基于物品的协同过滤ItemCF
- Mahout分步式程序开发 聚类Kmeans
- PageRank算法并行实现
三、案例分析
- 海量Web日志分析 用Hadoop提取KPI统计指标
- 用Hadoop构建电影推荐系统
- 用Mahout构建职位推荐引擎
- Mahout构建图书推荐系统
- PeopleRank从社交网络中发现个体价值
作者:Lincoln
链接:https://www.zhihu.com/question/19795366/answer/24524910
来源:知乎18.11.20 我来更新了
- 推荐博文、博主
- 小小默’s Blog,分类很乱但是内容确实不错
- Hadoop MapReduce Tutorial,挺赞的
- 哥不是小萝莉·博客园,偏应用吧,概念什么的不咋地
- 我还搜到一本书,豆瓣上说不错,《Mapreduce2.0源码分析与编程实战》(那个,你们谁有csdn会员啊,csdn上有这个下载,50积分下不起啊。没找到完整版的,你们有的话分享我一下呗。。。)
Spark
18.11.18
- 书籍
- 上面推荐的书籍,我一一粗略的翻了一下,最好先看第一本《Spark快速大数据分析》
- 本人是选用scala作为开发语言,最近也在看这门编程语言。说实话,scala写起来真的是不习惯。。。无语。
- 最近在看厦大林子雨老师的书和视频——《spark 编程基础·scala版》,书是图书馆借的,挺薄一本讲义类型的书,感觉快速上手scala没问题,他也有配套视频Spark编程基础。有些资料可以上厦大的官网上找到,总之一句话,挺适合小白
- 慕课网有一门课程《学习Scala 进击大数据Spark生态圈》,收费的,当然你也懂(要善于使用网络资源),我个人是支持知识付费的。这门课我也跟进看了,是讲的scala语言。我感觉单看书就可以了,视频太费时间了。
- 博客资源
- Spark Overview,这是官方文档,最新的2.4.0版本全英文版。一句话比那些书啊、博客啊好太多了。如果英文不好的话,这里有Spark Overvoew·中文版
- 就我个人而言,了解scala基础后,在翻完《Spark快速大数据分析》,然后刷文档是非常不错的
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://josonle.github.io