Spark实战大数据离线与实时项目 整合大数据生态圈多个框架 | 完结

小七学习网,助您升职加薪,遇问题可联系:客服微信【1099252741】 备注:来自网站

Spark进阶 大数据离线与实时项目实战
整合大数据生态圈多个框架(Spark/Hbase/Redis/Hadoop) ,Spark大技术栈的企业级应用
本课程整合Redis和HBase打造以Spark技术栈为核心的离线处理项目以及实时处理项目,以功能实现为基础,通过调优及重构功能实现,达到企业级生产水平。课程最后讲解Alluxio整合Hadoop和Spark的使用,拓展同学们的视野。

Spark进阶 大数据离线与实时项目实战
整合大数据生态圈多个框架(Spark/Hbase/Redis/Hadoop) ,Spark大技术栈的企业级应用
本课程整合Redis和HBase打造以Spark技术栈为核心的离线处理项目以及实时处理项目,以功能实现为基础,通过调优及重构功能实现,达到企业级生产水平。课程最后讲解Alluxio整合Hadoop和Spark的使用,拓展同学们的视野。

〖课程目录〗:

  • 第1章 课程介绍&学习指南 试看2 节 | 12分钟
  • 本章会对这门课程进行说明并进行学习方法介绍。
  • 收起列表
    • 视频:1-1 课程介绍 (11:26)试看
    • 图文:1-2 ***学前必读***(助你平稳踩坑,畅学无忧,课程学习与解决问题指南)
  • 第2章 Redis入门 试看12 节 | 126分钟
  • Redis是目前最火爆的内存数据库之一,通过在内存中读写数据,大大提高了读写速度。本章将从Redis特性、应用场景出发,到Redis的基础命令,再到Redis的常用数据类型实操,最后通过Java API来操作Redis,为后续实时处理项目打下坚实的基础…
  • 收起列表
    • 视频:2-1 课程目录 (02:44)
    • 视频:2-2 Redis概述 (10:06)
    • 视频:2-3 Redis特性 (10:14)
    • 视频:2-4 Redis应用场景 (06:50)
    • 视频:2-5 Redis部署&服务启停&客户端连接 (17:09)
    • 视频:2-6 Redis多数据库特性 (07:04)试看
    • 视频:2-7 Redis基础命令的使用 (09:35)
    • 视频:2-8 Redis数据类型之string (15:14)
    • 视频:2-9 Redis数据类型之list (17:39)
    • 视频:2-10 Redis基本数据类型之set (13:53)
    • 视频:2-11 使用Jedis对Redis进行操作 (09:55)
    • 视频:2-12 Redis工具类开发 (04:54)
  • 第3章 HBase入门20 节 | 142分钟
  • HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。本章将从HBase是什么、有哪些特点出发,到HBase环境部署,到HBase的数据模型,到HBase的操作(命令行&API),为后续离线处理项目的数据存储以及查询打下坚实的基础。…
  • 收起列表
    • 视频:3-1 数据存储现状 (07:26)
    • 视频:3-2 HBase是什么 (05:58)
    • 视频:3-3 HBase在生态圈中的位置以及列式存储带来的好处 (07:49)
    • 视频:3-4 HBase的特点.mp4 (05:23)
    • 视频:3-5 HBase vs RDBMS vs HDFS.mp4 (05:15)
    • 视频:3-6 HBase的优势 (02:58)
    • 视频:3-7 HBase数据模型 (09:47)
    • 视频:3-8 JDK环境搭建 (04:19)
    • 视频:3-9 Hadoop环境部署(详解一个常见的错误解决方案) (14:41)
    • 视频:3-10 ZooKeeper环境部署 (03:32)
    • 视频:3-11 HBase环境部署 (09:01)
    • 视频:3-12 HBase shell DDL操作 (06:28)
    • 视频:3-13 HBase shell DML操作 (09:48)
    • 视频:3-14 HBase API编程之开发前置准备工作 (10:31)
    • 视频:3-15 HBase API编程之创建表以及查询表和所有列族 (07:32)
    • 视频:3-16 HBase API编程之添加和修改记录 (07:41)
    • 视频:3-17 HBase API编程之通过RowKey获取值 (05:47)
    • 视频:3-18 HBase API编程之Scan (08:39)
    • 视频:3-19 HBase API编程之Filter (06:09)
    • 视频:3-20 HBase API编程之总结 (02:27)
  • 第4章 离线项目实战V1 试看22 节 | 182分钟
  • 本章节讲解基于Spark和HBase的离线综合项目实战,从多个框架的整合出发,到使用Spark进行ETL处理然后数据落地到HBase中涉及到的传参、HBase Rowkey的设计,再到性能的初步调优,最后使用Spark整合HBase进行数据的统计分析。本章是基于Spark进行离线处理的重点,务必掌握。…
  • 收起列表
    • 视频:4-1 课程目录 (03:03)
    • 视频:4-2 项目背景 (09:31)
    • 视频:4-3 项目处理流程.mp4 (11:03)
    • 视频:4-4 项目离线和实时架构图 (12:01)
    • 视频:4-5 明确架构图中每个步骤使用的技术以及职责所在 (06:32)试看
    • 视频:4-6 项目指标需求 (03:57)
    • 视频:4-7 功能开发之UserAgent解析(掌握如何获取技能) (16:46)
    • 视频:4-8 功能开发之IP解析思路 (02:12)
    • 视频:4-9 功能开发之Spark和HBase依赖整合 (03:39)
    • 视频:4-10 开发环境依赖使用说明 (09:16)
    • 视频:4-11 功能开发之解析日志成DataFrame并为DataFrame添加字段信息 (08:32)
    • 视频:4-12 功能开发之将DF内容转成HBase要存储的列 (15:03)
    • 视频:4-13 功能开发之整体ETL流程详解及如何传参设计 (10:20)
    • 视频:4-14 功能开发之创建HBase表 (13:54)
    • 视频:4-15 功能开发之HBase Rowkey设计_1 (10:07)
    • 视频:4-16 功能开发之完成ETL数据到HBase落地的全过程 (09:10)
    • 视频:4-17 功能开发之完成第一个指标的统计分析 (19:10)
    • 视频:4-18 功能开发之完成第二个指标的统计分析 (03:33)
    • 视频:4-19 性能优化之缓存的使用 (04:13)
    • 视频:4-20 功能开发之统计功能使用DataFrame API以及SQL API来完成 (06:33)
    • 视频:4-21 本章小结 (02:29)
    • 作业:4-22 【讨论题】关于Spark RDD核心算子的思考
  • 第5章 离线项目实战优化11 节 | 109分钟
  • 本章节将基于前面一个章节的功能实现进行进一步的优化,如何将在需求功能实现的基础之上,进行调优,使得在生产上的执行效率更高。本章将是提升自身综合实力的关键部分,务必掌握。
  • 收起列表
    • 视频:5-1 课程目录 (02:15)
    • 视频:5-2 Spark on YARN (12:02)
    • 视频:5-3 Linux时间获取 (04:13)
    • 视频:5-4 shell封装Spark作业提交脚本 (23:27)
    • 视频:5-5 将统计结果写入到MySQL中 (15:19)
    • 视频:5-6 统计结果写入到MySQL调优 (04:06)
    • 视频:5-7 Spark ETL到HBase优化之禁用WAL (18:29)
    • 视频:5-8 Spark ETL到HBase的HFile思路 (03:49)
    • 视频:5-9 Spark产生HFile文件格式准备工作 (10:55)
    • 视频:5-10 Spark产生HFile整个流程实现并总结 (14:06)
    • 作业:5-11 【讨论题】Spark OOM问题
  • 第6章 实时项目实战15 节 | 103分钟
  • 本章节讲解基于Spark和Redis的实时综合项目实战,从Spark Streaming整合Kafka对接出发,如何实现需求的功能以及如何对代码进行重构使得执行效率更好,掌握Redis在项目实战中的数据类型选型,以及如何将SparkStreaming处理完的数据写入到Redis中去。…
  • 收起列表
    • 视频:6-1 课程目录 (01:58)
    • 视频:6-2 项目背景 (02:31)
    • 视频:6-3 项目架构及处理流程 (05:01)
    • 视频:6-4 项目需求 (02:43)
    • 视频:6-5 开发环境准备及参数配置统一管理 (11:46)
    • 视频:6-6 Kafka部署及测试 (05:45)
    • 视频:6-7 Mock数据 (08:34)
    • 视频:6-8 发送数据到Kafka (12:56)
    • 视频:6-9 SparkStreaming对接Kafka数据 (06:18)
    • 视频:6-10 功能实现之每天的粒度统计..1 (15:54)
    • 视频:6-11 功能开发之调优 (04:36)
    • 视频:6-12 功能实现小结 (03:37)
    • 视频:6-13 功能实现之每小时统计及代码重构 (12:54)
    • 视频:6-14 SparkStreaming对接Kafka offset管理 (07:57)
    • 作业:6-15 【讨论题】SparkStreaming对接Kafka数据在项
  • 第7章 初识Alluxio13 节 | 108分钟
  • Alluxio是一个以内存为中心的虚拟分布式存储系统,统一数据访问和桥梁的计算框架和底层存储系统。应用程序只需要Alluxio就可以把访问存储在任何底层存储系统的数据连接。本章节将从Alluxio为我们带来的好处出发,再到Alluxio如何整合Hadoop以及Spark进行实操,并分享一些Alluxio在大公司中的使用案例。…
  • 收起列表
    • 视频:7-1 课程目录 (02:05)
    • 视频:7-2 概述 (08:41)
    • 视频:7-3 Spark应用存在的问题分析 (08:39)
    • 视频:7-4 Alluxio能为我们带来什么 (08:05)
    • 视频:7-5 Alluxio特点 (05:46)
    • 视频:7-6 在Spark实战项目中引入Alluxio (07:28)
    • 视频:7-7 Alluxio部署 (11:29)
    • 视频:7-8 Alluxio文件系统命令行操作 (09:24)
    • 视频:7-9 Alluxio整合HDFS使用 (08:15)
    • 视频:7-10 Alluxio整合MapReduce使用 (08:07)
    • 视频:7-11 Alluxio整合Spark使用 (06:29)
    • 视频:7-12 Alluxio案例分享之在百度的使用 (11:36)
    • 视频:7-13 Alluxio案例分享之在去哪儿的应用 (11:52)
  • 第8章 Spark优化11 节 | 76分钟
  • 本章节将从Spark在生产上的最佳实践出发,和大家分享Spark的常用优化策略。
  • 收起列表
    • 视频:8-1 课程目录 (04:26)
    • 视频:8-2 调优之资源设置 (17:27)
    • 视频:8-3 调优之算子的合理选择 (09:47)
    • 视频:8-4 扩展之自定义排序一 (08:01)
    • 视频:8-5 扩展之自定义排序二(附带经典面试题) (07:14)
    • 视频:8-6 扩展之自定义排序(隐式转换) (04:27)
    • 视频:8-7 Spark Streaming调优之Kafka限速 (07:30)
    • 视频:8-8 Spark Streaming对接Kafka能真正做到仅消费一次吗 (03:29)
    • 视频:8-9 调优之序列化 (05:05)
    • 视频:8-10 调优之广播变量 (07:36)
    • 作业:8-11 【讨论题】数据倾斜的思考
  • 第9章 (讨论群内直播内容分享)基于Spark定制ETL框架6 节 | 46分钟
  • 了解Pipeline的处理方法,基于Spark外部数据源定制Spark ETL框架的思路及使用
  • 收起列表
    • 视频:9-1 Data Pipeline_x264 (06:19)
    • 视频:9-2 ETL中可能会遇到的问题_x264 (05:38)
    • 视频:9-3 (打标记处,3处听不清楚) Spark SQL DataSource API_x264 (06:40)
    • 视频:9-4 使用Spark SQL处理json数据_x264 (10:26)
    • 视频:9-5 基于Spark ETL框架的设计 (09:19)
    • 视频:9-6 基于Spark ETL框架的使用_x264 (06:45)
  • 第10章 (讨论群内直播内容分享)Spark3新特性6 节 | 47分钟
  • Spark3是一个里程碑版的版本,其中包含很多新的特性,本次直播中主要带大家知晓新特性有哪些,以及讲解动态分区裁剪、外部数据源V2、自适应查询执行等相关知识。
  • 收起列表
    • 视频:10-1 Spark概述 (15:30)
    • 视频:10-2 Spark3.x新特性 (05:13)
    • 视频:10-3 DataSource API V2 (09:51)
    • 视频:10-4 动态分区裁剪 (06:34)
    • 视频:10-5 自适应查询执行 (08:57)
    • 作业:10-6 【讨论题】简历项目问题

〖视频截图〗:

Spark进阶 大数据离线与实时项目实战

Spark进阶 大数据离线与实时项目实战
免责声明: 1、本站信息来自网络,版权争议与本站无关 2、本站所有主题由该帖子作者发表,该帖子作者与本站享有帖子相关版权 3、其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和本站的同意 4、本帖部分内容转载自其它媒体,但并不代表本站赞同其观点和对其真实性负责 5、用户所发布的一切软件的解密分析文章仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。 6、您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容。 7、请支持正版软件、得到更好的正版服务。 8、如有侵权请立即告知本站(邮箱:1099252741@qq.com,备用微信:1099252741),本站将及时予与删除 9、本站所发布的一切破解补丁、注册机和注册信息及软件的解密分析文章和视频仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。本站信息来自网络,版权争议与本站无关。您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容。如果您喜欢该程序,请支持正版软件,购买注册,得到更好的正版服务。如有侵权请邮件与我们联系处理。
(0)
上一篇 2022年6月19日 上午11:18
下一篇 2022年6月19日 上午11:18

小七学习网,助您升职加薪,遇问题可联系:客服微信【1099252741】 备注:来自网站

相关推荐

  • Spring Cloud Alibaba 大型互联网领域多场景最佳实践 | 完结

    透彻讲解核心组件原理+最佳实践,提升微服务在实际复杂场景中的落地能力
    聚焦Spring Cloud Alibaba,深入剖析5大核心组件原理,并结合真实电商微服务架构,讲透框架在多场景下的最佳实践,助力全面提升微服务实战能力,轻松应对微服务领域的各种技术难题。

    2022年6月19日
    192
  • 玩转热门框架 用企业级思维 开发通用够硬的大数据平台 | 完结

    针对每个模块,提供成熟的选型视角与详细讲解,一次学习掌握大数据项目开发通用技术
    从企业需求入手,构建集数据采集、数据存储、数据处理与分析、BI应用、权限管理、系统监控等于一体的大数据应用平台,帮助我们快速掌握大数据平台开发技术,迅速建立大数据技术的宏观的认识。

    2022年6月19日
    192
  • 毕设一课通 从开题到答辩高效完成(含全栈项目) | 完结

    为毕业生打造的全栈课 一站解决毕设问题(选题/毕设/论文/答辩)
    高质量毕设,高效解决你的毕业头等大事。
    专为毕业生打造,助你高效、高质量完成毕设作品,解决毕业头等大事。课程全面梳理毕设流程,并精准定位每个环节的重点难点、完成技巧,扫清毕设难题。采用主流、企业级技术栈,祝你完成毕设,直面校招。

    2022年6月19日
    179
  • 2021最新版 uni-app从入门到进阶 系统完成项目实战 | 完结

    uni-app 开发企业级小程序
    专门为小程序0基础学员而设,让你拥有能上线的作品
    还在为没有项目经验而烦恼吗?本课程从小程序基础语法、上线流程、数据驱动、uni-app开发、多平台适配、到最终项目发布 ,真正做到从0开始,开发一个属于自己的、能够上线的、高质量小程序项目。帮你解决快速积累项目经验、扩展新技能、提升薪资的问题。

    2022年6月19日
    264
  • Kaggle竞赛案例深度剖析,轻松赢得让大厂面试官双眼放光的竞赛经验 | 完结

    Kaggle竞赛经典案例深度剖析
    写了参加过Kaggle,我会看简历。 得过一次top10%,我会给面试。
    Kaggle 是业界高度认可的数据科学竞赛平台,如果你的简历中有丰富的 Kaggle竞赛经验,将大大提升你的就业竞争力和成功率。本课程将深度剖析7大经典案例,带你全面掌握多领域竞赛题目,助力你快速增加项目经验,提升竞赛排名。

    2022年6月19日
    148
  • PHP+Go 开发仿简书,实战高并发高可用微服务架构 | 更新至8章

    PHP程序员唯有掌握更高级的技能和架构设计思维,才能发展的更好。让自己成为不可替代的人员,需要全面提升掌控大中型项目能力、架构设计思维能力、独立完成复杂项目能力。本课程通过复杂大型项目实战,系统讲解各技术实现的底层原理和算法,带你掌握性能调优以及高可用、高并发微服务架构,并上手Go语言框架,进一步提升自己的技术储备,为你求职和涨薪增加筹码!

    2022年11月14日
    158
  • Kotlin+组件化 打造AI语音助手App 解锁交互技能包 | 完结

    Kotlin开发AI语音助手App 先人一步抓紧移动端AI时代发展机会
    物联网/智能硬件/AI 开发入门级智能语音App项目,搞定App开发重难点
    基于百度AI打造一款集WakeUp,TTS,ASR为一体的服务类助手App,学会AI语音开发技术,开发一个“对话小精灵” App。

    2022年6月19日
    286
  • C/C++ 从0到1系统精讲 项目开发综合基础课 | 完结

    C工程师高薪稳定,一将难求,但体系庞杂,学习路线陡峭。鉴于此老师萃取20多年实战干货,精心设计更利于初学者学习和应用并重的课程体系,带你从0到1系统掌握C必备项目实战综合知识,只学工作中用得着的干货,让你学习更顺畅,更高效,大大节省你入门到入行/转行的宝贵时间和精力。

    2023年4月5日
    73
  • 基于Vue3+Vite+TS,二次封装element-plus业务组件 | 完结

    集成大量实际样例,系统掌握前沿技术栈与二次组件库封装能力

    很多前端开发者只会调用element-plus组件库已有组件,在面对需要定制的场景,或者想要简化使用组件的时候,就会无从下手。本课程深度结合前沿技术栈Vue+Vite+TS,全方位讲解二次封装的思想、技巧、组件设计等,并提供了大量封装实例,帮大家掌握组件的二次封装,实现前端进阶!

    2022年6月19日
    274
  • 遇问题可联系 / 客服微信【1099252741】
  • 掌握Taro多端框架 快速上手小程序/H5开发 | 完结

    疯狂生长的小程序生态,“五花八门”的前端开发技术,我们用Taro统统解决
    对前端开发者而言,众多的技术栈中需要逐个学习,逐个开发。Taro的推出适应了潮流及趋势:一套代码运行在多种小程序/H5/React Native上,React式的代码风格便于学习,详实的项目开发过程带你了解Taro开发。

    2022年6月19日
    247