课程特色

以大数据为主线、选择各技术中最常用、最基础、最重要部分。打通各种技术间的关节,有效整合各种大数据资源,为驾驭大数据打好坚实基础,为找到一份更心仪的工作或就业后更快脱颖而出打好基础。适合大专院校学生及在职人士参加。授课费用600元远低于市场同类课程定价。

  • 学员技术基础
    • 1. 在校大学生,有一定数学基础,对大数据有兴趣的同学
      2. 想转型大数据方向或大数据、数据相关行业的在职人员
  • 培训目标
    • 1. 掌握大数据生态系统相关软件安装、部署及使用方法
      2. 可以胜任IT企业大数据开发工程师岗位
      3. 可以从事大数据分析、挖掘等方面的工作
  • 学员享受的服务
    • 1. 每周两次线上直播,总课时量70次左右
      2. QQ群中随时提问,24小时内得到回复
      3. 每周一次的线上答疑时间,采用语音交流方式
      4. 为每位学员提供在线Hadoop集群环境,用户可使用专属账号随时随地登录操作
      5. 学费可分期付款,开课4周内可全额退款
      6. 飞谷学院给予学员就业后未达预期亦可退款之承诺

    授课内容

    Linux及shell(8课时)
    第1课:linux+shell基础
    第2课:shell编程
    第3课:导航菜单实战(含正则表达式、条件及循环语句等)
    第4课:shell处理文件
    第5课:shell函数
    第6课:shell操作数据库
    第7课:ssh无密码传输
    第8课:linux定时调度实战
    MySQL(8课时)
    第1课:数据库基础
    第2课:维护表
    第3课:查询数据
    第4课:数据处理
    第5课:MySQL函数
    第6课:存储过程
    第7课:模型设计
    第8课:性能优化
    Python基础知识(8课时)
    第1课:Python简介
    第2课:Python基础语法
    第3课:Python的控制语句
    第4课:Python数据结构
    第5课:模块与函数
    第6课:numpy基础
    第7课:pandas入门
    第8课:操作数据库(MySQL+MongoDB)
    大数据获取技术(4课时)
    第1课:Sqoop同步结构化数据
    第2课:PHP爬虫技术
    第3课:Python Scrapy爬虫技术
    第4课:Scrapy爬虫高级应用
    Hadoop系统之hive、hbase、zookeeper(9课时)
    第1课:Hadoop在数据平台中的作用
    第2课:Hadoop文件系统的应用实践
    第3课:Hadoop的计算框架应用实践
    第4课:Hadoop的部署运维实践
    第5课:Hive原理及应用场景
    第6课:Hive的安装配置及核心参数说明
    第7课:Zookeeper的原理安装及应用
    第8课:Hbase的原理及应用场景
    第9课:Hbase的安装配置及核心参数说明
    Java大数据开发(8课时)
    第1课: JDK概述、开发环境介绍及基本语法
    第2课: 开发大数据程序所要掌握的Java知识点
    第3课: 把Java程序部署在大数据环境上
    第4课: Hadoop wordCount程序开发、部署及运行
    第5课: 我也来做一个网易云盘
    第6课: 利用MapReduce找出外汇报价的最高值
    第7课: “开房数据”中有我吗?
    第8课: HBase JavaAPI初探
    Cloudera Hadoop(4课时)
    第1课:CDH5.4.8集群安装部署之一
    第2课:CDH5.4.8集群安装部署之二
    第3课:CDH5.4.8集群功能简介
    第4课:CM5.4.8集群监控与维护
    大数据处理技术--MySQL+Pandas+Hive+SparkSQL(8课时)
    第1课:修改数据(表及文件)
    第2课:数据关联(多表及多文件)
    第3课:数据聚合(表及文件)
    第4课:数据查询(Hive+SparkSQL)
    第5课:数据可视化(python+pyspark)
    第6课:地理位置数据可视化
    第7课:Spark内核RDD的常用转换和动作(scala+python)
    第8课:Spark编程(scala+python)
    PySpark+Spark机器学习(6课时)
    第1课:Spark MLlib架构简介
    第2课:Spark MLlib主要数据类型
    第3课:Spark MLlib推荐模型实例
    第4课:Spark MLlib随机森林模型实例
    第5课:Spark MLlib回归模型实例
    第6课:Spark MLlib聚类模型实例
    OpenStack及Docker(4课时)
    第1课:OpenStack原理
    第2课:Openstack应用实例
    第3课:Docker原理
    第4课:Docker应用实例

    实操环境

    学员在5个月学习期间可以免费使用飞谷云提供的在线大数据环境,只要能上网,便可以随时登录环境进行代码调试,突破了本地搭建大数据环境的技术屏障。老师的教学演示及学员每次作业提交均基于本套环境。以下是后端集群环境服务器示意图,读者可以使用student用户直接登录到slave01节点上。

    讲师团队

    吴茂贵

    吴茂贵
    运筹学与控制论专业研究生学历。毕业后主要参与数据仓库、商务智能等方面的项目,期间做过数据处理、数据分析、数据挖掘等工作,行业涉及金融、物流、制造业等。近期主要做复杂数据存储、清理、转换等工作,同时在大数据方面也很有兴趣并投入大量时间和精力,且将持续为之。

    张粤磊

    张粤磊
    DBA、大数据架构师,十余年一线数据处理数据分析实战经验。先后在咨询、金融、互联网行业担任数据平台技术负责人或架构师。主要关注大数据基础平台、大数据模型构建和大数据分析。

    刘未昕

    刘未昕
    从事IT研发和项目管理工作十余年以上。使用多种程序设计语言,目前研究方向主要是大数据生态系统,从事金融、数据仓库等领域研发。五年以上IT行业授课、培训经验,并在多所高校担任外聘讲师。

    张魁

    张魁
    虚拟化工程师,Openstack架构师,苏州某高校云平台架构师,十余年Linux系统运维实践及虚拟化开发经验,4年Linux系统补丁开发经验。先后在美企担任虚拟化应用运维、服务器集群开发运维工程师或系统开发架构师,高校信息中心云平台架构师,主要关注Openstack、Docker及分布式存储等。

    我要报名

    您可以在此填写报名表格,提交后我们会和您取得联系。由于大数据培训对学员技术起点要求较高,为保证教学实效,我们会对学员报名资格进行筛选。如有疑问,可以报名咨询