您当前的位置:首页 >> 花卉
报名 | 全国高校大数据技术与实训课程高级研修班
发布时间:2019-08-01
 


大数据产业的迅速发展与行业广泛应用的需要,催生了对大数据专业人才需求的巨大缺口。


为满足国家对大数据人才培养的需要、提高人才培养质量,师资是关键,而组织教师培训是提高师资水平的最佳途径之一。通过培训,可以使教师了解大数据行业发展的最新动态,掌握和学习大数据思维与技能、实操应用相结合的课程体系,提升高校教师特别是中青年教师的业务水平和教学能力,从而进一步促进大数据专业或课程的教学发展。同时,培训可以为教师提供了一个沟通信息的平台,交流课程建设和教学改革的经验,交流产、学、研合作的可能,等等。


特邀请各高校相关院系选派教学主管领导、课程负责人和骨干教师参加本次研修班。


课程目标


  • 大数据专业的知识结构与课程体系,以及《大数据计算技术》这门课的作用和目标、和在整个体系中的地位。

  • 学习掌握《大数据计算技术》这门课的主要知识点和技术内容,使参加培训的教师具备开设课程的知识和技能储备。

  • 提供全套课件资源(课程大纲、教材、教案、授课PPT)、企业级课程实验平台(在线平台、开发工具配置、实验指导书等)、微课系统(新模式教学),并提供全套教学资源支持,使得参加培训的教师可以具备开设一门有新意、有深度、有特色的大数据专业核心课程。


课程内容及时间安排


第一天  2019118日(周五)

8:30-9:00

开幕式

9:00-10:00

特邀报告

报告人:蒋宗礼(教育部高等学校计算机类专业教学指导委员会副主任,教授,博士生导师,国家级教学名师)

09:00-12:00

1. 大数据计算体系

-大数据专业课程体系

- 计算模型:批处理/交互式计算/流计算/内存计算

- 计算平台: 商业产品 vs. 开源技术

2.HDFS分布式文件系统

-Master/Slave系统架构

- 存储逻辑结构vs存储物理结构

- 数据容错与恢复

3.HBase分布式存储架构

- 存储架构:Hadoop/HDFS/HBase

- 存储模型:Table/Region/Store/HFile

- 数据读写流程

4.二次索引表机制

- 主列到RowKey的逆向映射关系

- 索引实现技术

- 设计案例

14:30-17:00

1. 分布式并行计算体系

-Flynn并行计算模型

- 集群计算架构

2. MapReduce计算原理

- 分治法(divide-and-conquer)模型

- MapReduce计算架构

- 数据分片:split  vs. block

3. 软件实现

-计算流程:map/shuffle/reduce

- 中间数据文件

-MapReduce算例

19:00-21:00

1. 实训平台使用培训

2. 实训练习- Hadoop单机安装配置

3. 实训练习- 基于MapReduce实现的词频统计实例练习

第二天  2019119日(周六)

9:00-12:00

1. 数据采集、清洗与建模

- 数据采集、清洗与预处理方法

- 概念模型/逻辑模型/物理模型

2. 数据分析算法

- C4.5算法

- K-均值算法

- PageRank算法

3. 数据处理分析技术

- 合并与转换

- 数据分析工具



14:30-17:00

1. 流计算模型

-两种流计算模式:native stream vs. micro-batch  stream

-流计算架构:逻辑架构与软件架构

- Storm工作机制:topology/tuple/spout/bolt/acker

2. 图并行计算框架

-图计算问题:网络图/图数据结构/图分割

-BSP模型:逻辑架构与软件架构

- Pregel计算架构



第三天  2019120日(周日)

 

 

 

9:00-12:00

1. 内存计算模型

- 分布式缓存系统

- 内存数据库

2. 内存计算关键技术

- 数据压缩存储

- 列存储结构

- 数据表分区

- 内存管理方法

3. Spark内存计算架构

- Spark集群系统

- RDD数据模型与操作

- 依赖(Dependency)  与血缘(Lineage)

- 作业调度模型与算法

14:30-17:00

1. 实训练习- Pandas数据分析工具练习

2. 实训练习- Spark安装和配置练习

课外练习(培训现场不要求):

练习1HDFS分布式文件系统基本操作

练习2HBase安装和配置练习

练习3MapreduceSpark的计算性能对比案例练习

会议结束


特邀专家及授课教师


蒋宗礼  

新一届教育部高等学校计算机类专业教学指导委员会副主任。教授,博士生导师,国家级教学名师,CCF杰出教育奖获得者,享受政府特殊津贴,国家精品课、首批国家精品资源课、国家级教学团队负责人, 主编国家十一五、十二五规划教材,《形式语言与自动机理论(第2版)》为国家2008年度普通高等教育精品教材。获国家教学成果奖2项,省部级教学、科研奖励十多项。曾获中国高校优秀青年学者、宝钢优秀教师、航天部优秀青年教师等荣誉称号。主要学术兼职有中国工程教育认证协会学术委员会委员、结论审议委员会委员、计算机类专业认证委员会委员和认证专家,教育部高等学校计算机类专业教学指导委员会副主任,历任全国高校计算机教育研究会理事长、副理事长,中国计算机学会教育专委、教育工委主任、副主任,还是北京市高教学会计算机教育研究会副理事长、计算机类国家级教学团队协作组发起人、国家精品开放课程建设专家组成员。


汤羽

美国The George Washington University(乔治•华盛顿大学)计算机科学系博士研究生,计算机科学博士。现任电子科技大学信息与软件工程学院教授、副院长,现代服务科学计算团队负责人, 2015年受聘担任校学术委员会委员,软件工程专业(本科)首席教授,学院教学指导委员会主任。


科研情况 :

担任International Journal of Computer and Management Systems杂志编辑及多个国际学术会议的会议主席和程序委员会成员,中国卫生信息学会电子健康档案与区域卫生信息化专业委员会委员,2010-2012教育部留学回国科研启动基金评审专家, 2013年中国博士后科研基金评审专家,2014-2017教育部学位与研究生教育质量评估专家。


长期从事大数据计算关键技术、云计算架构与算法,移动互联应用等方面的研究。具有多年美国国防研发部门从事C4I软件和大型数据系统研究工作的经历,参加过多项美国海军,NASA 、NOAA的研究项目。承担国家级研究项目2项(863重大专项子课题1项,教育部留学科研启动基金1项),横向课题6项,在IEEE Trans. Wireless Communications等高水平SCI,EI杂志及国际会议上发表论文超过30篇,软件著作权2项。

肖扬

清数教育联合创始人&CTO,北京邮电大学硕士。曾任某500强企业技术高管,有近20年系统架构设计经验。作为首席架构师管理和设计过国内大型运营商云计算平台系统和大数据平台系统。同时为行业培养大数据和人工智能核心岗位人才近千名,曾参与过运营商、政府、金融等多个行业大数据人才培养,对数据科学与大数据方向的企业岗位技能、人才培养模式和实训平台设计有深入独到的研究。

培训证书


对经学校有关部门推荐参加培训的教师,考评合格后由全国高等学校计算机教育研究会颁发“全国高校大数据技术与实训课程高级研修班”结业证书,对参加培训获得证书的教师,所在学校应承认其接受培训的经历,计入继续教育学时。


研修班时间及地点


报名方式:点击阅读原文”进行报名

会议时间:2019年1月17日—1月20日

会 务 费:2680元/人,住宿宾馆由会务组统一安排,交通、食宿费用自理

会议及住宿地点:闽南大酒店,400元·间/天,地址:厦门市思明区湖滨南路一里26-34号,电话:0592—5181188

联 系 人:贾斌   魏江江  

电    话:18601290130   13601331987

邮    箱:jiabin01011@163.com   itbook8@163.com   


请各单位积极组织和推荐相关课程骨干教师参加会议。参加培训的教师请与2019年1月10日前将回执发给组委会联系人。

【今日机器学习概念】

Have a Great Definition

相关阅读