舒娜:
学员情况:目前在找工作,一个offer在手,工作内容主要是用Excel和SQL。从7月开始自学Python,完成了udacity进阶分析的课程,
1.教学目标:数据分析与机器学习有基础加强。提升目标。
2.方向:大数据数据分析与数据挖掘方向。
3.加强py与hivd部分,设置hive项目。帮助学员在公司掌握更多的数据分析工具。
课程安排:
除了数学其他均为强监督
第零阶段:数学课程(弱监督方式)
包括:线性代数,概率论,高等数学,统计学(强化)
第一阶段:python基础
包括:python语法,面向对象部分
第二阶段:hadoop基础
包括:大数据基础
补充阶段:hive基础与项目实践
hive数仓项目实战,hive基础
第三阶段:数据科学库基础
包括:numpy,pandas,matplotlib
第四阶段:机器学习数学基础加强。
包括:高数,概率,线代加强
第五阶段: 机器学习基础
包括:机器学习算法理论基础
第六阶段:机器学习进阶
包括:分类算法,聚类算法,回归算法,HMM
第七阶段:sklearn机器学习实战
包括:特征工程,建模代码实战
第八阶段:数据挖掘项目前置基础知识
包括:项目前置知识
第九阶段: 数据挖掘项目项目实践1个月
包括:项目实战
第十阶段:kaggle实战
包括:选择好的一部分kaggle案例
第十一阶段:指导学员下一步学习方向。
教学目标:算法基础基础拓展。
时间安排:
每周一到周五每天学习至少2小时,时间沟通过可以安排。自己独立自主安排时间
每周日5小时,周日考核。
每天提交xmind复习笔记和博客笔记。同时每周三日,整理知识点,整理笔记到博客,可以选择博客园博客。将重点知识点录屏自己讲出来(学习方式中吸收最好的方式是给别人讲出来),并提交作业。
相关规定:每天必须按计划完成任务,否则将停发学习任务,临时有事需请假。考核不通过需要缴费补考。