1186蒋同学,首先开放sklearn课程和spark课程,还有文本推荐系统内容。该同学课程设置较多后期可以优化配置。
【1186】【蒋同学】
【基本情况】:#数据仓库工程师六年经验,目前公司内部转算法,做推荐系统,主要从python,数据分析,大数据分析,机器学习入手学习。有高数线代概率基础,语言学习过java及python,需要写csdn博客。方向为#大数据挖掘。
【学习目标】:机器学习和深度学习零基础提升,数据挖掘基础提高。特别是机器学习和深度学习能力的提升。在现在学术使用中需要该模块技术。目前首先解决电力预测问题。
【备注】:课程时长一年,有数学基础,打好深度学习基础
【学员分类】:大数据挖掘方向【零】基础提高
【是否需要就业】:是
【目标就业地点】可能五年后在国内
【监督方式】: 在课程安排中,阶段后面可看该阶段的监督方式。如想要对阶段中的某一个章节进行修改监督方式,请在章节后面写明监督方式。
【个人情况】1.学员情况:无python编程基础,需要从基础强化,缺乏系统性,机器学习方面需要系统。学员后期用得到项目中。
2.具体目标:能够通过学习提高自己的编程和机器学习处理问题能力,补充数学方面的不足,增加大数据分析的部分,掌握常见的数据科学处理思路。
3.时间:因为目前有编程基础,尽可能有足够时间学习不足之处,学习一天视频学习不超过3个小时,其余时间写代码总结。如果以后上课建议一周至少学习2到4天,只要学习就提交博客和阶段xmind,建议数学弱监督学习。其他为强监督。
【学员课程安排】:有任何疑问,在群里随时艾特或者ding教务老师和电话测评的老师!尽快解决,达到当前阶段没有疑问为止。
【第一阶段】:数学基础课程:(弱监督)
「第一章」:线性代数
「第二章」:高等数学
「第三章」:概率论
「第四章」:统计学
「备注」:提供文档和视频,如果文档看不懂,可以看视频。该阶段是整体的数学,非常细致,不建议全看,可以从python开始,以文档为主,在学习到机器学习算法用到数学的话,对于丝毫不理解的数学知识,可以在该视频中进行复习一下!(不懂的联系教务老师)
【第二阶段】:语言基础(弱监督)
「第1章」:python基础
说明:包括#python基础语法,
「第2章」:python数据结构(就业必备)
说明:堆、栈、列表、数组、排序算法、查找算法、力扣的使用!该阶段为就业必备阶段,学完之后每天需要提交力扣练习题,为之后就业增加竞争力!提交方式截图或者是写思路总结到当天的CSDN都可以!
「第3章」:数据科学库基础
说明:numpy库,pandas库,matplotlib库,API的调用学习,掌握了解一下,因API较多,不会的可以查阅文档!
「第4章」:mysql、linux基础(弱监督)
说明:基础操作,必备技能,但是该阶段不学习不影响进入到算法阶段,可以联系教务老师确实是否需要学习!
------------算法基础与编程基础阶段分割线-------------
【第三阶段】:机器学习阶段(重点课程,强监督)
「第1章」: 数学基础加强
说明:该阶段为机器学习阶段中必备数学知识!
「第2章」:机器学习基础
说明:该课程偏向于实操,比较简单,可以先简单入门
「第3章」:机器学习进阶
说明:分类算法,聚类算法,回归算法,HMM等模型的推导与实现!
「第4章」:sklearn机器学习实战(弱监督)
说明:特征工程,建模代码实操代码
【第四阶段】:深度学习阶段(重点课程,强|弱监督)
「第1章」:深度学习基础
说明:深度学习的基础算法
「第2章」:tensorflow深度学习技术实战
说明:tf深度学习实战
--------------算法基础与算法项目分割线---------------
【重点说明】:该阶段需要跟老师再次进行沟通,重新确认项目阶段的需求。对于不了解的方向问题,提出来进行讨论,然后根据老师提出来的建议和见解,进行新的项目制定和配置!
该阶段所有课程均为强类型监督,看完其中的一个项目,然后进行项目文档的总结,以及自述。将这些落地到word中,然后提交到群里,老师查看,方可进行下一个项目的学习!
【第五阶段】:项目阶段:(强监督)
python数据挖掘分析课程:
「第1章」: kaggle数据分析课程1
包括:电商ctr预估2959
「第2章」: kaggle数据分析课程1
包括:kaggle音乐推荐2954
「第3章」: kaggle实战
包括:kaggle反欺诈3045
「第4章」: kaggle数据分析课程
包括:kaggle经济金融相关问题3044
「第5章」:指导学员下一步学习方向。
补充大数据#
【第五阶段】:大数据阶段#精简大数据
「第1章」 java基础
包括:基础命令
「第2章」 hadoop基础
包括:大数据基础
「第3章」数据采集处理基础
包括:大数据基础flume基础
「第4章」 hive基础实战
包括:实战离线处理技术
「第5章」 spark实战课程(弱监督)
包括:实战大数据分析
「第6章」大数据数仓项目
包括大数据数仓项目构建指标体系
推荐系统#
「第1章」机器学习增强与大数据电商推荐
包括:电商spark推荐系统
「第2章」大数据文章推荐前置课程
包括:spark基础,pyspark
「第3章」大数据文章推荐系统实战(弱监督)
包括:电商推荐召回排序算法
「第5章」 kaggle数据挖掘实战(4个相关项目加强数据挖掘处理能力)
包括:选择好的一部分kaggle案例
【辅助阶段】
写出来初版的简历,然后老师进行建议,再次修改简历。简历合格,进行模拟面试。沟通面试问题等,具体事宜,到该阶段之后联系相应的教务老师进行安排。
【时间安排】:
学员可以自主安排学习时间。具体的时间可以灵活调整。
【相关规定】:
(1)每天完成今日学习任务,提交相应的csdn或者是有道云笔记之类的链接到每日作业中。老师会进行审核,每个阶段结束,进行阶段测评,测评通过,提交老师发布的通过截图到下一个课程的第一节的阶段卡点之后,方可进行下一章内容的学习。
(2)每个章节结束,如果觉得吸收比较乱,知识点多,可以进行xmind脑图的构造一下整体的思路!
(3)项目阶段,需要录制或者文档落地针对做过的项目的自述!
(4)每天必须按计划完成任务,临时有事需在日报中说明情况即可,长期请假请联系教务老师。
(5)考核不通过需要缴费补考,50元是第一次,每次增加50元,200元封顶(此项如有疑问,可以联系教务老师进行更改)。
【参考博客】:第二天早晨八点半,会有拜师晨报提醒。当中有学生优秀博客,可以查看学生的排版
【监督相关说明】:
弱监督:不需要每天提交作业,直接可以解锁课程,适合于自制力能力强的。
强监督:需要学习完一个课程通过管理员解锁才能继续学习下一个阶段,适合于自制力不够强,已经参加工作的学员。
【工作安排】:
(1)、批改作业,环境安装!还有学习过程中有不会的问题的话,艾特软件安装以及基础答疑老师!
(2)、学习过程中如果有什么问题和疑问,可以艾特答疑老师!
(3)、如果计划需要更改,可以群里艾特我和跟你电话测评沟通的老师进行沟通!
(4)、如果有什么方向上面的疑问,可以艾特相关的答疑老师和计划制定的老师!
(5)、如果不知道找哪位老师的话,或者问题比较紧急的可以艾特教务老师进行处理,或者有什么意见和建议(直接私聊教务老师)!教务老师会进行受理