Imputer, 已更新很久了
课程是旧版本, 我为新版本稍作说明
Imputer, 已更新很久了
课程是旧版本, 我为新版本稍作说明
as a reminder for classmates, currently we use 'sklearn' rather than 'scikit-learn' in coding ;)
機器學習推薦書:
1. 機器學習 (西瓜書)
2. Python數據分析與挖掘實戰
3. 機器學習系統設計
4. 面向機器智能TensorFlow實戰
5. TensorFlow技術解析與實戰
少用加号
数据组织方式
一组数据如何保存 数据结构
抽象数据类型:确定数据组织形式,数据上的一组操作,只有相应的接口。
不会进行函数调用的步骤才叫做基本步骤。
算法时间复杂度:描述算法时间的多少
如何修改
机器学习简介
机器学习、深度学习可以做什么?
(自然语言处理、图象识别、传统预测)
机器学习库和框架
scikit learn、TensorFlow
课程定位:
以算法、案例为驱动的学习,浅显易懂的数学知识
注意:参考书比较晦涩难懂,不建议直接读
课程目标:
熟悉机器学习各类算法的原理
掌握算法的使用,能够结合场景解决实际问题
掌握使用机器学习算法库和框架
机器学习课程
特征工程;模型、策略、优化,分类、回归和聚类,TensorFlow,神经网络,图象识别,自然语言处理
步长定义
good 重点内容
秩 铺垫
要点总结
上确界:M=supE
下确界:M=infE
向量组的秩
所有等价线性无关组含有的向量个数相等
建立一个基类:
强化学习和生成式对抗网络
强化学习:机器学习分支;自行解决决策问题,并且能够强化连续决策;
组成部分:
1、代理;
2、环境;
3、行动;
4、奖励;
学习任务:
1、篇幅型;
有间断
2、永久型;
没有间断
学习方式:
value baed
写出一个value function,这个value function可以告诉我们每一步的未来rewards会有多大;
policy based
在这里我们希望最优化一个policy function而不是一个value funtion;
有两种policy可以选择:
Deterministic:相同state下,永远给出相同的action。简单来讲就是每次在同样的情况下作出一样的选择;
Stochastic:给出一个所有action的可能性的distribution,意思是选择具有随机性,在某些对抗性游戏中,随机决策是必须的;
GAN
生成模型;判别模型;
分类:
1、根据当前数据得到一个数据分布:数据回归;
2、根据当前的数据生成一个新的图片;
用途:
1、补缺数据;
2、数据是否符合生成的规律;
3、
最大似然机构:
生成对抗模型:
要求:必须是可导的:
DCGAN:反卷积,
由低维到达高维的;
风格转移:
循环机构,
使用空洞卷积代替空间金字塔
一、计算机视觉四种基本任务:
1、图像分类;
2、图像定位;
3、物体检测;
4、物体分割;
背后的机器学习任务:数据分类、数据回归;
实际上大部分任务都是两个:
数据分类:数据离散;
数据回归:数据是连续的;
二、经典方法:
Deformable parts model:
什么是NMS:一种post-processing方式;应用在所有目标检测里,用来删除多余的检测结果;
做法:把所有的检测结果按照分值从高到低排序,保留最高分数的box,那么保留和他距离上最近的box;
hard mining:在一个1mini-batch里,能让classifier混淆的sample,标记为hard example,用到下一轮的训练中;
深度学习的快速回顾:
n一般为2、4,一般2就已经非常大了;
λ为正则化参数,防止过拟合;
深度学习三要素:
1、首先关注模型:用什么结构;
2、在什么数据集上做?实验效果如何;
3、算法:
a、训练过程:loss,sampling,梯度;
b、测试过程:muitl-scale,NMS;
3、系列工作
RCNN\Fast-RCNN\Faster-RCNN详细介绍;
目标分类的主要步骤:
1、先产生一些可能含有物体的目标框;
2、在给定的目标框里进行分类;
如何产目标框:
自下而上的一种生成方法:基于SLIC
算法,仙剑个图像分割成很多小的区域,根据小区域之间的相似程度进行融合,最后结合各个尺度上的结果,产生很多region proposals;
也可以通过深度学习来生成目标框;(主要用于faster ——RCNN中的目标框);
Rcnn家族
1、产生一个框: