2556-胡同学-算法方向-计算机视觉-就业：否 - 拜师教育 - 师徒制教育平台|人工智能培训|大数据培训|JAVA培训|PYTHON培训| - Powered By EduSoho

2556-胡同学-算法方向-计算机视觉-就业：否

2556-胡同学-算法方向-计算机视觉-就业：否 2556-胡同学-算法方向-计算机视觉-就业：否扫二维码继续学习二维码时效为半小时

(0评价)

价格：免费

班级有效天数：366天

学员(1)
课程(17)
分享

承诺服务

练
试
问
疑
动
业

排序：最新笔记
- 最新笔记
- 点赞最多

Why CNN for image

Filter: 3×3

stride 步长

Feature Map

几个 Filter 几个 image

Max Pooling

Deep dream: Exaggerate

Deep style:

3054_李暾吾 · 2022-07-26 · cv-解锁式学习 0

Fat + Short vs. Thin +Tall

Deep ==> Modularization

Why Deep? Training Data 不够

GMM

Univerality Therorem

Analogy

End-to-end Learning

3054_李暾吾 · 2022-07-25 · cv-解锁式学习 0

ReLU:

Leaky ReLU
Parametric ReLU

Maxout:

ReLU is a special case of Maxout.

Learnable activation function

RMSProp:

Momentum:

RMSProp + Momentum ==> Adam

Regularization:

Dropout

3054_李暾吾 · 2022-07-25 · cv-解锁式学习 0

Backpropagation

to compute gradients efficiently

Chain Rule:

dz/dx = dz/dy × dy/dx

Forward pass
Backward pass

3054_李暾吾 · 2022-07-25 · cv-解锁式学习 0

Fully Connected Feedforward Network

Output Layer = Multi-class Classifier

Example

3054_李暾吾 · 2022-07-24 · cv-解锁式学习 0

Step 1: Function Set

Step 2: Goodness of a Function

Cross Entropy

Step 3: Find the best Function(Gradient Descent)

no squarre error

Discriminative 有时优于 Generative（几率模型：Naive Bayes）

Multi-class Classification

Softmax ==> 0<y<1

Limitation of Logistic Regression

3054_李暾吾 · 2022-07-24 · cv-解锁式学习 0

Classificaiton as Regression

Generative Model:

P(x) =

Gaussian Distribution

Find Maximum Likelihood (mean*, covariance*)

All dimensions are independent ==> Naive Bayes Classifier

σ(z)=1/ (1+exp(-z))

3054_李暾吾 · 2022-07-24 · cv-解锁式学习 0

On-line vs Off-line:

Momentum

Adagrad

RMSProp

Adam

Real Application

3054_李暾吾 · 2022-07-23 · cv-解锁式学习 0

Adagrad

root mean square

g（gradient）: 偏微分

best step: |First derivative| / Second derivative

Stochastic Gradient Descent

Feature Scaling

Taylor Series

3054_李暾吾 · 2022-07-22 · cv-解锁式学习 0

error 来源：bias 和 variance

mean: μ

variance: σ^2

s^2 是 σ^2的估测值

E[f*] = f^-: f* 的期望值

简单的模型 Variance 较小，简单的模型受数据波动影响小

复杂模型的 Bias 更小

Regularization ==> 使曲线变平滑6

Cross Validation

3054_李暾吾 · 2022-07-22 · cv-解锁式学习 0

x_i: features

input: x^n

output: y^^n

function: f_n

Loss function L（function 的 function）:

Input: a function
Output: how bad it is
L(f) = L(w, b)

Step3: Best Function

f* = arg min L(f)

w*, b* = arg min L(w, b)

Gradient Descent:

initial value w^0
dL/dw|w=w^0
若 negative，增加 w
若 positive，减小 w
η（learning rate）: 参数更新的幅度 -η(dL/dw|w=w^0)
Local optimal: 局部最优
global optimal: 全局最优
两个参数 w, b: 分别对 w, b 求偏微分
▽L: gradient 梯度

convex 凸面的 adj.

引入更复杂的函数：

x_cp^2

Overfitting

Back to Step 1: Redesign

x_s = species of x
不同物种，不同 w, b
δ(x_s = )
= 1, if x_s = Pidgey
= 0, otherwise

Back to Step 2: Rularization（调整）

不考虑 b

select λ

3054_李暾吾 · 2022-07-22 · cv-解锁式学习 0

几何概率：与构成事件的长、面积、体积成比例；

几何概率特点：基本事件的无限性（抽象）、等可能性；

古典概型特点：基本事件的有限性（具象）、等可能性；

3173_Y_陈秋宇 · 2022-07-19 · 自由式学习 0

3173_Y_陈秋宇 · 2022-07-19 · 自由式学习 0

最大熵模型：

2441_Y_迷宫 · 2022-04-10 · 自由式学习 0

2834_Y_杨勋宇 · 2022-03-28 · 自由式学习 0

步长定义

zhang4718 · 2022-01-29 · 自由式学习 0

good 重点内容

zhang4718 · 2022-01-29 · 自由式学习 0

秩铺垫

zhang4718 · 2022-01-29 · 自由式学习 0

要点总结

zhang4718 · 2022-01-29 · 自由式学习 0

上确界：M=supE

下确界：M=infE

2518N李圈圈小朋友 · 2022-01-05 · 自由式学习 0