博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
deeplearning.ai - 优化算法 (Optimization Algorithms)
阅读量:4091 次
发布时间:2019-05-25

本文共 1587 字,大约阅读时间需要 5 分钟。

吴恩达 Andrew Ng

Mini-batch 梯度下降法

  • 把巨大的数据集分成一个一个的小部分

  • 5000000 examples, 1000 × 5000, X{

    1}...X{
    5000}
    X { 1 } . . . X { 5000 } , Y{
    1}
    ...Y{
    5000}
    Y { 1 } . . . Y { 5000 }

  • epoch means a single pass through the training set

  • Batch gradient descent’s cost decrease on every iteration

  • Mini-batch gradient descent may not decrease on every iteration. It trends downwards, but it’s going to be a little bit noisier.

  • mini-batch size = m: Batch gradient descent

  • mini-batch size = 1: Stochastic gradient descent (随机梯度下降法)

    不会收敛,最终在最小值处波动

  • 一般 mini-batch 大小为 64、128、256、512

Exponentially weighted averages (指数加权平均)

  • Vt=βVt1+(1β)θt V t = β V t − 1 + ( 1 − β ) θ t

  • Vt V t approximately average over 11β 1 1 − β items

  • 迭代几次公式,展开递推式

  • 初始化 V0=0 V 0 = 0

  • As for computation and memory efficiency, it’s a good choice.

Bias correction in exponentially weighted average

  • during initial phase of estimating, make it more accurate

  • Vt1βt V t 1 − β t

  • oscillations 震荡,波动

Momentum (动量梯度下降法)

  • ball rolling down a bowl

  • 这里写图片描述

  • usually β=0.9 β = 0.9

RMSprop

root mean square prop

这里写图片描述

Adam optimization algorithm

Adaptive Moment Estimation

  • 结合 Momentum 和 RMSprop

  • 适用性广泛

  • Hyperparameters:

    α: α : needs to be tuned, β1:0.9 β 1 : 0.9 , β2:0.999 β 2 : 0.999 , ϵ:108 ϵ : 10 − 8

Learning rate decay

随着迭代的增加,渐渐减小学习率

  • α=11+decayrate×iterationα0 α = 1 1 + d e c a y r a t e × i t e r a t i o n α 0

  • α=0.95epoch_numα0 α = 0.95 e p o c h _ n u m α 0

  • α=kepoch_numα0 α = k e p o c h _ n u m α 0

  • discrete staircase

  • manually controlling alpha (small model)

The problem of local optima

  • saddle point 马鞍点
  • 许多低维空间里的直觉在高维空间中并不适用,高维空间极少出现局部最优点
  • 平稳区域(plateaus)会降低学习效率
你可能感兴趣的文章
使用Spring Data JPA访问关系型数据库
查看>>
Spring Data Jpa: 分页和排序
查看>>
Spring Data Jpa 使用@Query标注自定义查询语句
查看>>
使用Spring Security进行权限验证
查看>>
OAuth2.0认证和授权机制讲解
查看>>
Leetcode 1180. Count Substrings with Only One Distinct Letter [Python]
查看>>
Leetcode 1478. Allocate Mailboxes [Python]
查看>>
Leetcode 507. Perfect Number [Python]
查看>>
Leetcode 1472. Design Browser History [Python]
查看>>
Leetcode 433. Minimum Genetic Mutation [Python]
查看>>
Leetcode 466. Count The Repetitions [Python]
查看>>
Leetcode 502. IPO [Python]
查看>>
Leetcode 1137. N-th Tribonacci Number [Python]
查看>>
Leetcode 1306. Jump Game III [Python]
查看>>
Leetcode 1584. Min Cost to Connect All Points [Python]
查看>>
activemq Lease Database Locker
查看>>
解决activemq主从在mysql失去链接主机down掉的问题
查看>>
fontawesome-webfont.woff ttf等字体加载不了的问题
查看>>
Zabbix JMX监控之ActiveMQ
查看>>
linux shell 相关
查看>>