博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
每日一个机器学习算法——正则化
阅读量:6520 次
发布时间:2019-06-24

本文共 372 字,大约阅读时间需要 1 分钟。

在对数据进行拟合,学习模型的过程中,会出现以下情况:

1)high variance, overfitting.过拟合

2)high bias, underfiiting.欠拟合

过拟合出现的原因

1)太多的特征。

2)过少的训练数据。

如何解决?

1)减少特征数

2)模型选择算法(model selection algorithm)

3)正则化:保留特征参数,但尽可能减小其幅值为0。

 

lambuda为正则化参数:看做是一个tradeoff。用于平衡以下两项

1)更好的适应模型

2)将特征的系数尽可能变小

此参数过大,则会出现underfitting. 过小则会出现overfitting.

如何选择正则化参数?后续章节将会论述。

转载于:https://www.cnblogs.com/ShaneZhang/p/3937776.html

你可能感兴趣的文章
LVM卷管理及配额设置
查看>>
怎样检查Linux服务器是否被***
查看>>
七周一次课(5月4日)
查看>>
linux下开源监控软件
查看>>
time函数
查看>>
我的友情链接
查看>>
mysql高可用mha
查看>>
php生成随机密码的几种方法
查看>>
记几处原生JS的开发
查看>>
Linux之父Linus说:并行计算基本上就是浪费大家的时间
查看>>
linux 虚拟机 kvm
查看>>
域名缓存侦测(DNS Cache Snooping)技术
查看>>
您真的会玩KMS吗_01.理论篇
查看>>
mysql生产环境安全规范
查看>>
Ansible自动化部署之Play book的使用
查看>>
我的友情链接
查看>>
linux常用命令--文件与目录
查看>>
outlook添加zimbra邮箱
查看>>
VC调试时输出调试信息到Debug窗口
查看>>
Java8虚拟机内存模型
查看>>