当前位置: 首页 > news >正文

上海市网站建设_网站建设公司_自助建站_seo优化

文山知名网站建设公司,华为手机官方网站登录,免费建设小学校网站,平面设计培训班学费一般多少百度贴吧1.最小二乘的背景 这种东东的来源#xff0c;比较容易找到而且比较靠谱的途径自然是wiki百科了#xff0c;以下部分的内容来自wiki百科#xff1a; 1801年#xff0c;意大利天文学家朱赛普皮亚齐发现了第一颗小行星谷神星。经过40天的跟踪观测后#xff0c;由于谷神星运…1.最小二乘的背景 这种东东的来源比较容易找到而且比较靠谱的途径自然是wiki百科了以下部分的内容来自wiki百科  1801年意大利天文学家朱赛普·皮亚齐发现了第一颗小行星谷神星。经过40天的跟踪观测后由于谷神星运行至太阳背后使得皮亚齐失去了谷神星的位置。随后全世界的科学家利用皮亚齐的观测数据开始寻找谷神星但是根据大多数人计算的结果来寻找谷神星都没有结果。时年24岁的高斯也计算了谷神星的轨道。奥地利天文学家海因里希·奥伯斯根据高斯计算出来的轨道重新发现了谷神星。  高斯使用的最小二乘法的方法发表于1809年他的著作《天体运动论》中而法国科学家勒让德于1806年独立发现“最小二乘法”但因不为世人所知而默默无闻。两人曾为谁最早创立最小二乘法原理发生争执。1829年高斯提供了最小二乘法的优化效果强于其他方法的证明见高斯-马尔可夫定理。 2.举个最简单的例子理解最小二乘 现在大家都越来越重视自己的身体健康。现代人最常见的亚健康问题就是肥胖本博主身体棒棒哒唯一困扰本博主的健康问题就是超重。好吧承认自己是个死胖子就完了  假设身高是变量X体重是变量Y我们都知道身高与体重有比较直接的关系。生活经验告诉我们一般身高比较高的人体重也会比较大。但是这只是我们直观的感受只是很粗略的定性的分析。在数学世界里我们大部分时候需要进行严格的定量计算能不能根据一个人的身高通过一个式子就能计算出他或者她的标准体重  接下来我们肯定会找一堆人进行采用请允许我把各位当成一个样本。采样的数据自然就是各位的身高与体重。为了方便计算与说明请允许我只对男生采样经过采样以后我们肯定会得到一堆数据(x1,y1),(x2,y2),⋯,(xn,yn)其中x是身高y是体重。  得到这堆数据以后接下来肯定是要处理这堆数据了。生活常识告诉我们身高与体重是一个近似的线性关系用最简单的数学语言来描述就是yβ0β1x。于是接下来的任务就变成了怎么根据我们现在得到的采样数据求出这个β0与β1呢这个时候就轮到最小二乘法发飙显示威力了。 3.最小二乘的cost function 在讲最小二乘的详情之前首先明确两点1.我们假设在测量系统中不存在有系统误差只存在有纯偶然误差。比如体重计或者身高计本身有问题测量出来的数据都偏大或者都偏小这种误差是绝对不存在的。或者说这不能叫误差这叫错误2.误差是符合正态分布的因此最后误差的均值为0这一点很重要)  明确了上面两点以后重点来了为了计算β0,β1的值我们采取如下规则 β0,β1应该使计算出来的函数曲线与观察值的差的平方和最小。用数学公式描述就是  其中yie表示根据yβ0β1x估算出来的值yi是观察得到的真实值。 可能有很多同学就会不服了凭什么要用差的平方和最小勒用差的绝对值不行么不要骗我们好不好  本博主不敢骗大家为了让大家相信特意找了一种本博主认为比较靠谱的解释  我们假设直线对于坐标 Xi 给出的预测 f(Xi) 是最靠谱的预测所有纵坐标偏离 f(Xi) 的那些数据点都含有噪音是噪音使得它们偏离了完美的一条直线一个合理的假设就是偏离路线越远的概率越小具体小多少可以用一个正态分布曲线来模拟这个分布曲线以直线对 Xi 给出的预测 f(Xi) 为中心实际纵坐标为 Yi 的点 (Xi, Yi) 发生的概率就正比于 EXP[-(ΔYi)^2]。EXP(..) 代表以常数 e 为底的多少次方。  所以我们在前面的两点里提到假设误差的分布要为一个正态分布原因就在这里了。  另外说一点我自己的理解从数学处理的角度来说绝对值的数学处理过程比平方和的处理要复杂很多。搞过机器学习的同学都知道L1正则就是绝对值的方式而L2正则是平方和的形式。L1能产生稀疏的特征这对大规模的机器学习灰常灰常重要。但是L1的求解过程实在是太过蛋疼。所以即使L1能产生稀疏特征不到万不得已我们也还是宁可用L2正则因为L2正则计算起来方便得多。。。 4.最小二乘法的求解 明确了前面的cost function以后后面的优化求解过程反倒变得so easy了。  样本的回归模型很容易得出  现在需要确定β0、β1使cost function最小。学过高数的同志们都清楚求导就OK。对于这种形式的函数求导 将这两个方程稍微整理一下使用克莱姆法则很容易求解得出 因为求和符号比较多省略了上标与下标。  根据这个公式就可以求解出相应的参数。  对应上面的身高体重关系的例子我们只需要将采样得到的数据一一代入即可求解。 5.矩阵表达形式 如果我们推广到更一般的情况假如有更多的模型变量x1,x2,⋯,xm注意x1是指 一个样本x1是指样本里的一个模型相关的变量)可以用线性函数表示如下  对于n个样本来说可以用如下线性方程组表示 如果将样本矩阵记为矩阵A,将参数矩阵记为向量β真实值记为向量Y上述线性方程组可以表示为 即AβY 对于最小二乘来说最终的矩阵表达形式可以表示为 最后的最优解为 6.注意事项 经典的最小二乘法使用起来够简单粗暴计算过程也不复杂。但是一个致命的问题就是其对噪声的容忍度很低。试想一下如果前面我们得到的总采样数据为100个但是里面有几个大胖子这几个大胖子就相当于不是普通人的身高-体重系数他们就是噪声了。如果不采取一些手段对这几个噪声样本进行处理最后计算出来的身高-体重系数肯定会比正常值要偏大。  对于噪声的处理比如有加权最小二乘等方法后续有时间跟大家再讲讲。
http://www.ihoyoo.com/news/138960.html

相关文章:

  • 求个网站2020急急急开源门户系统
  • 网站开发知识视频教程长沙市建设网站平台的公司
  • 公司网站建设模块淘宝大数据查询平台
  • 做网站设计师的感想广州云购网站建设
  • yu网站建设新wordpress仿站
  • 网站建设那些公司比较好联盟文明网站建设有新突破
  • 天将建设集团有限公司网站郑州付费系统网站开发建设
  • 企业网站建设学习网站建设uuluoyuan
  • 红色简约的手机社区类网站html5响应式模板下载深圳网站建设吗
  • 做网站太麻烦了莱芜招聘信息最新招聘2023年
  • 全国交通建设网官方网站自媒体代运营怎么收费
  • 广西医院的网站建设简约创意logo设计免费生成
  • ui展示 网站新闻摘抄2022最新20篇
  • 网站建设如何推广业务安徽网站设计平台
  • 张家港网站开发网站策划案内容
  • 江苏城乡与住房建设部网站网站建立时间怎么查
  • 建设网站有哪些参考文献怎么做网站用dreamwer
  • 建筑论坛网站扬州手机网站开发
  • 花生壳域名可以做网站域名吗北京北控京奥建设有限公司网站
  • 网站怎么做购物车网站营销中常见问题
  • 珠海响应式网站建设费用搜狗 优化网站
  • 医药企业网站模板网站建设买阿里云云服务器
  • 转发文章赚钱的网站建设泉州专业做网站公司
  • 蜂蜜做的好网站或案例重庆网站建设首选卓光
  • 什么网站可以找手工活做做拍卖网站需要多少钱
  • 网站上的广告位是怎么做的潮汕网站建设
  • 如何在微信公众号内部做网站人人建站网
  • 可以做软件的网站凯里网络公司建设网站
  • 涿州做网站公司厦门搜索引擎优化合作
  • 农用地转建设用地结果查询网站做网站前期预算