做网站 超速云,郑州地方网络推广网站,北白象镇做公司网站哪里有,南昌seo计费管理文 | 霍华德源 | 知乎最近几天在知乎上有个问题火了#xff1a;你是什么时候对深度学习失去信心的#xff1f;在此推荐一下知乎大V霍华德的回答#xff0c;以下为原回答。对于深度学习的现状#xff0c;工业界还是很清楚的。如果没有变革性的突破#xff0c;弱人工智能时代… 文 | 霍华德源 | 知乎最近几天在知乎上有个问题火了你是什么时候对深度学习失去信心的在此推荐一下知乎大V霍华德的回答以下为原回答。对于深度学习的现状工业界还是很清楚的。如果没有变革性的突破弱人工智能时代的范式应该基本就要确定了。大模型 拖拖乐基本范式就是 大模型 拖拖乐下游少量数据微调在前端表现为拖拖乐形成DAG自动生产模型。拖拖乐平台各大云厂商都有提供如阿里的PAI腾讯的Ti平台、华为的ModelArts亚马逊的SageMaker等等对于大模型各种网络魔改价值很有限因为数据上去后假设越少越好偏置归纳越少越好这就使得模型越朴素越好。大模型也会成为各大公司的核心资产所有数据向大模型汇聚试图记下互联网上的一切数据。然后一键蒸馏小模型一键剪枝一键压缩一键部署一键一条龙。深度学习规则化越来越觉得深度学习变成一种数据驱动的规则一个模型就是一个规则。传统规则引擎里各种if-else全靠程序员启发式完成。深度学习规则引擎每个规则就是个小模型。全靠算法工程师使用数据驱动的方式训练完成。之前大家觉得一个强力模型包打天下。现在看来更务实的方式的无数小模型组合冲击往往效果更佳。这就使得原本深度学习被诟病可解释性问题其实不再是问题。因为从业务顶层已经被拆分拆分成一个个可以被人理解的因子无法被合理解释的因子项目启动的评审都无法通过。就我熟悉的视频理解来说吧原本以为一个强大模型学习所有数据出一个强力分数然后用这个分数搞定一切。但这样的模型背后的黑箱无法被接受。现在视频被从非常多个维度切分视频清晰度、视频美观度、视频有没有log视频有没有涉黄视频有没有涉政是不是ppt视频有没有被剪裁过有没有黑边。所有这些子任务都不需要多强的模型更重要的是数据。显著的 隐含的另外一个感悟是显著的优于隐含的字幕就是优于打标签OCR识别优于各种分类、检索、生成。因为字幕就是最显著的其他信息都是隐含的通过模型推测出来的。这就产生了一个固有矛盾。在学术界隐含的才是有难度的才是有研究价值的例如视频动作识别一定要从连续的动作中理解出到底在干啥。但在工业界这样的任务就非常难用。工业界喜欢显著的因为问题最少。这样的分野会使得工业界和学术界关心的问题慢慢发生分歧不知道是好是坏。刀耕火种的时代过去了过去算法工程师们耕作着一亩三分地或经营着一个个手工作坊面向业务营业。但显然刀耕火种和手工作坊时代要过去了。大型收割机已经进入农田制造业工厂已经拔地而起里面是一条条模型流水线。这就是生产力的发展势不可挡。但就像失去土地的农民失去作坊的工匠下步又该何去何从技能闭环还是深耕我能想到的大概两个方向。一个是往大模型深耕成为大模型专家在公司内守住一个领域的大模型。或者带着自己大模型的技能到其他地方去用大模型降维打击。但其实能用起的大模型的地方可能不会很多训练的成本就很高。一个是技能闭环或者说就是全栈化补充后台、前端、大数据、产品的知识争取获得独立打造产品的能力。这样能降低被螺丝钉化的风险。后台回复关键词【入群】加入卖萌屋NLP、CV、搜推广与求职讨论群