当前位置: 首页 > news >正文

为什么我的网站做不起来深圳百度快照优化

为什么我的网站做不起来,深圳百度快照优化,制作网页入门软件,谷歌在线浏览器入口1.简介 其实自监督学习的核心思想很简单#xff0c;利用大量的无标签数据训练模型#xff0c;然后将其作为预训练模型在下游任务上进行微调#xff08;有标签#xff09;。在用无标签图像训练模型时主要通过设计辅助任务#xff0c;用图像自身的信息作为标签训练。常见的…1.简介 其实自监督学习的核心思想很简单利用大量的无标签数据训练模型然后将其作为预训练模型在下游任务上进行微调有标签。在用无标签图像训练模型时主要通过设计辅助任务用图像自身的信息作为标签训练。常见的就是对比学习将原图本身和经过图像增强的图像作为正样本其他作为负样本。 对比学习cv通过对输入图像进行数据增强将数据增强的图像作为原图的正样本其他输入图像作为负样本。但是这种模式在nlp中却不好使用将一句话中的单词替换为同义词预测的结果很可能会产生偏差所以nlp选择用dropout的方法。同一张图像通过两个分支进行dropout其中dropout的层是不一样的随机选择的所以产生的结果向量也是不同的那么这两个向量就互相为正样本了。 token。Tokenization is a way of separating a piece of text into smaller units called tokens.And tokens are the building blocks of Natural Language,which can be either words, characters, or subwords. token包含class token、patch token在NLP叫每一个单词为token然后有一个标注句子语义的标注是CLS在CV中就是把图像切割成不重叠的patch序列其实就是token。 在大型语言模型中token是指文本中的一个最小单位。通常一个token可以是一个单词、一个标点符号、一个数字、一个符号等。在自然语言处理中tokenization是将一个句子或文本分成tokens的过程。 在大型语言模型的训练和应用中模型接收一串tokens作为输入并尝试预测下一个最可能的token。对于很多模型来说tokens还可以通过embedding操作转换为向量表示以便在神经网络中进行处理。由于大型语言模型处理的文本非常大因此对于处理速度和内存占用等方面的考虑通常会使用特定的tokenization方法例如基于字节对编码byte-pair encodingBPE或者WordPiece等算法。  在NLP比如BERT输入一段句子分词器会将句子中的单词、符号转换成一个个token。对于视觉Transformer把每个像素看作是一个token的话并不现实因为一张224x224的图片铺平后就有4万多个token计算量太大了BERT都限制了token最长只能512。所以ViT把一张图切分成一个个16x16的patch具体数值可以自己修改每个patch看作是一个token这样一共就只有224/16*(224/16)196个token了。当然了单单的切分还不够还要做一个线性映射位置编码等等。不同的Transformer在处理细节上也会有不同比如最近看的Swin-T加入了多尺度从最开始的4*4的patch缩放到后边的32*32。 BEIT最终得到的就是一个ViT预训练模型用这个预训练模型在下游任务上进行训练效果会有明显提升。 2.自监督网络 2.1 SimCLR SimCLR的原理非常简单输入一个图像对该图像先进行数据增强得到不同的两个图象然后经过encoder进行特征提取分别得到hi和hj在经过一个MLP得到最终的向量Zi和Zj。训练好后得到一个特征提取器Encoder这样在用到下游任务上时训练速度精度都会更好。 训练过程的batchsize为8192所以需要的硬件条件比较苛刻。训练时输入经过数据增强的数据将其他8191个样本作为负样本原图的数据增强图作为正样本。对输出的向量算余弦相似度对角线上的值接近一。
http://www.ihoyoo.com/news/20268.html

相关文章:

  • 下载网站源文件房产网app
  • 苏州做淘宝网站企业网站建设公司怎么收费
  • 阿里云如何建设网站株洲seo优化首选
  • 网站建设水平中国建设监理协会官方网站
  • 怎么设自己的网站wordpress修改手机模板
  • 贵州铁路建设网站沙田仿做网站
  • 电子商务网站建设需要哪些技术上海做网站seo
  • 自己设计好的网站怎么设置访问福州网站设计大概费用
  • o2o平台网站开发网站底部浮动代码
  • 做设计的网站网站控制面板 地址
  • 找公司做网站需要注意广西南宁官方网站企业
  • 爱站网长尾关键词挖掘工具的作用网站建设完成推广
  • 自己搭建个人网站的注意事项软件开发服务税率
  • 湖北网络建设公司网站wordpress 样式
  • 中山网站seo关键词建筑网片报价公式
  • 个人做网站的注意事项网站建设361
  • 郑州建设企业网站找哪个公司seo的内容主要有哪些方面
  • 南宁网站建设公怎么修改网页源代码
  • 龙岗网站建设价格哪种编程语言可以做网站
  • 网站空间选linux建设公司企业评语
  • 电商设计网站哪个好android studio下载安装
  • 网站建设公司 选中企动力公司岳池做网站电话
  • 漳州网站建设哪家最权威东莞网站改版
  • 网站建设公司西安把别人的图片拿来做网站
  • 如何备案网站比特币网站做任务
  • dedecms 网站 经常无法连接空间信息网站
  • 博物馆网站页面设计说明农用地转建设用地结果查询网站
  • 合肥网站开发外包公司建设网站和网页有啥区别
  • 做微信商城网站合肥网站模板建站
  • 做英语陪同翻译兼职的网站今天杭州新闻最新消息