当前位置: 首页 > news >正文

上海 网站备案平面设计

上海 网站备案,平面设计,中国建设银行的网站特色,一个网站如何做cdn加速器deepspeed存在一个bug#xff0c;即在训练时不保存调度器状态#xff0c;因此如果训练中断后再重新开始训练#xff0c;调度器还是会从头开始而不是接着上一个checkpoint的调度器状态来训练。这个bug在deepspeed的github中也有其他人提出#xff1a;https://github.com/mic…deepspeed存在一个bug即在训练时不保存调度器状态因此如果训练中断后再重新开始训练调度器还是会从头开始而不是接着上一个checkpoint的调度器状态来训练。这个bug在deepspeed的github中也有其他人提出https://github.com/microsoft/DeepSpeed/issues/3875 因此我们需要写一个保存调度器状态的代码才可以解决这个问题。 具体方法是加一个callback类专门负责保存调度器的状态以及在训练重新开始时加载调度器的状态 先在训练文件中给trainer加一个callback from smoe.callbacks.save_model import SchedulerStateCallback trainer.add_callback(SchedulerStateCallback)class SchedulerStateCallback(TrainerCallback):def on_save(self, args: TrainingArguments, state: TrainerState, control: TrainerControl, **kwargs):if os.environ.get(RANK, 0) 0:#scheduler kwargs[lr_scheduler]scheduler kwargs.get(lr_scheduler)if scheduler is None:return scheduler_state scheduler.state_dict()#save_path os.path.join(args.output_dir, SCHEDULER_NAME)# 使用 PREFIX_CHECKPOINT_DIR 和 global_step 创建检查点目录名checkpoint_folder f{PREFIX_CHECKPOINT_DIR}-{state.global_step}# 完整的检查点目录路径checkpoint_path os.path.join(args.output_dir, checkpoint_folder)# 如果目录不存在则创建它if not os.path.exists(checkpoint_path):os.makedirs(checkpoint_path)# 完整的保存路径save_path os.path.join(checkpoint_path, SCHEDULER_NAME)# 保存scheduler状态torch.save(scheduler_state, save_path)def on_train_begin(self, args: TrainingArguments, state: TrainerState, control: TrainerControl, **kwargs):# 如果resume_from_checkpoint设置了有效路径if args.resume_from_checkpoint is not None:load_path os.path.join(args.resume_from_checkpoint, SCHEDULER_NAME)# 如果该路径下有保存的调度器状态则加载它if os.path.exists(load_path):#scheduler kwargs[lr_scheduler]scheduler kwargs.get(lr_scheduler)if scheduler is None:return scheduler_state torch.load(load_path)scheduler.load_state_dict(scheduler_state) 解决效果如下我们可以看到在chaeckpoint10重新开始训练的时候学习率是接着之前的学习率开始的5.5e-7)而不是从头开始(0.5e-7)
http://www.ihoyoo.com/news/28444.html

相关文章:

  • 深圳网站关键词排名查询网站开发公司的log
  • 怎样看网站建设网页设计超链接实验报告
  • 网站开发设计价格crm企业管理系统
  • 展示照片的网站wordpress single_post_title
  • 友情链接交易网站如何做seo网站
  • 清远做网站seo网站 白名单
  • 如何在网站上做网盘网站改版的方式大致为
  • 标识设计网站东莞教育团购网站建设
  • 自媒体十大平台新闻类网站怎么做seo
  • 备案网站内容怎么写全球最顶尖的设计公司
  • 虚拟主机部署网站品牌购物网站十大排名
  • 专做PPP项目网站国内高端大气的网站设计
  • 云南昆明网站建设价格html5登录界面完整代码
  • 北京建网站需要多少钱vue做移动端网站与pc端有什么区别
  • 江阴营销网站建设asp简单网站开发
  • 电子商务网站建设完整详细流程图多用户商城系统价格
  • 建设微信营销网站深圳宝安区新安街道
  • 商务网站开发文档长沙从寒网络科技有限公司
  • 局网站建设意见上海做网站技术
  • 乐成高端网站建设项目商业网站建设方案
  • seo网站优化服务商wordpress 漏洞扫描
  • 上海 设计网站建设中山网站制作费用
  • 做网站公司不负责任怎么办沈阳企业网站排名优化
  • 西宁网站怎么做seo产品如何推广
  • 国外网站建设费用企业解决方案网站
  • 微信上的小说网站是怎么做的做包装盒有哪些网站
  • 绍兴做网站多少钱做网站要实名吗
  • 鹿泉建设网站网站开源代码模版
  • 网站开发用例说明网站建设公开
  • 网站源代码使用做ppt的模板网站