当前位置: 首页 > news >正文

鞍山市网站建设_网站建设公司_字体设计_seo优化

网站项目规划与设计方案,php网站开发实例编程,建个网站做外贸,杭州网站建设规划论文笔记整理#xff1a;高凤宁#xff0c;南京大学硕士#xff0c;研究方向为知识图谱、实体消解。链接#xff1a;https://doi.org/10.1145/3308558.3313578动机目前实体匹配过程中实体之间的差异比较微妙#xff0c;不同的情况下可能会有不同的决策结果#xff0c;导致… 论文笔记整理高凤宁南京大学硕士研究方向为知识图谱、实体消解。链接https://doi.org/10.1145/3308558.3313578动机目前实体匹配过程中实体之间的差异比较微妙不同的情况下可能会有不同的决策结果导致难以做出精确的匹配决策。另外现存的实体匹配方法在做出决策之前往往需要大量的训练数据而这在许多的应用场景中是难以做到的。亮点本文的亮点主要包括1设计了一种层次化的深度模型利用了字符级别和单词级别的信息来预训练常见属性类型的相关模型。2使用了迁移学习的方法能够利用预训练模型并进行微调使其能够处理新的属性类型的实体匹配任务。 系统结构从上图可以看出整个的系统分为三个组成部分分别是Attribute Type Detection Model、Attribute-level EM、Table-level EM Fine-tuning。其中Attribute-levelEM是整个系统的核心部分。概念及模型1.    HI-EM 模型首先该模型针对字符级别和单词级别可以进行划分。在字符级别的层次上先将输入的字符进行 embedding转化为向量表示。再通过 BiGRU使得模型能够学习到字符间的上下文信息。下面通过输入间的注意力机制进行对齐工作。然后进行聚合工作将对齐后的表示形式与 BiGRU 得到的表示形式分别进行作差和乘积然后进行拼接得到新的表示形式。最后通过输入内部的注意力机制更新当前字符的权重最后通过将其他输入对当前字符的影响进行求和得到单词级别的表示形式。下面单词级别层次上的工作与之类似最后每一个输入都得到相应的表示形式然后通过MLP 进行打分从而进行匹配决策。 2.    Type-detection 模型该模型与HI-EM模型结构相似但是没有沿用HI-EM模型是因为在这两个任务中同一个输入的不同元组的重要程度恰好是完全相反的。基于这一点考虑Type-detection模型在结构上进行了变动并且对最后的MLP层的输出结果进行了softmax操作得到分别表征某个输入属于某个属性这件事为True和False的表示形式。 3.    Transfer Learning在属性类型检测和属性级别的实体匹配中在处理未知的实体类型时都用到了迁移学习的方法。例如在属性级别的实体匹配中对已知的49种属性类型每种类型都要单独训练一个模型而对于未知类型的属性训练模型时采用之前的49种属性类型的训练集的并集模型基本沿用HI-EM模型大体结构不变只改变了MLP层并进行微调最终结果是训练得到一个模型。 4.    Table-level EM 模型对属性类型明确的以及未知类型的属性级别实体匹配模型的最终表示形式进行了拼接最终通过新的MLP层并进行微调即可得到表格级别的实体匹配模型。实验1.     Type Detection Experiments1   Entity-value type-detection 在40种常见属性类型中绝大多数属性类型上面都有较高的准确率和召回率在9种添加的地址类型中尽管测试数据之间的差异较小模型仍然能够较好地分辨属性类型。 2   Table-column type-detection与基于关键字的这种很强的baseline方法相比本文提出的模型在绝大多数属性类型上面仍然能够取得跟前者相近甚至较好的实验效果。 3   Transfer-learning to new types利用迁移学习方法的模型与从零开始学习的模型相比前者的学习速度更快有着更高的准确率和召回率。 2.     Attribute-Level Entity Matching1   Pre-trained attribute-level EM从上表中可以得到如下几点发现与其他所有方法相比HI-EM 的实验结果是最好的HI-EM(Unified) 模型比 DeepMatcher (Unified) 模型的实验结果要好与属性类型明确的实验模型相比unified 类型的模型实验结果较差。从上图可以发现在准确率和召回率这对指标上面的实验结果与MRR上的实验结果基本一致。 2   Transfer-learning to new types从上表中可以得到如下几点发现在相同的训练样本数量下利用迁移学习训练的模型比从零开始训练的模型的实验效果要好训练数据越少时两个模型之间的差异越明显。 从上图可以发现在准确率和召回率这对指标上面的实验结果与MRR上的实验结果基本一致。 3.     Table-level Entity Matching从上表中可以得到如下几点发现利用预训练模型的实验效果较好即使只有少量的训练数据在属性级别的实体匹配任务中属性类型明确的模型是更为准确的绝大多数情况中HI-EM模型的实验效果比 DeepMatcher 和 Magellan 更好。总结本文提出了一种利用预训练模型的端到端的实体匹配系统在迁移学习的帮助下证明了表格级别的实体匹配模型可以仅用少量的训练数据进行训练。 OpenKG开放知识图谱简称 OpenKG旨在促进中文知识图谱数据的开放与互联促进知识图谱和语义技术的普及和广泛应用。点击阅读原文进入 OpenKG 博客。
http://www.ihoyoo.com/news/126857.html

相关文章:

  • 网站制作什么做苏州软件定制开发
  • 宁夏建设职业技术学院网站拖拽式制作网站
  • 修文县抖音seo推广收费全网优化推广
  • 手机版网站打开速度慢上海做网站价格
  • 平面设计网站制作怎么创一个网站赚钱
  • 自己做网站需不需要钱织梦cms一键更新网站无法使用
  • 社保局网站建设意义济南seo整站外包
  • 网站降权该怎么做wordpress模板调用自定义插件
  • 想自学做网站跨境电商网站开发公司
  • 有哪些网站做的比较好看的图片网站建设的系统分析
  • 衡阳网站建设开发价格兰州网站怎么建设
  • 网址导航网站简单制作奉贤专业做网站
  • 定制网站建设价格wordpress新版编辑器
  • 运城网站制作公司北京万户网络
  • 懂做网站的人就是好珠海建设工程交易中心
  • 承德很好的网络建站家政公司管理系统
  • 北京 网站开发 排行帮别人做网站自己为什么会被抓
  • 无锡哪家公司做网站wordpress 获取主题名称
  • 昆明网站建设哪家比较好网上电商平台开发
  • html网站开发例子自适应wordpress博客
  • thinkphp 网站下载吉林网站建设哪家好
  • 网站建立好如何做seo江门网站建设定制
  • 网站建设报表明细公司网站年费
  • 西安网站建设选任我行网络关键词调词平台
  • 免费建小程序网站山西太原制作网站人有吗
  • 国外游戏ui设计网站淘宝商城
  • 官方网站开发用什么语言wordpress导出
  • 半商城性质网站源代码织梦网站怎么加入引导页
  • 免费成品网站模板下载wordpress mysqli
  • 网站制作培训多少钱本地wordpress建站