黄骅做网站的电话,望京网站开发,重庆家政公司网站建设,来雁新城建设投资公司官方网站最近#xff0c;有一份自然语言处理 (NLP) 进展合辑#xff0c;一发布就受到了同性交友网站用户的疯狂标星#xff0c;已经连续3天高居GitHub热门榜首位。 合集里面包括#xff0c;20多种NLP任务前赴后继的研究成果#xff0c;以及用到的数据集。 这是来自爱尔兰的Sebasti… 最近有一份自然语言处理 (NLP) 进展合辑一发布就受到了同性交友网站用户的疯狂标星已经连续3天高居GitHub热门榜首位。 合集里面包括20多种NLP任务前赴后继的研究成果以及用到的数据集。 这是来自爱尔兰的Sebastian Ruder倾力汇总而成。 他在爱尔兰国立大学 (戈尔韦) 读博。另一个身份是AI创业公司Aylien的研究人员。 塞巴斯蒂安说NLP近来发展太快了即便作为局内人也很难顺畅地跟进这个领域里发生的事。 无微不至的仓库 要找到最常用的数据集要了解自己研究的问题有了哪些新进展还是很费力的。 所以他就在GitHub上面建了一个仓库追踪各种自然语言任务的研究成果还有对应的数据集。 这是一间整齐的仓库任务是按字母顺序排列—— · CCG supertagging · Chunking · Constituency parsing · Coreference resolution · Dependency parsing · Dialog · Domain adaptation · Language modelling · Machine translation · Multi-task learning · Multimodal · Named entity recognition · Natural language inference · Part-of-speech tagging · Question answering · Semantic textual similarity · Sentiment analysis · Semantic parsing · Semantic role labeling · Summarization · Text classification 作为一个情绪型选手我点开了情绪分析 (Sentiment Analysis) 的页面。 这里的数据集很亲切比如IMDb电影评分网站的数据。 再比如“ (姑且称为) 美国的大众点评”Yelp的店铺评论数据集。 每个数据集下面都有相关研究的列表以及所用模型的准确度。 当然情绪的二分类 (Binary Classification) 以及细粒度分类 (Fine-Grained Classification) 作为两种问题列表也是分开的。 这人文关怀无微不至。 未解之谜 塞巴斯蒂安还说了上面列出的那些是已经开始追踪的NLP任务。 还有一些任务被他加入了心愿单—— · Bilingual dictionary induction · Discourse parsing · Entity Linking · Information extraction · Keyphrase extraction · Knowledge base population (KBP) · More dialogue tasks · Relation extraction · Semi-supervised learning 这些问题的进展在他那里还是未解之谜。 深知以一己之力难以将这部分内容补充完整程序员还给了详细的参与步骤希望广大NLP战士可以互相取暖。 去看一看 塞巴斯蒂安给NLP的爱很深沉了。 他的博客各位同行或许也很眼熟了。 变身前Sebastianruder.com 变身后Ruder.io 没有收藏的话现在可以收藏一下。 当然这里也要手动贴上NLP仓库的地址 https://github.com/sebastianruder/NLP-progress 且去走一遭。 原文发布时间为2018-06-27 本文作者方栗子 本文来自云栖社区合作伙伴“量子位”了解相关信息可以关注“量子位”。