国家卫健委将对防疫中涌现出的先进集体、个人及时表彰


中新网客户端2月20日电(任思雨)国家卫生健康委人事司副司长段勇20日在国务院联防联控机制新闻发布会上提到,在这次疫情当中,有的医务人员被病毒感染,有的甚至献出了宝贵生命,向他们致以最崇高的敬意。因此,卫健委将对在疫情防控中涌现出来的先进集体、先进个人进行及时表彰,宣传他们的先进事迹,激励广大医务人员更好地投入到疫情防控工作中,为做好疫情防控工作增强信心、凝聚力量。

雷锋网消息,日前,西雅图的研究人员推出了一项被他们称为“TuringAdvice”的新人工智能大挑战,挑战的核心是创建语言模型,为使用真实世界语言的人类提供有用的建议。

研究人员表示,他们选择了Reddit各子社区分享的流行建议,试图创造一种内在的动力,就像人们在Reddit上响应求助时所体验的那样。

为加快产业项目导入,广州空港经济区积极引进苏宁、经纬、宝能、唯品会、顺丰、圆通等优质跨境电商项目,顺利推动《广州空港粤港澳大湾区跨境电商国际枢纽港建设实施方案》印发实施,正全力加快打造跨境电商业务全球优选地,预计到2022年,将实现港内流通跨境电商商品货值超过1000亿元,企业主营业务收入达到200亿元。

所有的模型性能评估都来自于通过亚马逊的Mechanical Turk雇佣的人员。这篇论文曾对获取人工智能模型培训数据的方式表示不满,但它认为,比起发布自动化机器建议来回应需要帮助的人类,雇佣Mechanical Turk员工的做法更有道德;它也承认,获得报酬来完成这项任务会引入外部动机。倾向于选择机器建议而非人类建议的工人被解雇了。

为了确保结果与真实世界的语言使用保持一致,研究小组选择了一种动态评估方法,他们在最近两周内从Reddit的各个子社区收集了200个情况。他们选择把建议作为一个测试场景,因为它是所有人都非常熟悉的东西,并且与阅读理解等核心NLP任务重叠。

海南省住建厅将会同海南省财政厅等部门加强对老旧小区改造工作进行服务指导,逐个市县逐个项目进行检查指导,分析、解决存在的问题,加强资金和质量监管,保证资金使用效率、确保改造工程质量。

作者们表示,TuringAdvice挑战赛中的AI进展,可能会使人工智能更好地为人类提供建议或充当虚拟治疗师。

近年来,该区已先后引进落地15个跨境电商优质项目,项目总投资额超150亿元,均将在未来1至3年内建成投产。

根据此前的试点工作情况看,海南省城镇老旧小区改造主要面临着改造起步阶段经验不足、资金难保障、小区居民意见难统一等问题。

随着跨境电商产业不断加速集聚,机场综保区正大力推动“保税+”新业态发展。其中,今年已签约落地机场综保区的华南生物医药制品分拨中心项目,定位为“保税+生物医药产业集群”新高地,致力构建生物医药智能化高标冷链生态体系,未来将充分发挥航空运输优势,建立与广州国际生物岛的“区岛联动”机制,打造辐射华南地区的生物医药制品分拨中心。

TuringAdvice挑战赛的一个关注点是价格。评估200条关于Mechanical Turk的建议大概需要370美元。未来挑战赛的参与者将被要求支付Mechanical Turk的费用,以便他们的模型被评估或出现在TuringAdvice排行榜上。

首席研究员Rowan Zellers在采访中透露,研究人员将有机会创建并调整他们的模型;第二轮排行榜结果预计将在未来几个月内公布。

TuringAdvice挑战是华盛顿大学和艾伦人工智能研究所(Allen Institute of AI)的工作,上周在arXiv上发表的一篇研究论文对此进行了详细阐述。该论文题为根据机器的实际语言使用情况来评估机器》(evaluation Machines by their Real-World Language Use)。华盛顿大学副教授Ali Farhadi是艾伦研究所先前团队的负责人,也是本文的合著者之一,他的人工智能初创企业Xnor最近被苹果收购。

雷锋网原创文章,。详情见转载须知。

最近发布的一篇关于TuringAdvice的论文写道:“今天最大的模型在REDDITADVICE上苦苦挣扎,所以我们很高兴看到新模型得到发展。”

TuringAdvice是过去一年中为建立更健壮的自然语言模型而创造的最新挑战。去年秋天,华盛顿大学的NLP实验室曾与纽约大学、Facebook的AI研究院和三星研究院一道,推出了SuperGLUE挑战赛和“排行榜”(leaderboard)这一个更复杂的评估性能的任务系列。

自2014年封关运作以来,机场综保区(一期)进出区业务量已连续五年保持增长,与综保区一体化运作的机场口岸2019年进出口货物超过200万吨,货值超过2200亿元;机场综保区(二期)已于2019年通过联合验收,新增用地规模约2000亩,可释放出保税功能、跨境电商配套等各类用地,将助力商品流通量在未来快速达到千亿级别。(完)

“我们认为,如今存在一个深层次的问题:人类在现实世界中如何使用语言,与我们的评估方法能够衡量的,这二者之间存在差距。当今的主流范式是研究静态数据集,并根据输出结果与预先定义正确答案的相似性对机器进行评级。”

“然而,当我们在现实世界中使用语言进行交流时——比如提供建议,或向某人传授一个概念——很少有一个通用的正确答案可以与之相比,这只是我们想要实现的一个松散的目标。我们引入了一个框架来缩小基准测试和实际语言使用之间的差距。”

作为TuringAdvice的一部分,研究人员还发布了一个静态RedditAdvice 2019数据集,用于训练提供建议的人工智能模型,其中包括Reddit子社区用户分享的18.8万个情景下的61.6万条建议。

初步分析表明,像谷歌T5(去年秋天推出的一个拥有110亿个参数的模型)这样的高级模型,只有在9%的情况下,写建议版主发现至少和人类建议一样有用。研究人员还评估了Grover变压器模型和TF-IDF的版本。这项研究没有评估像Google的BERT这样流行的双向NLP模型,因为它们通常被认为在生成文本方面不如从左到右的模型。关于人际关系、法律事务和日常生活方面的建议,可以在网上找到人机对比演示。