你的位置:澳门网 > 公司新闻 >

令人印象深刻的新语言AI撰写产品评论和新闻文章

2019-06-17 11:45 点击:

  到目前为止,试图在言语使命上得到世界记载成果的钻研职员将“微调”他们的模子,以便在所会商的特定使射中表示优良 - 也就是说,AI将针对每项使命进行锻炼。

  OpenAI用于测试GPT-2功效的一项使命是机械进修中的驰名测试,称为Winograd模式测试。Winograd模式是一个语法恍惚但对人类不恍惚的句子 ​​- 由于咱们有上下文来注释它。

  AI体系在天然言语处置之外也看到了同样令人印象深刻 新手艺 - 以及更壮大的计较威力 - 使钻研职员可以大概发现传神的图像,擅长Go等双人游戏,并与Starcraft和DOTA 等计谋视频游戏中的专业人士合作。

  GPT-2并不完满 - 即即是最好的AI模子也是如斯 - 但它每天都在不竭改良。跟着手艺的前进,建立模子变得越庞大。AI钻研职员继续为图像识别和机械视觉等使命建立模子。[...]

  名为GPT-2的OpenAI体系不必要进行微调:它在咱们用来果断言语AI的很多焦点使射中实现了创记载的机能,而没有颠末特地的锻炼来处置这些使命他们。它也起头展现一些阅读理解,总结和翻译的才能,而没有对这些使命进行明白的培训。

  OpenAI不断在勤奋弄清晰若何制约滥用AI的可能性,而且他们得出结论,在某些环境下,准确的处理方案制约了他们公布的内容。

  但即便对付咱们这些习惯于在这个范畴取得倏地进展的人来说,OpenAI的最新版本也令人印象深刻。

  OpenAI团队正在做出不寻常的取舍,不公然辟布他们的体系,让每小我都能与之互动。这太蹩脚了 - 从我这里拿走它,测验测验它长短常风趣的 - 但它们有很好的来由。

  尽管他们没有在网上供给言语天生器自身,可是OpenAI的团队让我能够拜候它,所以我能够查看他们的成果并写下这篇文章。

  “这是更多的数据,更多的计较,更廉价的计较和架构改良 - 大约一年半前由Google的钻研职员设想,”OpenAI钻研员Jeffrey Wu告诉我。“咱们只是想测验测验一切,看看现实成果在哪里。”

  很多人以为,正凡人工智能威力的前进将必要在无监视进修方面取得进展- 也就是说,人工智能只会表露于大量数据而且必需本人弄清晰其他一切。无监视进修更容易扩展,由于非布局化数据比布局化数据更多,无监视进修能够更好地归纳综合使命。

  “OpenAI公布了一种名为GPT-2的新言语模子,它超越了各类使命的最新手艺程度,”我提醒道。在接下来的15秒内,AI为我扩展了这一点。

  OpenAI的团队对此暗示质疑。GPT-2利用了一种新发现的神经收集设想,称为变形金刚,由Google Brain的钻研职员在18个月前发现。机能的一些提拔必定得益于更多的数据和更强的计较威力,但它们也遭到该范畴比来壮大立异的鞭策 - 正如咱们所期冀的那样,人工智能作为一个范畴正在各方面都有所改良。

  对付人类读者来说,很较着这象征着奖杯太大了,而不是手提箱太大,由于咱们晓得物体若何顺应其他物体。可是,人工智能体系很难处理这些问题。

  当然,连结一些私有功效可能结果不大。“我置信,一小我零丁利用足够的计较资天性够在一两个月内重现这些成果(或者是具有大量设施和时间的业余快乐喜爱者,或者更有可能是科技公司的钻研职员),”Bowman写道。我。“鉴于将模子公之于众是尺度做法,这一决定只是推迟了短时间内这类模子的公布。”而且连结私有威力具有缺陷 - 这使得公家更难以独立评估事情。正在完成。

  这能够得到很好的成果,但它必要建立复杂的数据集并细心标识表记标帜每一位数据。值得留意的是,有 监视的进修并不是人类得到技术和学问的体例。咱们在没有监视进修的细心形容的例子的环境下揣度出这个世界。

  在周四公布的一篇论文中,OpenAI团队证实咱们能够从“无人监视”的人工智能中得到这些成果 - 这象征着体系从阅读800万篇互联网文章中进修,而不是通过明白的使命培训。他们的人工智能鞭策了最先辈的手艺 - 在某些环境下,通过良多方面。OpenAI团队暗示,他们的体系在所谓的Winograd架构上缔造了机能记实,这是一项艰巨的阅读理解使命; 在儿童册本测验中到达近乎人道的表示,这是对阅读理解的另一种查抄; 而且 - 最冲动听心的 - 发生本人的文本,包罗很是有说服力的旧事文章和亚马逊评论。

  这个关于东北地域狂风雪的故事 - 加上本地当局发现的报价 - 花了大约10秒钟来“写”。

  OpenAI暗示,在本文之前,可以大概处理Winograd模式的最先辈的AI在63.7%的时间内准确利用它们。(人类险些素来没有弄错过他们。)GPT-2在70.7%的时间内获得了准确的谜底。这依然远远低于人类程度的表示,但它比以前可能的表示愈加惊人。

  GPT-2也设置了其他言语使命的记实。LAMBADA是一项测试计较机利用故事中前面提到的上下文来完成一个句子的威力的使命。之前的最佳表示精确率为56.25%; GPT-2的精确率到达63.24%。(同样,人类在95%以上的时间都能得到这些权力,因而人工智能还没有代替咱们 - 但这是威力的大幅提拔。)

  并且要明白的是,尽管人工智能能够撰写有气节人信服的旧事文章,但我不会对在报纸上看到它们感应震惊,但它不克不迭写出真正的旧事文章; 报价和统计数据全数构成。

  人工智能的另一个持思疑立场的概念是,它们并没有反应出咱们对计较机体系的理解的“深刻”进展,只是可以大概利用更大都据和更多计较威力所带来的陋劣改良。攻讦者以为,险些所有预测为人工智能成长的工具现实上只是从添加更多计较威力到现无方式的渐进历程。

  GPT-2是一种称为“无监视进修”的方式的成果。这就是这象征着什么。当今工业中的支流方式是“监视进修”。在这里,您能够得到蕴含所需输入和所需输出的大型,细心标识表记标帜的数据集。你教AI若何按照输入发生输出。

  在已往十年中,咱们在天然言语处置方面取得了庞大前进。翻译曾经改良,变得高品质,你能够阅读其他言语的旧事文章。谷歌客岁炎天证实谷歌助理能够打德律风和预定,同时听起来就像一小我(尽管该公司许诺它不会在实践中利用棍骗性的计谋)。

  思疑论者说言语模子无奈做到推理,但GPT-2证实比最好的人工智能模子更壮大。[...]

  比方,通过如许的东西,能够很容易地棍骗亚马逊的评论并在人类必要的时间内抽出假旧事文章。稍微庞大一点的版本可能足以让学生天生抄袭的论文,垃圾邮件发送者能够改良他们对方针的动静传送。

  人工智能正在以最快和最踊跃的体例转变咱们的糊口。人工智能将答应智能机械人和计较机与咱们一路事情,以至能够使咱们可以大概与其他智能代办署理一路事情,无论他们是人仍是机械。

  OpenAI政策主管杰克克拉克告诉我,“我担忧会发生肆意大量的垃圾看法内容,这是性别蔑视和种族主义者。” 他还担忧“饰演虚伪消息的人,更庞大的人”,并指出可能有其他滥用处径,咱们还没有想到。所以他们让这个东西连结离线形态,至多此刻是如许,而每小我都能够衡量若何平安地利用这些AI。(有一个较小的版天性够公然试用。)

  我所见过的最酷的人工智能体系之一也可能会让我得到事情。本周早些时候,我加入了OpenAI的钻研团队的一个演示,这个旧金山的非营利组织正在与顶级科技公司竞争,对人工智能的前沿进行令人印象深刻的新钻研。他们向我展现的体系是一种言语进修模子,能够编写旧事,解读阅读理解问题,并起头在翻译等使射中表示出前景。

  鲍曼指出,对文本天生人工智能体系的一种持思疑立场的概念是,“如许的模子有时看起来只是反复他们锻炼过的切当文本而看起来很都雅。”比方,若是你这么做就很容易获得连贯的段落。从其他来历剽窃整个段落。但这不是正在产生的工作:“这是以一种不克不迭真正做到这一点的体例成立的。”由于它一次取舍一个单词,所以不是剽窃。

  AI一次取舍一个单词,然后思量下一个该当是什么。增添句子必要几秒钟。 这毫不是完满的: 散文很是粗拙,偶然也会有不可文,并且文章越长越不连贯。纽约大学天然言语处置和计较言语学专业的萨姆鲍曼在一封电子邮件中告诉我,“该模子最终彷佛依然偏离主题,输出上限为几百字。”

  所以,当然,我做了显而易见的事 - 我要求OpenAI的新言语AI为我完成这篇文章。

  “咱们但愿以负义务的体例沟通咱们所做的工作,使其他主要的好处有关者,如记者和政策制订者,可以大概理解和验证咱们所做的工作,”Clark写道。这是一种均衡,必要采纳一些恰当的操练,但他们以为这一发觉 - 尽可能成为假旧事的伤害东西 - 是起头查询造访若何冲击它的准确场合。