您现在的位置:首页 > CSR > 正文

亚马逊推出新的Alexa开发人员工具

来源:| 2021-12-09 14:02:16

亚马孙为想要编写Alexa技能的开发人员宣布了一系列新功能。团队总共在其Alexa Live活动中发布了31个新功能。不足为奇的是,其中一些功能相对较小,但是到目前为止,已有70万开发人员已经为该平台构建了技能,其中一些功能极大地改变了Alexa的体验。

“今年,考虑到我们的所有动力,我们真的想关注开发人员真正需要什么,以使我们(与Alexa)互动真正意味着什么,”该公司Alexa Devices&Developer Technologies副总裁Nedim Fresko , 告诉我。

那么,此版本的亮点之一就是Alexa Conversations的Beta版发布就不足为奇了,该公司去年在re:Mars峰会上首次展示了该版本。顾名思义,此处的总体思路是使用户更轻松地与他们的Alexa设备进行自然对话。正如Fresko所指出的那样,这是一项非常艰巨的技术挑战。

弗雷斯科说:“我们观察到,消费者真的很想与Alexa进行自然交流。”“但是使用传统技术很难实现自然。要准备随机的词组,记住上下文,继续使用上下文,处理信息的供过于求或供过于求,这是很难做到的。如果以某种方式创建状态图,就会陷入困境,必须停止。然后,人们不会满足于所有这些,而只是满足于“好吧,我会改为执行机器人命令”。打破这种循环的唯一方法是实现飞跃性发展,而为此所需的技术使熟练的开发人员可以真正专注于对他们而言重要的事情。”

对于开发人员而言,这意味着他们可以使用该服务来创建示例短语,对其进行批注并提供对API的访问以供Alexa调用。然后,该服务可以推断对话可以采用的所有路径并使其起作用,而开发人员不必指定对话及其技能可以采取的所有可能的转弯方式。在许多方面,这使它类似于Google的Dialogflow工具,尽管Google Cloud的重点更多地放在企业用例上。

“ Alexa Conversations有望成为开发人员的突破,并将为客户创造很棒的新体验,” Philosophical Creations创始人Steven Arkonovich在今天的公告中说。“我们通过Alexa对话更新了Big Sky技能,现在用户可以更自然地说话,并在对话中改变主意。Alexa的AI可以跟踪它,而我的技能代码输入很少。”

根据Fresko的说法,对于技能的子集(目前约为400种),该团队还将启用一个新的深度神经网络,以提高Alexa对自然语言的理解。该公司表示,这将使获得此技能的技能的准确性提高约15%。

“这个想法是让开发人员只需更改底层技术并使模型更复杂就可以在不采取任何措施的情况下获得准确性的好处,我们能够提高所有技能的准确性,” Fresko解释说。

另一个可能会引起开发人员广泛关注的新功能是Alexa for Apps。这里的想法是使移动开发人员能够将他们的用户从他们在Alexa上的技能带到他们的移动应用程序。对于Twitter,例如,这可能意味着说出类似“ Alexa,让Twitter搜索#BLM”之类的内容,然后Twitter技能便可以打开移动应用程序。毕竟,对于某些搜索而言,在屏幕上和移动应用中查看结果比大声朗读更有意义。此功能现在处于预览状态。

另一个新功能是“技能恢复”,现在可以在美国英语的预览版中使用,它基本上允许开发人员将其技能放在后台,然后根据需要提供更新。例如,这对于乘车应用程序很有用,然后可以为用户提供有关汽车何时到达的更新。这类主动通知是所有辅助平台都在尝试的东西,尽管到目前为止,大多数用户可能只在日常使用中看到其中一些。

该团队还发布了两个新功能,这些功能应该可以帮助开发人员让潜在用户发现他们的技能。这仍然是所有语音平台的主要问题,并且可能是大多数人只使用他们当前可用技能的一小部分的原因之一。

这些发布中的第一个是Alexa快速链接的beta版,现在是美国英语和美国西班牙语的beta版,它允许开发人员创建从其移动应用程序,网站或广告到新用户界面的链接,从而使他们能够提高自己的技能在设备上。弗雷斯科说:“我们认为这将真正帮助人们变得更容易获得和认可。”

此存储桶中的第二个新功能是无名称的交互工具包,现已预览。只要系统认为给定技能可以为给定问题提供最佳答案,Alexa就已经具有启动第三方技能的能力。现在,借助这个新系统,开发人员最多可以指定五个建议的启动短语(例如“ Alexa,下一班火车何时到达Penn Station?”)。亚马逊表示,使用该工具后,一些早期预览用户已经看到与其技能的互动增加了约15%,不过该公司很快指出,每种技能的互动方式都会有所不同。

在其他更新中,还有一些新功能供想要构建游戏和其他更多互动体验的开发人员使用。这里的新功能包括APL for Audio Beta,它提供了在运行时混合语音,声音效果和音乐的工具;用于游戏的Alexa Web API,以帮助开发人员使用HTML5,WebGL和Web Audio等网络技术为带屏幕的Alexa设备构建游戏;和APL 1.4,现在可以在公司的标记语言中添加可编辑的文本框,拖放式UI控件等,以增强视觉技能。

(编辑:互联网 作者:互联网)

分享到:
版权申明

凡本网注明“XXX(非公益之声)提供”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和其真实性负责。

特别关注

新闻排行

资讯推荐

  • GoogleHome用户在创建新例程时遇到奇

    GoogleHome应用程序允许用户使用该应用程序的“例程”功能将多个操作组合为一个命令。例如,当用户说“嘿Google,晚安”时,用户...

    2021-12-09

  • 人工智能的定义和医学创新机会

    我是新泽西州普林斯顿的内科医生兼医学总监西蒙·默里博士MJH生命科学。今天,我将加入计算机科学家,机器人技术和人工智能领域的权威机构EricD...

    2021-12-09

  • WackoSearch公司将搜索引擎置于领先地

    Loyaltynet是一家专门设计新颖网站的公司,它推出了一个不寻常的搜索引擎。WackoSearch与任何传统的搜索引擎相同,它允许用户输入他们想要的任何搜索词...

    2021-12-09

  • 如何提升玻璃清洁剂性能?配方分析有

    玻璃清洁剂作为清洁类消费品,被广泛运用在各行各业的玻璃清洁工作中,肩负着为人们提供清洁生活生产的使命。而玻璃清洁剂的配方分析可以使产品更新换...

    2021-12-09

  • 微软的飞行模拟器2020将于8月18日发布

    经过一系列封闭的Alpha测试后,微软XboxGameStudios和AsoboStudio今天宣布,下一代MicrosoftFlightSimulator2020将于8月18日发布。现已开始接受预订,...

    2021-12-09