1. 首页>>分享

十年 Alexa:从科幻梦想走向现实,智能音箱的发展与挑战

十年前,2014 年 11 月 6 日,Alexa 上线,对于贝佐斯来说,该项目代表着未来。

名字来源于《星际迷航》中的“计算机”,是一款语音控制的全能AI助手。

“从科幻小说的早期开始,人们就梦想拥有一台可以自然交谈的计算机,你可以真正与它交谈并让它为你做事。今天,这个梦想终于实现了,”贝索斯说。

两年时间,智能音箱Echo已进入500万家庭,如今美国市场销量已突破4000万台。

但 Alexa 无法做很多你想象它能做的事情。

本文综合了多篇文章,包括 Alexa 和 Amazon Echo 系列智能硬件的分析和信息,由 Founder Park 编辑整理。

01十年后,Alexa仍然只是一个智能闹钟

Echo 智能音箱在美国已售出超过 4000 万台,Alexa 每周在全球处理数十亿条命令。

现在 Alexa 仍在做最基本的事情:播放音乐、提供天气信息和设置闹钟。您可以使用 Alexa 控制家中的灯光、给妈妈打电话或提醒您倒垃圾。

但正如亚马逊前员工所说:“虽然我们雇佣了1万多人,但我们仍然做了智能闹钟。”

这有点令人失望。 Alexa本来就有巨大的潜力。尽管它功能强大——尤其是在无障碍技术和老年护理等领域,它对许多人来说已经变得不可或缺——但它基本上仍然是家庭中的遥控器。现在,家里每个房间都有一个Alexa智能音箱,但这并没有让生活变得更加方便。尽管 Alexa 多年来添加了数千个功能,但我仍然不会依赖它做任何比执行计划命令、将牛奶添加到我的购物清单或告诉我鸡是否可以吃葡萄更复杂的事情。 。

如果说有什么不同的话,那就是在语音助手诞生 10 周年之际,Alexa 最初的梦想似乎更加遥不可及。

当 Alexa 首次推出时,它具有开创性。与苹果的 Siri 仅限于手机,或者微软的 Cortana 仅限于电脑不同,Alexa 却我行我素,安装在全球首款声控音箱 Echo 中。其由七个麦克风阵列提供支持的远场语音识别技术确实令人惊叹。你可以在房间的任何地方对 Echo 说话,蓝色的戒指几乎总是会亮起,表明 Alexa 已经准备好给你讲笑话或设置计时器。

亚马逊进军智能家居领域,为我们开启了“星际迷航”般的未来。虽然有些笑话和百科全书式的知识并不可靠,但 2016 年发布的 Alexa 智能家居 API,以及随后在 2017 年为 Echo Plus 添加 Zigbee 无线电,让 Alexa 可以连接和控制我们家中的各种设备。

亚马逊失败的原因__亚马逊失败了我不后悔

坐在沙发上要求 Alexa 关灯,或者躺在床上让恒温器调高暖气,感觉就像生活在未来。我们终于在家里拥有了一台类似《星际迷航》的“计算机”设备——亚马逊甚至让我们称它为“计算机”。

回顾过去,Alexa 实际上为现代智能家居铺平了道路。简单的语音控制使物联网 (IoT) 变得更加无处不在,将技术带入家庭,而不是将其困在复杂的设备中。再加上亚马逊的开放智能家居战略——在其他公司纷纷推出封闭生态系统之际——也促成了一波新型消费级智能设备的兴起。 Nest、August、Philips Hue、Ecobee、Lutron 和 LiFX 等品牌的成功部分归功于 Alexa 的易用性。

然而,围绕 Alexa 的生态系统发展得太快了。任何人都可以为 Alexa 开发“技能”,几乎没有任何限制。虽然有些技能简单有趣,但很多功能不稳定,甚至需要特殊的单词和短语才能激活。最终,这会导致不稳定且常常令人沮丧的体验。

02Alexa最大的问题是用户需要学习如何与Alexa对话

亚马逊正在通过不断扩大的 Echo 硬件产品线来掩盖 Alexa 缺乏智能的缺陷。

每年都有新的智能音箱发布,Alexa也逐渐进入时钟、微波炉等设备。它还推出了多种新形式,试图鼓励用户将 Alexa 带到户外——例如耳机 (Echo Buds) 和戒指 (Echo Loop)。 、眼镜(Echo Glasses)和车载设备(Echo Auto)等。

然而,这些设备大多没有给人留下任何印象,对Alexa的功能没有任何改善,反而让亚马逊蒙受了损失。今年,《华尔街日报》报道称,亚马逊的设备部门损失了数百亿美元。

即使采取了“尝试一切,看看什么有效”的策略,亚马逊仍然无法突破第二种基本形式。 2017 年,它推出了 Smart Display——一款带有触摸屏的 Echo,可以进行视频通话、查看安全摄像头,甚至可以显示信息,而不仅仅是告诉你。但由于处理器速度较慢、触摸屏反应迟钝以及广告过多,智能显示屏并不能真正增强 Alexa 的核心功能。

现在,许多用户抱怨 Alexa 的核心功能变得越来越差。人们购买 Echo 设备主要是因为它们比竞争产品便宜,并且可以做 Alexa 在 2014 年可以做的事情:设置闹钟、查看天气和听音乐。

对于售价仅为 18 美元的设备,人们的期望并不高。

这么多年过去了,与 Alexa 交谈仍然是最大的问题。我们学会了如何与 Alexa 交谈,而不是 Alexa 学会了如何与我们沟通。例如,我家的联网厨房水龙头仍然需要我说:“Alexa,告诉摩恩(水龙头品牌)给我倒2杯热水。”正如我丈夫所说,如果 Alexa 如此“聪明”,它应该知道,当你在厨房水槽旁时,我只需按照指示行事,而不是让我记住这些复杂的指令。

此外,Alexa还遇到了技术瓶颈。在科技界,人们普遍期望技术将不断进步。但亚马逊并没有专注于改进其核心技术,而是依靠第三方开发者为 Alexa 提供更多功能,集中资源将语音助手推向更多设备,让它控制更多东西。

随着越来越多的设备支持 Alexa,亚马逊为该平台添加了更多功能,但这也使得管理、控制和使用这些设备变得困难。语音控制非常适合简单的命令,但如果没有更方便的方式与 Alexa 交互,许多新功能对大多数用户来说将毫无意义。

亚马逊推出了 Alexa Routines(Alexa 例程任务)作为解决方案,帮助用户集成可以用 Alexa 控制的各种设备和功能,但这需要您花时间在应用程序中进行设置并不断调试设备及其连接问题。

每次发出命令时听到“您的“2个灯”没有响应,请检查网络连接和电源”的消息真是令人沮丧。每个月花几个小时配置和解决智能家居问题并不是 Alexa 最初承诺的体验。

智能计算机应该能够为你做的事情,现在却变成了一种负担。

03Alexa Skills:比OpenAI早十年构思,但失败了

十年过去了,Alexa 仍然主要用于播放音乐、提问和查看天气。这主要是因为,虽然亚马逊已经让 Alexa 在各种设备和家庭中无处不在,但它始终无法让开发人员真正关注它。

Alexa 最初没有应用程序商店。相反,它拥有亚马逊希望开发者能够将 Alexa 连接到新功能和信息的“技能”。开发者不需要在操作系统上构建自己的应用程序,而是为Alexa开发新功能。差异很微妙,但至关重要。我们的手机大多是孤立的体验——Instagram 和 TikTok、Snapchat、日历应用程序和 Gmail 是独立的,彼此脱节。这种方法不适用于 Alexa 或任何其他成功的助手。如果 Alexa 知道您的待办事项列表但不知道您的日程安排;如果它知道你喜欢什么披萨但不知道你的信用卡信息,那么它能做的就只有这么多了。 Alexa 需要获取所有必要的信息,并能够调用各种工具来帮助您完成任务。

在亚马逊的理想世界中——“环境计算”无处不在且完美——你所要做的就是向 Alexa 提出一个问题或命令:“给我找一个有趣的活动来做。” “帮我预订下周。”去纽约的火车票。” “帮助我了解深度学习。” Alexa 访问所有必要的应用程序和信息源,您无需担心细节;它会根据需要进行处理并为您提供答案。虽然如何实现这一目标的问题很复杂,但这是亚马逊的总体目标。

亚马逊发言人 Jill Tornifoglio 在一份声明中表示:“Alexa Skills 使开发人员能够快速轻松地创建语音驱动的体验,为开发人员和品牌与客户互动开辟了新的方式。”她说,客户每年使用这些技能数十亿次,随着公司拥抱生成式人工智能,“我们对未来感到兴奋。”

回顾过去,亚马逊的想法几乎完全正确,而且超前于时代。

多年后,OpenAI 和其他公司正在围绕聊天机器人(一种新型互联网界面)构建自己的第三方生态系统。尽管亚马逊对人工智能革命的愿景是准确的,但它从未完全弄清楚如何让这些技能真正发挥作用。它从未解决开发人员面临的根本问题,未能突破用户界面困难,也从未找到一种方法让用户意识到他们的 Alexa 设备实际上可以做很多事情,如果他们愿意的话。

亚马逊确实竭尽全力让“技能”成为现实。

该公司不断为开发人员推出新工具,在使用他们的技能时提供 AWS 积分和现金奖励(尽管最近已经停止这样做),并试图让技能开发变得几乎毫不费力。在某些方面,这些努力正在得到回报:亚马逊表示,该平台上提供了超过 160,000 种技能。虽然这个数字远不及智能手机上数百万个应用程序,但它仍然是一个重要的数字。

然而,发现和使用这些技能的界面一直很混乱。一个简单的例子:如果你要求 Alexa 为你订披萨,它可能会告诉你它有多种技能并推荐 Domino's。你回答“好的”。 “这是多米诺骨牌,”亚历克斯说。过了一会儿,Alexa 说道:“这是 Domino's 技能,由 Domino's Pizza, LLC 提供支持。”片刻之后,“要链接您的 Domino's Pizza 帐户,请转到 Alexa 应用程序的技能设置。我们需要您。您的电子邮件地址可用于下客户订单。请在 Alexa 应用程序中打开“电子邮件地址”权限。”这次,你必须在应用程序中找到一个你可能没有下载到手机上的设置;直接访问多米诺官方网站或拨打电话。不是更简单吗?

如果您知道自己想要使用的技能,那就更好了。你可以说“Alexa,打开Nature Sounds”或“Alexa,启用Jeopardy”,它就会打开相应的技能。但如果您忘记了该技能的名称,例如“简单瑜伽”,那么简单地要求 Alexa 开始瑜伽课程就不会那么灵敏。

这个系统的问题无处不在。当您激活一项技能时,您必须明确地说“停止”或“取消”才能退出并使用另一项技能。你无法轻松地在技能之间切换——就像我想查看披萨的价格,但 Alexa 根本不让我这样做。也许最令人沮丧的是,即使您启用了一项技能,您仍然必须特别提及它。例如,“Alexa,请 AnyList 将面食添加到我的购物清单中”并不是与全知助手的无缝交互;它相当于学习计算机的特定语言以便正确使用它。

04即使是成功的技能也只能通过广告赚钱

最终,事实证明,最流行的 Alexa 技能有两个共同点:它们通常是简单的问答游戏,而且大多数是由一家名为 Volley 的公司制作的。从《歌曲测验》到《危险边缘》,再到《谁想成为百万富翁》和《你比五年级学生聪明吗》,Volley 是真正懂得如何让技能发挥作用的公司之一。 Volley联合创始人兼首席执行官Max Child表示,向用户展示你的技能是最重要也是最困难的部分之一。

“我认为 iOS 和 Android 应用商店如此成功的被低估的原因之一是 Facebook 广告的强大作用,”他说。为应用程序安装提供有针对性的广告的过程多年来已经完善,但语音助手还没有类似的过程。最接近的事情可能是当人们询问 Alexa 可以做什么时插入广告,但这远不及信息流广告和社交媒体信息流的有效性。 “因为你没有那种精准的营销,所以你只能做宽泛的营销,你只能做宽泛的游戏。”因此,像《危险边缘》和《百万富翁》这样的游戏已经成为流行品牌,几乎适合所有人。

Volley 赚钱的方式之一是通过订阅。例如,《危险边缘》的完整版每月费用为 12.99 美元,并且像许多现代订阅服务一样,订阅比取消要容易得多。这也是为数不多的技能货币化方式之一:开发者可以在某些技能中插入音频广告,或者像Domino那样直接要求用户填写信用卡信息,但让语音优先的用户拿起手机,翻阅设置确实门槛很高。广告只有足够大才有用——曾经有一段时间,很多媒体公司都认为“快闪简报”会大受欢迎,但它并没有按预期发展。

顺便说一下,这些 Alexa 挑战没什么特别的。移动应用商店也面临着类似的上线问题、变现问题​​、急需优化的订阅模式等等。只是有了 Alexa,解决方案应该是那么令人向往:你不需要、也不应该需要一个应用程序店铺。只需说出您的需求,Alexa 就会帮助您完成。

十年后,看来全能的语音AI可能确实很难实现。这几乎是一个悖论:

如果亚马逊可以让一切变得无缝和快速,你甚至不需要知道你正在与第三方开发者交互,披萨可以神奇地出现在你的家门口,这会产生巨大的隐私问题,也会引起疑问关于亚马逊如何选择服务提供商;

如果允许用户自己选择所有这些默认设置,则意味着每个新用户都要做大量繁琐的“设置”工作。这将破坏 Alexa 最初的简单性和吸引力。过度简化和抽象也可能会产生问题。

05 大模特可能是 Alexa 真正成功的唯一希望

然而,我们目前正处于一个转折点。十年后,Alexa 在两个方面发生了变化。一方面有好消息,另一方面也可能有坏消息。

好消息是,Alexa 不再只是一种语音,甚至不再只是一种基于语音的体验——随着 Echo Show 和 Fire TV 设备的流行,越来越多的人开始在带屏幕的设备旁边与 Alexa 进行交互。这可能会解决交互中的许多问题,并为开发人员提供向用户展示其技能的新方法。当 Alexa 可以显示内容时,它可以做更多事情。

另一个好消息是技术正在逐渐迎头赶上。大型语言模型和生成式人工智能有望使我们与 Alexa 的对话更加自然。去年,亚马逊宣布正在开发由大型语言模型(LLM)驱动的新 Alexa。这个 Alexa 将更加主动和对话,而不是像现在那样单一和命令式。更智能、由人工智能驱动的 Alexa 真正理解您想要做什么,不再需要笨重的语法来使用技能。它可以理解更复杂的问题和多步骤说明并代表您使用技能

这无疑是一个很大的进步。尽管生成式人工智能有潜力让语音助手变得更加智能,但它并不是包治百病的灵丹妙药。大型语言模型解决了“理解语言”的问题,但还无法在理解语言的基础上采取实际行动,更不用说LLM幻觉可能带来的风险了。

Alexa 要真正成为一个像“计算机”一样的存在,它需要具有上下文感知能力。为了有效地工作,全知语音助手必须完全了解您、您的家以及家中的所有人员和设备。这是一项相当复杂的任务。虽然 Echo 扬声器中的超声波技术和智能家居传感器可以提供一些背景信息,但亚马逊在一个关键领域明显落后于竞争对手:你。

与谷歌和苹果不同,它们可以通过您的智能手机、日历、电子邮件甚至互联网搜索访问您的个人数据。除了您在其商店购买的商品或您允许其获取的数据外,亚马逊对您的私人生活知之甚少。而且,亚马逊在隐私保护方面的失误也让很多人对其失去了信任。

不过,谷歌和苹果在智能家居领域仍不具备市场主导地位。尽管他们也在积极进入这一领域,但Alexa仍然拥有相当大的先发优势。据亚马逊称,“新Alexa”可以完成列出任务创建的多步骤动作。添加有关您家里的人、他们的位置以及他们需要做什么的信息,Alexa 可以通过简单的命令完成如下任务:

Alexa,提醒我儿子不要忘记他的科学项目;当他离开时设置闹钟。下午 4 点打开后门让水管工进来,下午 5 点再次锁上。下午6点将烤箱预热到375度,如果我迟到了,自动调整时间。

这种功能将为 Alexa 带来全新的实用性,甚至可能足以让亚马逊对其收费,这是其计划的一部分。

尽管去年宣布将聘请法学硕士助理,但我们还没有听到任何后续消息。亚马逊甚至跳过了今年的年度硬件活动,该活动通常会展示数十种新的 Alexa 和兼容 Alexa 的设备和服务。据报道,这很可能是因为亚马逊距离交付其承诺的“新 Alexa”还很远。

亚马逊必须完成对 Alexa 的改造,否则苹果和谷歌很快就会超越它。

亚马逊于 2014 年为家庭语音控制奠定了基础,并在过去十年为智能家居铺平了道路。如今,Alexa 是最受欢迎的智能音箱语音助手,控制着美国三分之二的市场。在家庭以外的移动设备上,谷歌的 Assistant 和苹果的 Siri 占据主导地位。随着两家公司加大在智能家居领域的投入,并逐步将Apple Intelligence、Gemini等智能技术带入家居产品,Alexa的主导地位或将面临挑战。

实现由生成式AI驱动的情境感知智能家居并不容易且充满挑战,但凭借其丰富的经验和积累,亚马逊似乎是最有希望实现这一目标的公司——前提是它能够克服自身的障碍。家庭是技术的最后前沿,现在是 Alexa 勇敢向前迈出一步,开创语音助手新时代,真正成为智能助手的时候了。

还有证据表明,亚马逊在 AI 领域可能处于落后状态,插入语言模型并不一定能让 Alexa 立即强大。 (即使是最好的法学硕士在完成这些任务时仍然感到不满意。)但即便如此,这给我们带来了一个更大的问题:虚拟助手实际上能为我们做什么?我们怎样才能让他们帮忙呢?

答案应该是“任何你想做的事”和“任何你喜欢的方式”。这意味着需要大量的开发者为Alexa赋能。而这也需要亚马逊提供足够有价值的产品和商业机会,值得他们付出努力。

06 Alexa Grave:那些 Dead Echo 硬件产品

The Verge 还梳理了亚马逊推出的一系列失败/停产的 Echo 硬件产品,从相机到微波炉,没错,就是微波炉。

回声外观

亚马逊失败的原因__亚马逊失败了我不后悔

Echo Look 是亚马逊最奇特、最具争议的 Echo 设备之一,它可以拍摄穿着各种服装的用户的全身照片和视频。售价 199.99 美元,已于 2020 年停产。

2017 年没有人需要它。现在也没有人需要它。

亚马逊水龙头

亚马逊失败了我不后悔__亚马逊失败的原因

Tap 是亚马逊首款智能音箱,可以断开 Alexa 与电源插座的连接,但需要 Wifi 连接。 2016 年推出,2018 年停产,售价 130 美元。

亚马逊应该复活它吗?是的,并非所有设备都需要一直监听。

回声按钮

_亚马逊失败的原因_亚马逊失败了我不后悔

Echo Buttons是新系列“Alexa小工具”中的第一款,是无线曲棍球形状的蜂鸣器,可用于通过Echo智能扬声器玩单人或多人益智游戏。它的售价为 19.99 美元,于 2017 年首次亮相,但从未真正作为游戏设备流行起来,几年后就停产了。

亚马逊应该复活它吗?不,我们有更好的游戏方式。

回声点

_亚马逊失败了我不后悔_亚马逊失败的原因

Echo Spot 是一个 2.5 英寸的圆形屏幕,可用于视频通话,但它最好作为床头柜上的智能闹钟。但对于那些担心隐私的人来说,也可以禁用相机。它于 2019 年停产,但于 2024 年以不带摄像头的 Echo Spot 重新推出。

亚马逊应该复活它吗?它已经从死里复活了。

回声连接

亚马逊失败的原因__亚马逊失败了我不后悔

2017年,Echo Connect问世,几年后就停产了。该设备将 Echo 的呼叫功能扩展到实际的电话号码,而不仅仅是与 Echo 设备通信。当插入电话插孔时,小黑盒会将 Echo 智能扬声器变成可以拨打固定电话号码(包括 911)的扬声器。

亚马逊应该复活它吗?是的,如果只是为了我们的祖父母。

回声加

亚马逊失败的原因__亚马逊失败了我不后悔

最初于 2014 年推出,2018 年发布了更新版本,最终于 2020 年停产。Echo Plus 包括重新设计的扬声器,希望成为一站式智能家居中心。支持 Zigbee,但不支持 Z-Wave。

亚马逊应该复活它吗?不,还有更好的智能家居解决方案。

回声挂钟

亚马逊失败了我不后悔_亚马逊失败的原因_

2018 年发布的 Echo 挂钟没有麦克风,而是被设计为 Echo 智能音箱的配件,使用一圈 LED 来显示当前时间和运行计时器的进度。亚马逊后来与迪士尼合作推出了米老鼠版本的时钟,而西铁城则推出了替代设计。

亚马逊应该复活它吗?不,它的用处有点太有限了。

亚马逊Basics微波炉

_亚马逊失败了我不后悔_亚马逊失败的原因

虽然它没有自己的麦克风或扬声器,但售价 59.99 美元的 AmazonBasics Microwave 旨在连接到您家中现有的 Echo 设备,因此您可以要求 Alexa 用您的声音加热土豆或一袋爆米花,而无需浏览烤箱。在烹饪预设菜单上,并在闻到烧焦的味道时停止使用语音命令。首次亮相四年后,微波炉就停产了。

亚马逊应该复活它吗?不,但我们会带一个配备 Alexa 的空气炸锅。

回声输入

亚马逊失败的原因__亚马逊失败了我不后悔

Echo 输入是一款小型冰球形适配器,可使用音频线或蓝牙为现有扬声器和音频设置带来音乐流功能和对 Amazon Alexa 的访问。它于 2018 年首次亮相,但考虑到其他 Echo 产品也可以连接到现有扬声器,输入是多余的,最终被停产。

亚马逊应该复活它吗?不。

Echo Link 和 Echo Link 放大器

亚马逊失败了我不后悔__亚马逊失败的原因

Echo Link 和 Echo Link Amp 提供具有更高质量音频流的音乐服务。售价 199.99 美元的 Echo Link 有更多输出选项,用于连接音频系统中的接收器或放大器,以及它自己的音量旋钮。售价 299.99 美元的 Echo Link Amp 还具有一个内置 60 瓦放大器,可以直接连接到扬声器。但几年后它们就停产了。

亚马逊应该复活它吗?不,买一个Sonos。

带时钟的回声点

亚马逊失败了我不后悔_亚马逊失败的原因_

到 2019 年,紧凑型 Echo Dot 已成为亚马逊上最畅销的产品之一,带时钟的 Echo Dot 配有四位七段 LED 显示屏,用于显示时间、天气和计时器等信息。 2020 年更新为球形设计,2022 年更新为改进型 LED 点阵显示屏。带有时钟的 Echo Dot 于 2024 年停产,取而代之的是带有全彩 LCD 显示屏的 Echo Spot 的复兴。

亚马逊应该复活它吗?是的,并非所有设备都需要屏幕。

回声循环

亚马逊失败的原因_亚马逊失败了我不后悔_

亚马逊的 Echo Loop 智能戒指于 2019 年首次亮相,是一款小型可穿戴 Echo 智能扬声器。用户可以用手与 Alexa 进行交互。尽管 Echo Loop 允许进行离散交互,但它的电池寿命有限,价格昂贵,售价为 179.99 美元,而且它的扬声器有时太安静而无法真正听到。一年后,亚马逊停止了 Echo Loop。

亚马逊应该复活它吗?不,智能戒指有更好的用途。

回声柔性

亚马逊失败的原因__亚马逊失败了我不后悔

Echo Flex 于 2019 年首次亮相,售价 24.99 美元。这款微型智能扬声器可直接插入墙壁插座,其功能可通过模块化配件进行扩展,包括夜灯、运动传感器和数字时钟。声控智能助手只有在距离您足够近的情况下才能听到您的声音。它最终将于 2023 年停产。

亚马逊应该复活它吗?是的,但集成了模块化配件的所有功能。

本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/271185.html

联系我们

在线咨询:点击这里给我发消息

微信号:13588888888

工作日:9:30-18:30,节假日休息