老罗的AI交互逻辑,为什么那么不合时宜?

    如果我想告诉你,你衬衫上有一个污点,我不会用这样的语言来描述:“距离你衬衫领子下方14厘米,扣子左侧3厘米处,有一个污点。”如果衬衫上有污点,我会直接指着它说:“污点在那儿”。指点是众所周知的方式。我们对此做过很多研究和测试,而且在所有功能上,都要快得多。

    参加过或者网上观摩过昨晚锤子科技鸟巢新品发布会,对于老罗引用的乔布斯的这段话不会感到陌生。但是很少有人会较真地找出乔布斯的原话。1984年,乔布斯在接受《花花公子》的采访,回答“多数电脑都使用键盘输入指令,但是Macintosh用所谓的鼠标来替换了很多指令。这对于习惯键盘的人而言,是一大改变。为什么要用鼠标?”时有了如上一段话。但乔布斯并没有止于这段话。他举例表示,“例如,利用鼠标复制和粘贴。所以,这不仅仅是更为易用,效率也会更高。”在当时的环境下,乔布斯的鼠标仍遭到质疑,对于习惯键盘的人来说,这似乎不可思议。如今,老罗借用乔布斯当初的话,想要革掉的却是乔布斯当初坚持的鼠标、以及键盘的命。这为整场发布会多少增添了些许意味。

    老罗或许认认真真读过当年那场访谈。当年《花花公子》向乔布斯询问,“有什么实实在在的理由让我们购买一台电脑?”乔布斯的回答是,“对不同的人,有不同的答案。在商业领域,这个问题很容易回答:你能够以更快的速度和更高的质量准备文档,你可以做很多事情来提升办公效率。”在昨晚的那场发布会上,“提升Excel200%的工作效率”、“提升幻灯片1400%的工作效率”,效率的提升成为了老罗口中时时重复的关键词。


    在VR/AR/MR还要迎来数十年发展时间才可能成为下个计算平台的时候,老罗坐不住了,并试图重新定义下一个十年的个人电脑。甚至,重新定义的方式也来自试图击败并已经在言语上击败的竞争对手苹果。现场老罗不无嘲讽地表示全盘语音交流的交互方式是误入歧途,“Siri 和模仿者们一开始的方向就是错的。”而老罗给出的解决方案则是,在乔布斯的“指点”启发下,充分利用人工智能语音交互技术:语音+指点成为了老罗的不传之秘。

    这一交互逻辑完整地体现在了坚果TNT工作站Smartisan OS 6.66操作系统中。工作站具备的3大交互功能TNT、Crystal Ball 水晶球、Poker Dealer 发牌手,都建立在语音+指点之上。而其中TNT功能显然更像是语音+指点的化身。

    为了让这套交互功能完美呈现,老罗找来了科大讯飞、三角兽提供语音解决方案,找到永中软件推出Office套件。其实视频是最能表现这种交互方式的,但在此处我们以Gif加文字的方式进行说明。虽然有着业界大佬站台,但老罗的演示现场还是出了意外,一度陷入令人尴尬的Bug中。直到顶住压力尝试才有了如下的结局。简单来说,所谓TNT就是在需要操作的地方按下说话,工作站会对识别到的语音信息转换成文字后进行录入。因为是工作站,又为办公而生,所以Excel、PPT、Word成为了老罗瞄准的对象。也是在这一演示过程中,效率的提升的描述不断出现。可以说,老罗的出发点似乎与当初乔布斯如出一辙,至少想要在商业领域提升办公效率。

    但是,发布会还没有结束,提升办公效率的TNT便成为了一个笑话。“安静,吵到我用TNT了”表情包成为了一道独特的风景线。原因也藏在现场演示中。最初演示识别错误出现Bug时,当负责人表示是因为周围太吵,老罗还责备了他并表示观众很安静。但在随后的演示中,当演示再次出现失误时,老罗则以“嘘”的一声要求观众安静。这让人们对TNT工作站工作所需环境有了怀疑。对此我们也感到困惑,既然锤子R1能够做到AI降噪功能,在酒吧小声打电话也能被清晰地听见,那么TNT为什么会识别失败呢?到底是演示场景(万人会场)的复杂环境导致的失败,还是设备本身造成的失败?表情包指向的并不只是老罗这个单一的动作,而是矛盾之处。老罗的工作站采用语音+指点的方式提升办公效率,但是另一方面却要求安静的环境,这多少有些矛盾。难道这个工作站是提供给在格子间中办公或者有着独立办公室的人使用的?

    另一方面,智能音箱的存在与大热证明了语音交互方式的可行。但是锤子TNT工作站语音+指令的方式却需要消费者花费新的时间成本去学习。对于习惯了鼠标加键盘的人来说,人们此刻面临的处境,似乎又回到了乔布斯当初面临的问题:为什么要用鼠标?如果说乔布斯还可以回答复制、粘贴提升工作效率,那老罗又该如何回答呢?

    毕竟有时候需要面临的表格数据,并不单单只是5行10行,而是上千行。到时能指望工作站发挥用处吗?还是说这些可能是隐私的数据都需要一个一个吼出来?那时使用鼠标、键盘的人可能早已下班了。即便老罗表示,为了照顾目前的人群,仍旧提供鼠标键盘,希望它们被废弃。但假设人们都使用鼠标键盘了,TNT似乎仅仅成了一项备选功能。那么传说中的革鼠标、键盘的命又在哪里?效率的提升不止与TNT有关,还与水晶球预测功能有关,比如弹出备选项目,提前寻找相关主题内容图片等。但锤子科技演讲的重点,显然落在了语音+指点之上,并试图借此革命。现在看来,似乎没有革命,有的只是革新。而代价则是需要配合低配版3499远的R1手机使用的9999元的坚果TNT工作站,或者14999元的整套方案的TNT工作站。

    如果当初乔布斯还可以表示,“一台电脑可以将人们从很多琐碎的工作中解放出来。除此之外,你为他们提供了一个鼓励创作的工具。记住,电脑是工具,工具可以帮助我们更好地工作。”鼠标的出现帮助了复制、粘贴的简便操作。那么坚果TNT工作站想好如何回答了吗?想好自己的受众人群了吗?9999元的拓展坞会是人们热衷的革新对象吗?如果全盘语音化的方案是错的,如果语音+指点的方案也不现实,那AI交互方案又在哪里?

    回复