您可以信赖的 Apple 语音助手

Rate this post

我们更加信任那些与我们沟通起来轻松愉快的人。当他们的风格和说话方式与我们相似时，通常会发生这种情况。这一事实促使苹果公司创建了一款语音助手，该助手考虑了用户偏好的沟通方式，从而激发了信任。今天我们将告诉你这个实验的结果。

数字助理变得越来越先进

并应用于生活的不同领域。但是，你看，在某些情况下，对我们来说重要的不仅仅是拥有一名助手，而是对他和他的能力的信任程度。例如，病人希望确保程序能够正确提示他在特定时间服用正确的药物。

在人际关系中，人们使用特定类型的行为来建立相互理解。其中之一就是“反思”，即我们模仿对方的沟通方式，例如姿势、语调或面部表情。这种现象也被称为模仿、社会共鸣、协调、同步、调谐、变色龙效应等。苹果公司建议，增加对数字助理信任的有效方法是反映请求的对话风格，特别是他们的“喋喋不休”程度。为了验证他们的假设，他们对用户进行了一项研究，发现人们更喜欢与与他们更相似的助手进行交流。

为什么和为什么

如上所述，人们可以通过模仿对话者的行为来赢得初步信任。反思有助于确定人与人之间互动的定性衡量标准，其程度表明相互理解的自然程度。这些特征在人机交互、机器人和机器学习领域引起了越来越多的兴趣。例如，反思过程用于预测多人之间的对话将导致的对话主题。这样的系统通常结合对话者的行动序列并尝试预测他们的陈述。

在机器人技术中

反射可以用来教机器人人类语言。通过观察人们，他们将学会模仿他们的行为并与他们平等地交流。这种方法已被用来开发社交机器人。对于残疾人来说，拥有帮助他们康复和融入公共生活的条件非常重要。

在当代商业环境中，有效沟通行业电邮清单对于培养关系和推动增长至关重要。在各种可用工具中，行业电子邮件列表已成为旨在增强营销工作和推广能力的组织的战略资产。这些精选列表通常包含特定行业内个人和企业的联系信息，为营销活动提供有针对性的方法。

实验
作者描述了两种体验：称为“绿野仙踪”(WOZ) 的交互式用户培训，以及根据参与者的请求、响应和反馈自动预测首选对话风格。

嘿 Siri，你好吗？

苹果研究人员建议，与模仿你沟通方式的数字助理互动会增加你对它的信任。他们还检查了健谈的人是否更喜欢与健谈的对话者互动，而安静的人是否更喜欢与沉默的对话者互动。参与者完成了一份调查问卷，旨在评估他们的健谈水平和其他性格特征（以识别外向和内向的人）。这使得可以根据某些特征选择平衡的用户组。之后，每位参与者完成了有关语音助手使用情况的调查（使用频率、请求类型、交互方式、可靠性、吸引力等）。

实验分为三个交互阶段：

和一个健谈的助理；
和一个沉默寡言的助理；
带有数字反射器助手。
在所有情况下，数字助理都由“向导”（即实验者）控制，指示他不要直接与参与者互动。如果你还记得童话《绿野仙踪》，巫师与主角的交流大致是这样的：他以不同的形式出现在他们面前，但没有表现出自己。

在实验过程中，作者记录了每个参与手机号码列表者的音频和视频。受试者坐在距墙壁屏幕约 2.5 米的位置。向导位于隔墙后面，控制数字助理和显示器，以及同步设备并使用 ROS 收集数据。

在谈话和非谈话条件下

参与者被指示（通过电视屏幕上的说明）向助手提出口头请求，要求其完成以下每个领域的任务：计时器/闹钟、日历/提醒、导航/方向、天气、新闻和互联网搜索。对于每个请求，屏幕上都会弹出一个文本提示，例如：“上午 8 点的闹钟”。提示故意较短，以限制相同短语的重复。

对于每个提示，助理的反应都是相同的，并且参与者之间没有差异。例如，工具提示显示：“下次会议时间。”那么长答案将是：“看来你的下一次会议是在下午 2 点，”而短答案是：“下午 2 点。”听完答案后，参与者必须口头评价其质量：好、偏离主题、信息不正确、不礼貌、粗心等。所有读数均由“向导”以文本形式记录下来。

在沉浸在交谈和安静的环境中后，

参与者回答了他们最喜欢哪一个的问题。然后他们开始与反射助理互动。

反射器的行为被设计为在 WOZ 内看起来尽可能自然。与之前实验中相同的“向导”再次无形地控制着这个过程。请注意，在前两个实验中，他不必评估反应的发展程度，因为它是根据情况默认设置的。在这里，他的作用恰恰是对助理的每一次发言的“健谈程度”进行评估。

问题是什么就是答案
为了产生自然的对话，参与者被要求扮演一个“晚上出去”的场景，包括与朋友见面、去剧院和吃晚饭。 “向导”通过鼓励用户使用图像（下图中的示例）进行查询来推动故事发展，而不使用文本提示。

这些图片涉及按行业分类的特定数据库联系人列表想象中的晚上事件，图标指示参与者应该使用哪些辅助功能（例如，衣服图片上方有一个天气图标）。每条线索的可能答案都是固定的，而健谈的程度是由巫师选择的。以下是天气查询的响应示例（按闲聊程度从高到低的顺序排列）：

23，好吧。
气温会是23度，好吧。
天气温暖，气温为 23 度，天空晴朗。
应该是23度，天气晴朗，所以不用带毛衣。
我的消息来源说气温将是 23 度，天气晴朗。你绝对不需要带夹克。
就像在说话和沉默的情况下一样，参与者对助理的每个回答进行评分。完成测试后，他们再次回答了有关其吸引力和可靠性的问题。

结果

共有 20 人（3 名女性和 17 名男性）参与了这项研究；会议持续时间从 17 分钟到 56 分钟不等。大多数人（70%）选择了社交助理。据初步调查，60%的参与者比较健谈，40%的人不太善于交际。这表明沟通风格并不总是表明对话者必须完全遵守它。但总体而言，外向的参与者更喜欢健谈的助手，而内向的参与者则更喜欢沉默寡言的助手。

使用单向方差分析来检验反思对助理吸引力判断的影响。作者比较了研究前（平均值 = 4.0，标准差 = 0.48）和研究后（平均值 = 4.46，标准差 = 0.31）参与者的信任评级。用户被要求按照七点李克特量表对他们喜欢或不喜欢与助手互动的说法表示同意程度（1 – 完全不喜欢，4 – 中立，7 – 非常喜欢）。交互前后平均得分之间的差异具有统计学意义（f-measure = 7.12，p ≤ 0.01）。这意味着反思对信任有积极的影响。

研究结束后，参与者分享了评论并指出他们更喜欢反射助手。因此，作者开始构建分类器来确定用户的语音特征是否可以用于设置适当的健谈水平。