为了评估其有效性,研究人员将他们的方法与没有自我调节学习的同一算法的两个版本进行了比较。第一个版本(基本)使用固定的旋转和平移值。默认设置迭代成功后进度参数增加的次数。在第二个版本(最接近)中,更新了进度参数,以便在每个时间点将轨迹上距离龙最近的点用作子任务。
该表显示了模型的比较。为了进行评估,使用用户和模拟轨迹之间的平均距离(越小越好)。最大值也显示在括号中。每个动作的最低数字以粗体显示。星号表示该技能已成功掌握。
请注意,无法比较这些模型的奖励指标,因为 SRL 算法可能会改变赚取奖励的方式。相反,作者测量了龙模型跟踪轨迹的仔细程度:使用动态时间扭曲(DTW)对用户指定的路径和生成的路径进行比较。
未来,研究人员希望探索将 SRL 应用到不一定涉及子任务生成的一般监督学习任务的可能性。飞行方面,计划提高虚拟模型的灵活性、适应性和可控性。作者希望他们的龙能够适应负载、风和其他形式干扰的变化。与其他具有不寻常身体和翅膀形状的奇异生物一起工作也会很有趣。
原文可以在首尔国立大学研究实验室网站上找到。
最后,一些重要的参数:
在每个卷积层之后,使用批量归一化。
新元 + 动量 0.9。
学习率为0.1,当误差变化率衰减时除以10。
迷你包装尺寸 – 256。
权重的衰减为 1e−5。
不使用 Dropout。
ResNet架构
ResNet 的实验结果表明,非常深的网络确实可以在不降低准确性的情况下进行训练。神经网络在分类任务中实现了最小的误差,甚至超过了人类的结果。
还有一点
卷积架构的改进还没有结束——新版本的 ResNet 已经出现,取得了更好的结果(Wide ResNet和ResNeXT)。 2017年,深度神经网络FractalNet被引入,其中不再有残差连接。相反,使用更复杂的结构,类似于分支树。
分形网络架构
CNN 不断发展并积极用于图像分类任务。
现在尝试自己练习和编写训练神经网络和 CNN 的代码。您将需要 Python > 3.6 和 Jupyter Notebook 或 Jupyter Lab 环境。作业包括我们在过去几堂课中学到的材料:实现反向传播、优化、批量归一化、Dropout 和训练卷积神经网络。您只能选择那些对您来说最有用和最有趣的练习。所有说明和必要的文件都可以从这里下载。
反馈收集:使用手机号码进行调查并收集客户反馈改进服务产品和产品开发。忠诚度计划:制定基于移动的忠诚度计划,奖励重复购买的客户,通过激 电话号码库 励参与提高留存率。基于位置的营销利用与手机号码关联的 数据进行特定位置的促销,提高相关性并吸引客流量到实体店。
我们研究了流行的卷积架构并熟悉了它们的结构。一定要完成实际任务:它将让你更深入地了解学习神经网络的过程并从内部观察它。如果您遇到任何困难,请随时在评论中提出问题 – 我们一定会回答。
下次我们将讨论循环神经网络
以下讲座(列表将在材料可用时更新):
作者描述了两种体验:称为“绿野仙踪”(WOZ) 的交互式用户培训,以及根据参与者的请求、响应和反馈自动预测首选对话风格。
嘿 Siri,你好吗?
苹果研究人员建议,与模仿你沟通方式的数字助理互动会增加你对它的信任。他们还检查了健谈的人是否更喜欢与健谈的对话者互动,而安静的人是否更喜欢与沉默的对话者互动。参与者完成了一份调查问卷,旨在评估他们的健谈水平和其他性格特征(以识别外向和内向的人)。这使得可以根据某些特征选择平衡的用户组。之后,每位参与者完成了有关语音助手使用情况的调查(使用频率、请求类型、交互方式、可靠性、吸引力等)。
实验分为三个交互阶段:
和一个健谈的助理;
和一个沉默寡言的助理;
带有数字反射器助手。
在所有情况下,数字助理 手机号码列表 都由“向导”(即实验者)控制,指示他不要直接与参与者互动。如果你还记得童话《绿野仙踪》,巫师与主角的交流大致是这样的:他以不同的形式出现在他们面前,但没有表现出自己。
在实验过程中,作者记录了每个参与者的音频和视频。受试者坐在距墙壁屏幕约 2.5 米的位置。向导位于隔墙后面,控制数字助理和显示器,以及同步设备并使用 ROS 收集数据。
在谈话和非谈话条件下
参与者被指示(通过电视屏幕上的说明)向助手提出口头请求,要求其完成以下每个领域的任务:计时器/闹钟、日历/提醒、导航/方向、天气、新闻和互联网搜索。对于每个请求,屏幕上都会弹出一个文本提示,例如:“上午 8 点的闹钟”。提示故意较短,以限制相同短语的重复。
对于每个提示,助理的反应都是相同的,并且参与者之间没有差异。例如,工具提示显示:“下次会议时间。”那么长答案将是:“看来你的下一次会议是在下午 2 点,”而短答案是:“下午 2 点。”听完答案后,参与者必须口头评价其质量:好、偏离主题、信息不正确、不礼貌、粗心等。所有读数均由“向导”以文本形式记录下来。
在沉浸在交谈和安静的环境中后,参与者回答了他们最喜欢哪一个的问题。然后他们开始与反射助理互动。
反射器的行为被设计为在 WOZ 内看起来尽可能自然。与之前实验中相同的“向导”再次无形地控制着 新形式”是新常态:印度手工艺经济的创新经验 这个过程。请注意,在前两个实验中,他不必评估反应的发展程度,因为它是根据情况默认设置的。在这里,他的作用恰恰是对助理的每一次发言的“健谈程度”进行评估。
问题是什么就是答案
为了产生自然的对话,参与者被要求扮演一个“晚上出去”的场景,包括与朋友见面、去剧院和吃晚饭。 “向导”通过鼓励用户使用图像(下图中的示例)进行查询来推动故事发展,而不使用文本提示。
这些图片涉及想象中的晚上事件,图标指示参与者应该使用哪些辅助功能(例如,衣服图片上方有一个天气图标)。每条线索的可能答案都是固定的,而健谈的程度是由巫师选择的。以下是天气查询的响应示例(按闲聊程度从高到低的顺序排列):
23,好吧
气温会是23度,好吧。
天气温暖,气温为 23 度,天空晴朗。
应该是23度,天气晴朗,所以不用带毛衣。
我的消息来源说气温将是 23 度,天气晴朗。你绝对不需要带夹克。
就像在说话和沉默的情况下一样,参与者对助理的每个回答进行评分。完成测试后,他们再次回答了有关其吸引力和可靠性的问题。