现在注册

登录

忘记密码

忘记密码? 请输入您的电子邮件地址. 您将收到一个链接,将创建通过电子邮件新密码.

添加后

你必须登录后添加 .

添加问题

您必须登录才能提问.

登录

现在注册

欢迎Scholarsark.com! 您的注册将授予您访问使用该平台的更多功能. 你可以问问题, 做出贡献或提供答案, 查看其他用户以及更多的个人资料. 现在注册!

LinkedIn 技能评估答案和问题 — 机器学习

机器学习 是当今就业市场上最受欢迎的技能之一. 但如何才能证明自己的专业知识并在人群中脱颖而出? 一种方法是采取 领英技能评估 对于 学习 并在您的个人资料中展示您的结果.

在这篇博文中, 我将与您分享一些 问题答案 来自 评估, 以及一些取得成功的提示和技巧. 无论您是在准备考试还是只是想刷新知识, 这篇文章将帮助您了解更多 学习 及其应用.

第一季度. 您是为一家全国性快餐连锁店工作的数据科学团队的一员. 您创建一个显示趋势的简单报告: 经常光顾商店并购买少量餐食的顾客比不经常光顾商店并购买大量餐食的顾客花费更多. 您的团队创建的最有可能的图表是什么?

  • 多类分类图
  • 线性回归和散点图
  • 数据透视表
  • K-means 聚类图

Q2. 您在一家向大公司销售垃圾邮件过滤服务的组织工作. 您的组织希望将其产品转变为使用机器学习. 目前它是一个列表 250,00 关键词. 如果邮件包含多个这些关键字, 然后就被识别为垃圾邮件. 过渡到机器学习的优势之一是什么?

  • 该产品将寻找垃圾邮件中的新模式.
  • 该产品可以更快地浏览关键字列表.
  • 该产品可能有更长的关键字列表.
  • 该产品可以使用更少的关键字来查找垃圾邮件.

Q3. 您在音乐流媒体服务公司工作,希望使用监督机器学习将音乐分类为不同的流派. 您的服务收集了每种流派的数千首歌曲, 你用它作为你的训练数据. 现在,您从服务中的所有歌曲中随机抽取一个小子集. 这个子集叫什么?

  • 数据集群
  • 监督组
  • 大数据
  • 测试数据

第四季度. 在传统的计算机编程中, 你输入命令. 你通过机器学习输入什么?

  • 模式
  • 程式
  • 规则
  • 数据

Q5. 贵公司想要预测现有汽车保险客户是否更有可能购买房主保险. 它创建了一个模型,可以更好地预测有关房主保险的最佳客户联系方式, 该模型方差低但偏差高. 这对数据模型意味着什么?

  • 一直都是错误的.
  • 这是不一致的错误.
  • 这是一贯正确的.
  • 同样是对的,也是错的.

参考

Q6. 您想要确定可能受到气候变化影响的全球天气模式. 要做到这一点, 您想要使用机器学习算法来查找人类气象学家无法察觉的模式. 从哪里开始?

  • 查找晴天的标记数据,以便机器学习识别恶劣天气.
  • 使用无监督学习让机器在海量天气数据库中查找异常情况.
  • 创建一组异常模式的训练集,并要求机器学习算法对它们进行分类.
  • 创建正常天气的训练集并让机器寻找相似的模式.

Q7. 您在一个数据科学团队中工作,该团队希望通过在朴素贝叶斯结果上运行来提高其 K 最近邻结果的准确性. 这是什么例子?

  • 回归
  • 提升
  • 套袋
  • 堆叠

Q8. ____ 查看预测因素和结果之间的关系.

  • 回归分析
  • K-均值聚类
  • 大数据
  • 无监督学习

Q9. 机器学习系统的商业应用示例是什么?

  • 数据输入系统
  • 数据仓库系统
  • 海量数据存储库
  • 产品推荐系统

辅酶Q10. 这张图说明了什么?

机器学习 Q10

  • 决策树
  • 强化学习
  • K-最近邻
  • 清晰的趋势线

Q11. 您在一家拥有数十万个电表的电力公司工作. 这些仪表连接到互联网并实时传输能源使用数据. 您的主管要求您指导项目使用机器学习来分析此使用数据. 为什么机器学习算法在这种情况下是理想的?

  • 这些算法将帮助仪表访问互联网.
  • 该算法将改善无线连接.
  • 这些算法将帮助您的组织了解数据模式.
  • 通过使用机器学习算法, 您正在创建一个 IoT 设备.

Q12. 预测数量值. 采用 ___.

  • 回归
  • 聚类
  • 分类
  • 降维

Q13. 朴素贝叶斯为什么被称为朴素贝叶斯?

  • 它天真地假设你没有数据.
  • 它甚至不尝试创建准确的预测.
  • 它天真地假设预测变量是相互独立的.
  • 它天真地假设所有预测变量都相互依赖.

Q14. 您在一家冰淇淋店工作并创建了下面的图表, 显示了室外温度与冰淇淋销量之间的关系. 这张图表的最佳描述是什么?

机器学习 Q14

  • 这是一个线性回归图.
  • 这是一个受监督的趋势线图.
  • 它是一棵决策树.
  • 这是一个聚类趋势图.

Q15. 机器学习与人工智能有何关系?

  • 人工智能聚焦分类, 而机器学习是关于数据聚类的.
  • 机器学习是一种依靠数据学习的人工智能.
  • 人工智能是无监督机器学习的形式.
  • 机器学习和人工智能是同一件事.

Q16. 机器学习算法如何做出更精确的预测?

  • 这些算法通常运行在更强大的服务器上.
  • 算法更善于发现数据中的模式.
  • 机器学习服务器可以托管更大的数据库.
  • 该算法可以在非结构化数据上运行.

Q17. 您在保险公司工作. 哪个机器学习项目将为公司增加最大价值?

  • 创建一个托管公司目录的人工神经网络.
  • 使用机器学习更好地预测风险.
  • 创建一种算法,将所有 Excel 电子表格整合到一个数据湖中.
  • 使用机器学习和大数据研究薪资要求.

Q18. 这张图中缺少什么信息?

机器学习 Q18

  • 训练集
  • 无监督数据
  • 监督学习
  • 二元分类

Q19. 训练集和测试集不使用相同数据的原因之一是什么?

  • 几乎肯定你会欠拟合模型.
  • 你会选择错误的算法.
  • 您可能没有足够的数据来处理这两个问题.
  • 你几乎肯定会过度拟合模型.

Q20. 您的大学希望使用机器学习算法来帮助对收到的学生申请进行分类. 管理员询问招生决定是否可能对任何特定群体存在偏见, 比如女人. 最好的答案是什么?

  • 机器学习算法基于数学和统计学, 所以根据定义将是公正的.
  • 无法识别数据中的偏差.
  • 机器学习算法足够强大,可以消除数据中的偏差.
  • 所有人类创建的数据都有偏见, 数据科学家需要考虑到这一点.

解释: 虽然机器学习算法没有偏见, 数据可以有它们.

Q21. 什么是堆叠?

  • 一个模型的预测成为另一个模型的输入.
  • 您使用不同版本的机器学习算法.
  • 您使用多种机器学习算法来提高结果.
  • 您将训练集和测试集堆叠在一起.

Q22. 您想要创建一个监督机器学习系统来识别社交媒体上小猫的图片. 去做这个, 您已收集超过 100,000 小猫的图像. 这个图像集合叫什么?

  • 训练数据
  • 线性回归
  • 大数据
  • 测试数据

Q23. 您正在开展一个项目,该项目涉及将不同狗的图像聚集在一起. 您拍摄图像并将其识别为质心图像. 您使用什么类型的机器学习算法?

  • 质心强化
  • K-最近邻
  • 二元分类
  • K-均值聚类

解释: 问题明确指出 “聚类”.

Q24. 您的公司希望您构建内部电子邮件文本预测模型,以加快员工撰写电子邮件的时间. 你该怎么办?

  • 包括所有员工的培训电子邮件数据.
  • 包括新员工的培训电子邮件数据.
  • 包括经验丰富的员工的培训电子邮件数据.
  • 包括撰写大部分内部电子邮件的员工的培训电子邮件数据.

Q25. 您的组织允许人们创建在线职业档案. 一个关键功能是能够创建彼此专业联系的人员集群. 使用什么类型的机器学习方法来创建这些集群?

  • 无监督机器学习
  • 二元分类
  • 监督机器学习
  • 强化学习

Q26. 这张图是一个很好的例子?

机器学习 Q26

  • K-最近邻
  • 决策树
  • 线性回归
  • K-means 聚类

注意: 存在簇中心 (二氧化碳, C1, C2).

Q27. 随机森林是早期技术的修改和改进版本?

  • 聚合树
  • 增强树
  • 袋装树
  • 堆积的树木

Q28. 自组织映射是专门用于机器学习类型的神经网络?

  • 半监督学习
  • 监督学习
  • 强化学习
  • 无监督学习

Q29. 关于 K 均值聚类的哪种说法是正确的?

  • 在 K 均值聚类中, 初始质心有时是随机选择的.
  • K-means 聚类常用于监督机器学习.
  • 簇的数量始终是随机选择的.
  • 准确地说, 你希望你的质心在集群之外.

Q30. 您创建了与其环境交互并对错误和奖励做出响应的机器学习系统. 它是什么类型的机器学习系统?

  • 监督学习
  • 半监督学习
  • 强化学习
  • 无监督学习

Q31. 您的数据科学团队必须构建一个二元分类器, 第一个标准是部署时最快的得分. 它甚至可以实时部署. 哪种技术将生成一个模型,该模型对于部署团队用于新案例来说可能是最快的?

  • 随机森林
  • 逻辑回归
  • 克尼恩
  • 深度神经网络

Q32. 您的数据科学团队想要使用 K 最近邻分类算法. 您团队中的某人想要使用 K 25. 这种方法面临哪些挑战?

  • 较高的 K 值会产生噪声数据.
  • 较高的 K 值会降低偏差,但会增加方差.
  • 较高的 K 值需要较大的训练集.
  • 较高的 K 值会降低方差,但会增加偏差.

Q33. 您的机器学习系统正在尝试描述未标记数据中的隐藏结构. 您如何描述这种机器学习方法?

  • 监督学习
  • 无监督学习
  • 强化学习
  • 半无监督学习

Q34. 您在一家大型信用卡处理公司工作,希望为其客户创建有针对性的促销活动. 数据科学团队创建了一个机器学习系统,将进行类似购买的客户分组在一起, 并根据客户忠诚度划分这些客户. 您如何描述这种机器学习方法?

  • 它使用无监督学习将交易聚集在一起,并使用无监督学习对客户进行分类.
  • 它仅使用无监督机器学习.
  • 它使用监督学习来创建集群并使用无监督学习进行分类.
  • 它使用强化学习对客户进行分类.

Q35. 您正在使用 K 最近邻,并且您的 K 为 1. 训练模型时您可能会看到什么?

  • 高方差和低偏差
  • 低偏差和低方差
  • 低方差和高偏差
  • 高偏差和高方差

Q36. 数据模型偏差和方差是无监督学习的挑战吗?

  • 没有, 数据模型偏差和方差只是强化学习的一个挑战.
  • 是, 当机器创建集群时,数据模型偏差是一个挑战.
  • 是, 数据模型方差训练无监督机器学习算法.
  • 没有, 数据模型偏差和方差涉及监督学习.

Q37. 哪种选择最适合二元分类?

  • K-均值
  • 逻辑回归
  • 线性回归
  • 主成分分析 (主成分分析)

解释: 在二元分类中,逻辑回归比线性回归要好得多,因为它使结果偏向一个极端或另一个极端. K-means聚类可以用于分类,但在大多数场景下并不那么准确. 资源:

Q38. 使用传统编程, 程序员通常输入命令. 通过机器学习, 程序员输入

  • 监督学习
  • 数据
  • 无监督学习
  • 算法

解释: 这是一个非常简单的基本概念. 资源:

Q39. 为什么获取高质量数据对于机器学习算法很重要?

  • 程序员需要很长时间才能清理不良数据.
  • 如果数据质量高, 算法将更容易开发.
  • 低质量数据比高质量数据需要更多的处理能力.
  • 如果数据质量低, 你会得到不准确的结果.

Q40. 在K-最近邻中, 你离邻居越近, 你就越有可能

  • 具有共同特征
  • 成为根节点的一部分
  • 有欧几里得联系
  • 属于同一个集群

Q41. 在 HBO 节目《硅谷》中, 其中一个角色创建了一款名为“Not Hot Dog”的移动应用程序. 它的工作原理是让用户用移动设备拍摄食物照片. 然后应用程序会提示该食物是否是热狗. 创建应用程序, 软件开发者上传了数十万张热狗图片. 您如何描述这种类型的机器学习?

  • 强化机器学习
  • 无监督机器学习
  • 监督机器学习
  • 半监督机器学习

Q42. 您在一家大型制药公司工作,该公司的数据科学团队希望使用无监督学习机器算法来帮助发现新药. 这种方法有什么优点?

  • 您将能够优先考虑不同类别的药物, 比如抗生素.
  • 您可以创建一组您想要发现的药物的训练集.
  • 该算法会将具有相似特征的药物聚集在一起.
  • 人类专家可以创建药物类别来帮助指导发现.

解释: 这与斯坦福大学机器学习课程中谈到的一个例子类似. 资源:

Q43. 在 2015, 谷歌创建了一个可以在围棋游戏中击败人类的机器学习系统. 这款极其复杂的游戏被认为具有比宇宙原子还多的游戏可能性. 该系统的第一个版本通过观察数十万小时的人类游戏玩法而获胜; 第二个版本通过与自己对战时获得奖励来学习如何玩. 您如何描述向不同机器学习方法的转变?

  • 系统从监督学习转向强化学习.
  • 系统从监督学习演变为无监督学习.
  • 该系统从无监督学习演变为监督学习.
  • 系统从强化学习演变为无监督学习.

Q44. 您工作的安全公司正在考虑将机器学习算法添加到他们的计算机网络威胁检测设备中. 使用机器学习的优点之一是什么?

  • 它可以更好地防范未被发现的威胁.
  • 这很可能会降低硬件要求.
  • 它将大大缩短您的开发时间.
  • 它将提高设备的速度.

Q45. 您在一家正在追踪病毒社区传播的医院工作. 该医院创建了一款智能手表应用程序,可上传数十万参与者的体温数据. 分析数据的最佳技术是什么?

  • 当新人参与时,使用强化学习来奖励系统.
  • 使用无监督机器学习根据机器发现的模式将人们聚集在一起.
  • 使用监督机器学习按人口统计数据对人员进行分类.
  • 使用监督机器学习按体温对人进行分类.

Q46. 机器学习的许多进步都来自于改进 ___.

  • 统计
  • 结构化数据
  • 可用性
  • 算法

Q47. 这张图是一个很好的例子?

机器学习 Q45

  • 无监督学习
  • 复杂簇
  • 多类分类
  • k-最近邻

Q48. 朴素贝叶斯查看每个 _ 预测器并创建属于每个类别的概率.

  • 有条件的
  • 多类
  • 独立的
  • 二进制

参考

Q49. 您的数据科学团队中的某人建议您使用决策树, 朴素贝叶斯和 K 最近邻, 全部同时, 在相同的训练数据上, 然后对结果进行平均. 这是什么例子?

  • 回归分析
  • 无监督学习
  • 高方差建模
  • 集成建模

辅酶50. 您的数据科学团队希望使用机器学习来更好地过滤垃圾邮件. 该团队收集了一个数据库 100,000 已被识别为垃圾邮件或非垃圾邮件的邮件. 如果您正在使用监督机器学习, 你会怎么称呼这个数据集?

  • 机器学习算法
  • 训练集
  • 大数据测试集
  • 数据集群

Q51. 您在一家网站工作,该网站允许客户通过上传一张自拍照在互联网上查看自己的所有图像. 您的数据模型使用 5 将人物与其照片相匹配的特征: 颜色, 眼睛, 性别, 眼镜和面部毛发. 您的客户一直在抱怨在没有他们的情况下拍摄了数万张照片. 问题是什么?

  • 您的模型与数据过度拟合
  • 您需要较小的训练集
  • 您的模型与数据拟合不足
  • 您需要更大的训练集

Q52. 您的主管要求您创建一个机器学习系统,帮助您的人力资源部门将求职者分为明确的组. 您更有可能推荐哪种类型的系统?

  • 一个无监督的机器学习系统,将最佳候选者聚集在一起.
  • 您不会为此类项目推荐机器学习系统.
  • 依赖 PB 级就业数据的深度学习人工神经网络.
  • 一个有监督的机器学习系统,可将申请人分为现有组.

Q53. 您和您的数据科学团队有 1 TB 示例数据. 您通常如何处理这些数据?

  • 你用它作为你的训练集.
  • 你给它贴上大数据的标签.
  • 您将其分为训练集和测试集.
  • 您将其用作测试集.

Q54. 您的数据科学团队正在开发一种机器学习产品,可以充当视频游戏中的人工对手. 该团队正在使用专注于奖励的机器学习算法: 如果机器在某些方面做得很好, 然后它提高了结果的质量. 您如何描述这种类型的机器学习算法?

  • 半监督机器学习
  • 监督机器学习
  • 无监督机器学习
  • 强化学习

Q55. 该模型将使用一批数据进行训练,称为?

  • 批量学习
  • 线下学习
  • A 和 B 都
  • 以上都不是

Q56. 以下哪项不是监督学习?

  • 决策树
  • 线性回归
  • 主成分分析
  • 朴素贝叶斯

Q57. 假设我们要对空间数据(例如房屋的几何位置)进行聚类. 我们希望生产多种不同尺寸和形状的簇. 以下哪种方法最合适?

  • 决策树
  • K-均值聚类
  • 基于密度的聚类
  • 基于模型的聚类

Q58. 最适合使用逻辑回归进行梯度下降的误差函数是

  • 熵函数.
  • 平方误差.
  • 交叉熵函数.
  • 错误数量.

Q59. 与最大似然估计的方差相比 (最大LE), 最大后验方差 (地图) 估计是 ___

  • 更高
  • 相同的
  • 降低
  • 它可以是以上任何一个

Q60. ___ 指既不能对训练数据建模也不能泛化到新数据的模型.

  • 很合身
  • 过拟合
  • 欠拟合
  • 上述所有的

Q61. 您如何描述这种类型的分类挑战?

机器学习 Q58

  • 这是一个多类分类挑战.

  • 这是一个多二元分类挑战.

  • 这是二元分类挑战.

  • 这是强化分类挑战.

    解释: 显示被分类为两个以上类别或类别的数据. 从而, 这是一个多类分类挑战.

Q62. 数据模型不适合意味着什么?

  • 您的训练集中的数据太少.
  • 您的训练集中的数据太多.
  • 方差不大,但偏差很大.
  • 您的模型偏差较低但方差较高.

解释: 欠拟合的数据模型通常具有高偏差和低方差. 过拟合的数据模型具有低偏差和高方差.

Q63. 亚洲用户抱怨贵公司的面部识别模型无法正确识别他们的面部表情. 你该怎么办?

  • 在您的测试数据中包含亚洲面孔并重新训练您的模型.
  • 使用更新的超参数值重新训练模型.
  • 使用较小的批量大小重新训练模型.
  • 在您的训练数据中包含亚洲面孔并重新训练您的模型.

解释: 答案是不言自明的: 如果亚洲用户是唯一提出投诉的群体, 那么训练数据应该有更多的亚洲面孔.

Q64. 您在一家帮助人们匹配午餐约会的网站工作. 该网站声称它使用了超过 500 预测者为客户找到完美的约会对象, 但许多顾客抱怨他们得到的匹配很少. 您的模型可能存在什么问题?

  • 您的训练集太大.
  • 您的模型与数据拟合不足.
  • 您的模型与数据过度拟合.
  • 您的机器正在创建不准确的集群.

解释: // 这个问题与 Q49 非常相似,但涉及截然相反的场景.

that answer somewhat vague and unsettled. Small number of matchings does not necessarily implies that the model overfits, especially given 500 (!) independent variables. To me, it sounds more reasonable that the threshold (matching) criterion might be too tight, thus allowing only a small number of matching to occur. So a solution can be either softening the threshold criterion or increasing the number of candidates.

Q65. (大多) 每当我们在线看到内核可视化时 (或其他一些参考) 我们实际上看到了:

  • 内核提取什么
  • 特征图
  • 内核的外观

Q66. A 类的激活, Softmax之前的B和C是 10,8 和 3. A 类和 B 类的 softmax 值的不同之处是 :

  • 76%
  • 88%
  • 12%
  • 0.0008%

图片

Q67. 您刚刚抓取的新数据集似乎显示出许多缺失值. 什么行动可以帮助您最大限度地减少该问题?

  • 明智地填充受控随机值
  • 用所有样本的平均值替换缺失值
  • 去除有缺陷的样品
  • 插补

Q68. 以下哪种方法可以用作无监督学习或降维技术?

  • 支持向量机
  • 主成分分析
  • LDA
  • TSNE

Q69. 在 ANN 中使用激活函数的主要动机是什么?

  • 捕捉复杂的非线性模式
  • 将连续值转换为 “在” (1) 要么 “离开” (0) 值
  • 帮助避免梯度消失/爆炸问题
  • 他们单独激活每个神经元的能力.

Q70. 哪种损失函数最适合分类 (离散的) 监督学习?

  • 库尔巴克-莱布勒 (吉隆坡) 失利
  • 二元交叉熵
  • 均方误差 (均方误差)
  • 任何 L2 损失

Q71. 正确的选项是什么?

图片

没有. 红色的 蓝色 绿
1. 验证错误 训练误差 测试错误
2. 训练误差 测试错误 验证错误
3. 最优误差 验证错误 测试错误
4. 验证错误 训练误差 最优误差
  • 1
  • 2
  • 3
  • 4

Q72. 您创建一个决策树来显示某人是否决定去海滩. 这个决定有三个因素: 下雨的, 如果流过物体的新空气的湿度低于它正在置换的空气,气流只会加速蒸发, 和阳光明媚. 这三个因素叫什么?

  • 树节点
  • 预测因子
  • 根节点
  • deciders

// these nodes decide whether the someone decides to go to beach or not, for example if its rainy people will mostly refrain from going to beach

Q73. 您需要快速标记数千张图像来训练模型. 你该怎么办?

  • 设置机器集群来标记图像
  • 创建图像的子集并自己标记它们
  • 使用朴素贝叶斯自动生成标签.
  • 雇用人员手动标记图像

Q74. 图中的拟合线和数据展示了哪种模式?

图片

  • 低偏差, 高方差

  • 高偏差, 低方差

  • 高偏差, 高方差

  • 低偏差, 低方差

    // since the data is accurately classified and is neither overfitting nor underfitting the dataset

Q75. 您需要选择机器学习过程来在移动应用程序上运行分布式神经网络. 你会选择哪一个?

  • Scikit-learn
  • PyTorch
  • Tensowflow精简版
  • 张量流

Q76. 哪个选择是标记数据的最佳示例?

  • 电子表格
  • 20,000 录制的语音邮件
  • 100,000 汽车的图像
  • 数百 GB 的音频文件

Q77. 在统计方面, 假设检验发现效果的概率被定义为什么 – 如果有效果的话?

  • 信心
  • α
  • 功率
  • 意义

Q78. 您想要创建一个机器学习算法来识别网络上的食物食谱. 去做这个, 您创建一个算法来查看不同的条件概率. 所以如果帖子包含这个词 面粉, 它成为菜谱的可能性稍大一些. 如果它同时包含 面粉, 它更有可能是一个食谱. 您使用什么类型的算法?

  • 朴素贝叶斯分类器
  • K-最近邻
  • 多类分类
  • 决策树

Q79. 什么是懒惰学习?

  • 当机器学习算法完成大部分编程时
  • 当你不进行任何数据清理时
  • 当学习持续发生时
  • 当您一开始在一个大实例中运行计算时

Q80. 什么是 Q-learning 强化学习?

  • 带奖励的监督机器学习
  • 一种严重依赖于完善模型的无监督学习
  • 一种强化学习,其准确性会随着时间的推移而降低
  • 一种注重奖励的强化学习

参考 解释:Q-learning 是一种无模型强化学习算法。Q-learning 是一种基于价值观的学习算法. 基于价值的算法根据方程更新价值函数(特别是贝尔曼方程).

Q81. 模型中的数据具有低偏差和低方差. 您希望如何将数据点在图表上分组在一起?

  • 它们将在预测结果中紧密地组合在一起.
  • 他们会紧密地组合在一起,但与预期相去甚远.
  • 他们会分散在预测结果周围.
  • 他们会分散到远离预期结果的地方.

参考

Q82. 您的机器学习系统正在使用带标签的示例来尝试预测未来的数据, 将该数据与预测结果进行比较, 然后是模型. 这种机器学习方法的最佳描述是什么?

  • 无监督学习
  • 半监督学习
  • 监督学习
  • 半强化学习

参考

Q83. 在里面 1983 电影 战争游戏, 计算机通过与自己对弈来学习如何掌握国际象棋游戏. 计算机使用什么机器学习方法?

  • 二元学习
  • 监督学习
  • 无监督学习
  • 强化学习

参考

Q84. 您正在使用机器学习算法来研究类预测概率. 您最有可能使用什么算法?

  • 多类二元分类
  • 朴素贝叶斯
  • 无监督分类
  • 决策树分析

解释: 您可以使用朴素贝叶斯算法, 区分三类狗品种——梗犬, 猎犬, 和运动犬. 每个类别都有三个预测变量——头发长度, 高度, 和重量. 该算法执行称为类预测概率的操作.

参考

Q85. 纠正模型与数据拟合不足的最有效方法之一是什么?

  • 创建训练集群
  • 删除预测变量
  • 使用强化学习
  • 添加更多预测变量

Q86. 您的数据科学团队经常因创建无聊或过于明显的报告而受到批评. 你可以做些什么来帮助改善团队?

  • 表明团队的模型可能与数据拟合不足.
  • 认为无监督学习会带来更有趣的结果.
  • 确保他们选择正确的机器学习算法.
  • 鼓励团队提出更多有趣的问题.

Q87. 非结构化数据和结构化数据有什么区别?

  • 非结构化数据始终是文本.
  • 非结构化数据更容易存储.
  • 结构化数据具有明确定义的数据类型.
  • 结构化数据更受欢迎.

Q88. 您在一家初创公司工作,该公司正在尝试开发一种软​​件工具,该工具可以在互联网上扫描使用特定工具的人们的照片. 首席执行官对使用机器学习算法非常感兴趣. 您建议最好从哪里开始?

  • 使用无监督机器学习算法将所有照片聚集在一起.
  • 使用无监督机器学习算法创建数据湖.
  • 结合使用无监督和监督机器学习来创建机器定义的数据集群.
  • 使用监督机器学习根据预定的训练集对照片进行分类.

Q89. 在监督机器学习中, 数据科学家经常面临在数据模型欠拟合或过度拟合之间取得平衡的挑战. 他们经常必须调整训练集才能做出更好的预测. 这个平衡叫什么?

  • 不足/过度挑战
  • 聚类分类之间的平衡
  • 偏差-方差权衡
  • 多类别训练集挑战

Q90. 什么是条件概率?

  • 做一件事对另一件事产生影响的概率
  • 满足某些条件的概率
  • 的概率, 基于一定的条件, 有些事情总是不正确的
  • 某事成为正确答案的概率

Q91. K-means聚类是什么类型的机器学习算法?

  • 加强
  • 监督
  • 无监督的
  • 分类

Q92. 什么是集成建模?

  • 当您创建训练和测试数据集的集合时
  • 当您创建不同服务器的集合来运行算法时
  • 当您找到最适合您的整体的算法时
  • 当您使用多个机器学习算法集合时

Q93. 数据模型中偏差的最佳定义是什么?

  • 偏差是指您的预测值分散.
  • 偏差是您的预测值与结果之间的差距.
  • 偏差是指您的数据因不同原因而出现错误.
  • 偏差是指你的值总是偏离相同的百分比.

Q94. 哪个项目最适合监督机器学习?

  • 数据清理
  • 预测风险评分
  • 报税软件
  • 电子表格合并

Q95. 决策树什么时候最常用?

  • 与大数据产品
  • 用于监督机器学习二元分类挑战
  • 找到最好的数据簇
  • 确定 “问” 在 Q-learning 强化学习中

Q96. 一家拥有数十家购物中心的组织希望创建一种机器学习产品,该产品将使用面部识别来识别顾客. 开发这样一个模型的主要挑战是什么?

  • 大多数机器学习模型并不是为视频设计的
  • 企业在未经人员同意的情况下识别人员身份可能是不道德的
  • 很难在监督学习和无监督学习之间做出决定
  • 视频中的图像质量不足以识别个人

Q97. 下列哪些机器学习算法是无监督的?

  • 随机森林
  • k-最近邻
  • 支持向量机
  • ķ- 手段

解释: 训练期间, k 均值将观测值划分为 k 个簇. 推理过程中, 它将给定的数据点按距离分配给最近的簇. k-means 是无监督的, 因为它不需要训练有标签的数据.

Q98. 平均多个决策树的输出有助于::

  • 增加方差
  • 增加偏差
  • 减少方差
  • 减少偏差

解释: 与单个模型相比,平均模型具有更高的稳定性和更低的方差. 从数学上来说, 记住瓦尔(��)= 是(�)�

Q99. 优化您的目标函数, 您正在使用整个训练集执行全批量梯度下降 (非随机梯度下降). 是否需要洗牌你的训练集?

  • 是. 如果你不, 训练结束时优化将在最小值附近振荡.
  • 是, 为了帮助模型泛化到测试数据集.
  • 没有, 没有必要,因为数据集已经可以被认为是从数据收集过程中洗牌的.
  • 没有, 因为每次更新都会遍历整个数据集,并且顺序并不重要.

解释: 在每次迭代时, 全批量梯度下降使用整个训练集来计算梯度. 数据处理的顺序不会影响梯度值.

在每次迭代时, 全批量梯度下降使用整个训练集来计算梯度. 数据处理的顺序不会影响梯度值.

辅酶Q100. 您已收到 1,000,000 图像并将其分割成 96%/2%/2% 火车之间, 开发和测试集. 您已经训练了模型, 并分析了结果. 进一步解决问题后, 您决定更正开发集上错误标记的数据.

您同意以下哪些说法?

  • 您还应该纠正测试集中错误标记的数据, 这样开发集和测试集仍然来自同一分布.
  • 您还应该纠正训练集中错误标记的数据,以避免您的训练集现在与开发集更加不同.
  • 您不应该更正测试集中错误标记的数据, 因为测试集应该反映现实世界的数据分布.
  • 如果您想更正错误标记的数据, 你应该做三组 (训练/开发/测试) 为了保持相似的分布.

解释: 重要的是您的开发和测试集具有最接近的分布 “真实” 数据.

Q101. 您正在执行二元分类任务, 分类图像是否包含猫 (“1”) 或者不包含猫 (“0”). 为了训练模型,您会选择最小化什么损失?

  • L = y log y^ + (1-y) 日志 (1- y^)
  • L = – y 对数 y^ – (1-y) 日志 (1- y^)
  • L = || 和 – y^ ||22
  • L = || 和 – y^ ||22 + 持续的

解释: 您正在尝试最小化训练集上的二元交叉熵损失。.

Q102. 您想要创建一个机器学习算法来找到顶部 100 在社交媒体上分享过自己照片的人. 最好的机器学习方法是什么?

  • 强化学习
  • 二元分类
  • K-最近邻
  • 无监督学习

Q103. 著名数据科学家吴恩达 (Andrew Ng) 曾表示, “应用机器学习基本上是特征工程。” 什么是特征工程?

  • 从网络数据中抓取新特征
  • 通过组合和修改原始变量来创建新变量
  • 设计创新的新用户功能以添加到软件中
  • 使用深度学习来查找数据中的特征

Q104. 在微积分的背景下, 什么是 df/dx?

  • 预测函数
  • x 的 f 的导数
  • x 的导数
  • 相当于 f 除以 x

Q105. 什么是精心设计/合适的模型?

  • 已使用相同数据进行训练和测试的
  • 一种具有高度准确度并能够准确预测结果的方法
  • 已使用标记的训练数据进行训练的
  • 经过训练数据中所有条件和排列的详尽集合的训练

Q106. _-当一个人被推荐与他们购买的商品类似的商品时,就会发生基于协同过滤的情况.

  • 历史
  • 物品
  • 相似
  • 购买

Q107. 填空: 两种多元插补技术是 _ 计算者和 _ 推算.

  • 监督, 无监督的
  • 迭代的, 克尼恩
  • 相似, 回归的
  • 归一化, 缩放的

Q108. 您正在使用 Keras 库开发回归模型. 您使用 Model 类的什么方法来训练模型?

  • 预测
  • 编译
  • 合身
  • 获取权重

Q109. K近邻算法中正则化的目标是什么?

  • 标准化数据点,以便可以相互比较
  • 使用直线模型根据训练数据进行预测
  • 找到代表模型的线的斜率
  • 使决策边界更加规则

Q110. 如果两个变量 x 和 y 之间没有趋势, 我们说有一个 _ x 和 y 之间的连接.

  • 线性
  • 指数
  • 非随机的
  • 随机的

Q111. 如果您正在考虑使用机器学习算法, 今天你能做的最好的事情就是确保你有质量 _.

  • 数据
  • 处理器
  • 联网
  • 统计技术

解释: “在运行机器学习算法之前确保拥有良好的数据质量是整个数据科学和机器学习工作流程中的关键步骤。” 资源

Q112. 您组织的首席多元化官担心您的工程部门缺乏种族和性别多样性. 您被要求创建一个监督机器学习系统,以帮助对数十万份新的就业申请进行分类. 人力资源部坚持使用内部招聘数据. 您可能会遇到哪些危险?

  • 您的人工神经网络将无法有效处理太多数据.
  • 机器学习系统无法定义多样性, 所以没有办法用它来改善招聘.
  • 机器学习系统不能用于此类数据.
  • 如果系统使用内部数据, 那么它可能会放大招聘中现有的偏见.

解释: “如果人工智能接受有偏见的数据集训练, 它自然会做出有偏见的决定,从而带来灾难性的结果。” 资源

Q113. 在 2013, 谷歌的 DeepMind 项目创建了一种机器学习算法,可以玩老式 Atari 视频游戏, 乒乓球. 该算法通过创建一系列奖励来教机器如何玩. 每次机器成功回球, 机器得到了奖励; 每次对手错过球时, 机器得到了奖励. 您如何描述这种类型的机器学习算法?

  • 大数据机器学习.
  • 好的老式人工智能 (铁匠).
  • 强化学习.
  • 监督学习.

解释: 强化学习是机器学习的一个分支,算法与环境交互并获得奖励或惩罚 资源

Q114. 一家拥有数十家购物中心的组织希望创建一种机器学习产品,该产品将使用面部识别来识别顾客. 开发此类产品的主要挑战之一是什么?

  • 视频中的图像质量不足以识别个人.
  • 很难在监督学习和无监督学习之间做出选择.
  • 企业在未经人员同意的情况下识别人员身份可能是不道德的.
  • 大多数机器学习算法并不是为视频设计的.

解释: 机器学习算法中存在许多有关同意和隐私的道德问题 资源

Q115. 非结构化数据和结构化数据有什么区别 ?

  • 非结构化数据更容易存储.
  • 结构化数据具有明确定义的数据类型.
  • 非结构化数据始终是文本.
  • 结构化数据更受欢迎.

Q116. 您在一家初创公司工作,该公司正在尝试开发一种软​​件工具,该工具可以在互联网上扫描使用特定产品的人们的照片. 首席执行官对使用机器学习算法非常感兴趣. 您建议最好从哪里开始 ?

  • 使用无监督机器学习算法创建数据湖.
  • 使用无监督机器学习算法将所有照片聚集在一起
  • 使用监督机器学习根据预定的训练集对照片进行分类.
  • 结合使用无监督和监督机器学习来创建机器定义的数据集群.

Q117. 强化学习的定义是什么?

  • 机器迭代不同的模型以不断改进结果.
  • 开发人员强化了他们已经知道的内容.
  • 机器强化监督学习.
  • 这是关于强化未知数据.

解释: 强化学习本质上是一个迭代过程. 资源

Q118. 最小二乘回归解决线性模型下的最大似然估计问题

  • 真正

解释: 最小二乘回归是一种用于寻找因变量与一个或多个自变量之间最佳拟合线性关系的方法. 它最小化观测值和预测值之间的平方差之和, 这相当于在高斯噪声假设下最大化观测数据的可能性.

Q118. 您是为一家全国性快餐连锁店工作的数据科学团队的一员. 您创建一个显示趋势的简单报告: 经常光顾商店并购买少量餐食的顾客比不经常光顾商店并购买大量餐食的顾客花费更多. 您的团队创建的最有可能的图表是什么?

  • 多类分类图
  • 线性回归和散点图
  • 数据透视表
  • K-means 聚类图

Q120. 神经网络中径向基函数层的总类型为 __

  • 1
  • 2
  • 3
  • 4

解释: 径向基函数是一类特殊的前馈神经网络,由三层组成: 输入层, 隐藏层, 和输出层.

Q121. 什么是自上而下的解析器?

  • 首先假设一个句子 (符号S) 并连续预测较低级别的成分,直到写入各个前置符号
  • 首先假设一个句子 (符号S) 并连续预测上层成分,直到写入各个前置符号
  • 首先假设较低级别的成分并依次预测句子 (符号S)
  • 首先假设上层成分并依次预测句子 (符号S)

解释: 自上而下的解析器首先假设一个句子 (符号S) 并连续预测较低级别的成分,直到写入各个前置符号.

Q122. 哪种搜索方法会扩展最接近目标的节点?

  • 最佳优先搜索
  • 贪心最佳优先搜索
  • A* 搜索
  • 没有提到的

解释: 贪婪最佳优先搜索是一种知情搜索算法,其中评估函数严格等于启发式函数, 忽略加权图中的边权重. 资源

Q123. 用于提高启发式搜索的性能?

  • 节点质量
  • 启发式函数的质量
  • 简单的节点形式
  • 没有提到的

解释: 通过放宽问题可以构建良好的启发式, 因此启发式搜索的性能可以得到提高。“

Q124. 句子解析器通常用于什么用途?

  • 它用于解析句子以检查它们是否符合 utf-8.
  • 它用于解析句子以得出其最可能的语法树结构.
  • 用于解析句子,为所有 token 分配 POS 标签.
  • 它用于检查句子是否可以解析为有意义的标记.

解释: 句子解析器分析句子并自动构建语法树.

Q125. 以下哪种技术不能用于文本挖掘中的规范化?

  • 词干提取
  • 词形还原
  • 停用词删除
  • 以上都不是

解释: 词形还原和词干提取是关键字规范化的技术.

Q126. 如何处理数据集中丢失或损坏的数据?

  • 删除缺失的行或列
  • 用平均值/中位数/众数替换缺失值
  • 为缺失值分配唯一类别
  • 上述所有的

解释: 所有上述技术都是估算缺失值的不同方法.

作者

  • 海伦·贝西

    你好, I'm Helena, 一位热衷于在教育领域发布有洞察力内容的博客作者. 我相信教育是个人和社会发展的关键, 我想与所有年龄和背景的学习者分享我的知识和经验. 在我的博客上, 您会找到有关学习策略等主题的文章, 在线教育, 职业指导, 和更多. 我也欢迎读者的反馈和建议, 所以请随时发表评论或联系我. 我希望您喜欢阅读我的博客并发现它有用且鼓舞人心.

    查看所有帖子

关于 海伦·贝西

你好, I'm Helena, 一位热衷于在教育领域发布有洞察力内容的博客作者. 我相信教育是个人和社会发展的关键, 我想与所有年龄和背景的学习者分享我的知识和经验. 在我的博客上, 您会找到有关学习策略等主题的文章, 在线教育, 职业指导, 和更多. 我也欢迎读者的反馈和建议, 所以请随时发表评论或联系我. 我希望您喜欢阅读我的博客并发现它有用且鼓舞人心.

发表评论