三个对机器学习的常见误解

随着现代数据分析中的使用案例越来越多，解开机器学习的常见误解将有助于理解我们如何利用机器的强大潜力。

机器学习 (ML) 是计算机科学的一个领域，它使用数据来提取算法和学习模式，并将“学习到的”概括应用到新环境中，包括在没有直接人工编程的情况下执行任务。随着现代数据分析中的使用案例越来越多，解开机器学习的常见误解将有助于理解我们如何利用机器的强大潜力。

误解：机器学习和人工智能将取代人类

机器不会夺走您的工作。事实上，机器学习和人工智能 (AI) 更有可能帮助您更好地完成工作，并让您更专注于自我抱负的实现和您角色中至关重要的人性元素 - 包括创造力和策略。

虽然 ML 和 AI 在许多应用中都颇有助益，但这些技术在许多领域的表现并不是特别强大，需要人为影响、干预或监督。其中包括：

长期规划
抽象或创造性思考
理解因果关系
做出需要领域知识或背景的决策

人类判断对于消除 ML 算法中的固有偏差也是必要的。即使技术进步了，我们可能永远也看不到十全十美的算法解决方案。可解释性和透明度对于人们信任机器的输出和建议非常重要；我们必须了解模型的“黑盒”中发生了什么，以充分信任并整合我们的工作和生活中受机器影响的决策。

误解：机器会从经验中学习

与人们的普遍观点相反，机器学习并不依赖于经验，而是依赖于数据。您不能指望只要打开一台电脑，问题就能解决 - 机器需要从数据中学习并创建算法，以将算法应用到未来的环境中，其中包括：

分类或描绘数据集组件的方法
为成功记分或评估成功的指标
对数据进行模型参数优化

这是通过从数据集中提取一个广义的解释（比如一个抽象的故事）来实现的，因为数据集中可能包含人类难以识别的复杂模式或隐藏规律。如今，许多金融机构使用 ML 来分析交易数据，以发现并标记可能是欺诈性收费的违规行为，或为放贷业务评估风险并提供建议。

用更简单的话来说，向一台机器上传甜甜圈的照片，它就可以判断一张新照片是否包含甜甜圈。首先，我们会分别上传有甜甜圈的照片和没有甜甜圈的照片，并告诉图像分类器哪个是哪个。这就为机器提供了数据，机器将用这些数据建立模型来进行确定性预测，从而区分出“有甜甜圈”的照片和“没有甜甜圈”的照片。然后，我们可以上传一张新的图像，机器将会应用它的算法模型并做出决策 - 这张照片里是否有甜甜圈?

误解：机器学习和人工智能是一样的

人工智能和机器学习是两个不同但又相关的概念。关于 AI 和 ML 之间的关系，一种思考方法是：前者是一个问题，而后者是试图解决这个问题的一种解决方案。如果最终目标是机器能够利用（人类）智能的认知能力解决问题，那么这个将从数据中所得出的算法应用到新的、更大的环境的过程就是实现这一目标的一种解决方案。

为了更有助于人们区分两者，可以这样理解，人工智能可以解决那些对人类来说容易，对计算机来说很困难的问题，比如计算机视觉。我们继续延伸甜甜圈的例子，现在我们引入一个新的挑战：教计算机分辨百吉饼和甜甜圈。对于人类来说，这是一件轻而易举的事，但对于计算机来说，这有一定的挑战性。此时，AI 是指机器能够成功分辨出百吉饼和甜甜圈的能力（即解决问题），而 ML 是指计算机学习在看到新照片时得出结论的方法（即解决方案）。

相反，ML 表现出色，并且常常被用于对机器来说简单却对人类来说较难的情况，如执行复杂的数学算法或使用概率计算。机器的计算能力有助于快速执行更具挑战性的任务，或者发现人类可能忽略的模式。

机器学习在现代分析中的用例

许多企业将 ML 引入到企业数据分析实践中，以帮助识别隐藏的见解，并为业务决策提供更明智的建议。这在大数据分析中尤其有帮助，可以处理日益增加且日益复杂的数据集。机器学习还可以识别组织内的行为趋势，向用户提供其他出现过的类似案例中的建议，如数据准备或分析中使用哪些数据源，或者哪些是有助于回答特定问题的分析内容。

其他后续研发的领域高级预测分析。机器学习有足够的信心可以帮助自动化高级统计分析和自动应用模型，让技术水平一般的用户可以使用复杂的模型。进阶用户则能够探索和修改计算，这不仅应对了信任和透明性问题，还可以完成不同假设场景的测试。

机器学习也被用于分析，帮助用户利用自然语言查询其数据。这实际上意味着学习理解问题背后的人类意图和语义，并将请求转化成结构化查询语言。随着自然语言的进步以及 AI 和 ML 驱动型智能分析能力的提高，没有传统数据技能的人类将能够以激动人心的新方式处理数据，以获得新见解。