如果你不知道如何证明一个模型是好是坏,这就好比你想得到某样东西却不知道它是什么。作为一名数据科学家工作了几年后,我坚信在早期阶段定义指标是非常重要的事情。
在这一系列的故事中,我将涵盖一些我们在衡量模型有多好时应该使用的通用指标。精度和均方差(MSE) 可能会在谈到度量时立即出现。然而,我想强调的是,我们的观众可能不明白它是什么。因此,我们需要准备内部和外部指标。
对于内部度量,我简单的引用 Precision 、 **MSE、**是为了与那些具备知识的人交流,以深入理解机器学习。相比之下,外部指标是为与高层管理人员等非技术受众沟通而设计的。这是因为我们可能需要用通俗的术语来说明我们的工作。否则,他们可能不知道我们在说什么。
由于我们总是需要在精度和召回之间取得平衡,可能很难同时拥有两个好的结果。你可以向你的观众展示精确和召回的结果,但你必须解释那是什么意思。
我们需要思考,如果我们正在建立一个癌症诊断分类模型,我们是否需要更高的精度和召回。为此,我们需要考虑错误预测的成本。我认为,我们需要更高的召回而不是更高的精度。原因是我们可能更喜欢诊断一个患了癌症而不是健康的病人。
我们需要补充的不是给出一个好的回忆,更高的回忆意味着我们将降低把一个癌症患者归类为健康人的几率。
均方误差(MSE) 和平均绝对百分比误差(MAPE) 是回归问题中一些常见的评价指标。
我们需要展示关注这些指标的影响,而不仅仅是向观众展示。MAPE 是一种测量百分比误差的方法。我总是把它转换成“准确性”,因为对于非技术观众来说,这是一个非常容易理解的术语。
如果 MAPE 是 20%,我就换算成 80%的准确率(100% — 20%),大家就明白它有多好了,虽然就含义而言可能不是 100%准确。
更详细解释将很快发布:
我是湾区的数据科学家。专注于数据科学、人工智能,尤其是 NLP 和平台相关领域的最新发展。你可以通过媒体博客、 LinkedIn 或 Github 联系我。