Page 1 of 1

将客户问题转化为数学上明确定义的问题

Posted: Tue May 27, 2025 7:16 am
by chandonarani55
在探索数据之后,我采取的第一步是将客户的问题转化为数学优化问题。通过这种方式,我将项目的确切目标形式化,并立即获得成功的衡量标准。在某些情况下,这一步很容易,但有时会出现一些难题。假设客户想要一个能够确定机器零件何时需要更换的模型,那么真正的目标是降低维护成本。过早更换零件成本高昂,但过晚更换零件的成本可能更高。因此,有必要考虑过 最近的手机号码数据 早和过晚更换的相对成本,以便找到合适的最优方案。

当你拥有数据时,立即开始训练机器学习模型是很诱人的,但如果后来发现问题不正确,这通常会导致模型无法使用。

建模时使用基线
如果问题定义明确,就可以开始建模了。首先,将数据分成两部分,一部分用于训练机器学习模型(训练集),另一部分用于评估模型在未知数据上的表现(测试集)。建模本身通常是一个迭代过程。然后,我会尝试一组合适的模型,看看哪个模型效果最好,研究残差(测量值与模型预测值之间的差异),并根据这些信息进行调整,直到对结果满意为止。在这个迭代过程中,最重要的模型(也是我经常使用的模型)是我能想到的最简单的模型。对于回归问题(对定量变量进行建模),这个模型可以是训练集中相关数量的平均值。对于分类问题,我会创建一个始终预测同一类的模型,即训练集中最常见的类。最后,对于时间序列问题,预测值等于先前的值。