推荐 7 种机器学习模型加权集成方法-365被限制如何解决-365bet手机体育投注-365bet体育投注网址-365被限制如何解决

代码语言：javascript代码运行次数：0运行复制来源：数据studio 机器学习杂货店‍‍‍本文约1300字，建议阅读8分钟本文中我们将介绍最常见的分类 & 回归任务的结果加权方法，也就是Blend操作。在竞赛中如果对多个预测结果进行集成，最方便的做法是直接对预测结果进行加权求和。

此时不同任务，加权方法不同：

分类任务：类别投票 & 概率值加权回归任务：预测值加权排序任务：排序次序加权目标检测任务：预测结果NMS语义分割任务：像素类别投票 & 加权在本文中我们将介绍最常见的分类 & 回归任务的结果加权方法，也就是Blend操作。

多样性 & 精度差异在对结果进行集成时需要考虑如下两点：

模型的多样性：模型的精度差异；集成学习的精度收益是需要模型&预测结果的多样性，如果多样性不足，则最终预测结果和单个模型类似。

精度差异是指模型之间的精度差异，如果精度差异很大最终集成的效果也不会很好。如下情况2的模型精度差异就较大。

代码语言：javascript代码运行次数：0运行复制代码语言：javascript代码运行次数：0运行复制三个模型精度：[0.9, 0.92, 0.92]三个模型精度：[0.9, 0.8, 0.7]代码语言：javascript代码运行次数：0运行复制Out of foldOut of fold又名袋外预测，是一个模型在交叉验证的过程中使用训练部分进行训练，然后对验证集进行预测，交替得到训练集和测试集预测结果。

如果我们拥有三个模型，通过交叉验证可以得到3个训练集预测结果和3个验证集预测结果。

如下展示的几种方法，都需要训练集标签与训练集预测结果搜索得到参数，然后将参数在测试集上进行使用。

方法1：均值加权原理：对所有模型的预测结果计算均值；优点：简单，过拟合可能性低；缺点：会受到模型原始精度差异的影响；

代码语言：javascript代码运行次数：0运行复制oof_preds = []for col in oofCols: oof_preds.append(oof_df[col])y_avg = np.mean(np.array(oof_preds), axis=0)

方法2：权重加权原理：对所有模型的预测结果加权求和；优点：比均值更加可控；缺点：权重需人工设置，更容易过拟合；代码语言：javascript代码运行次数：0运行复制weights = [1,2,3]y_wtavg = np.zeros(len(oof_df))

for wt, col in zip(weights, oofCols): y_wtavg += (wt*oof_df[col])

y_wtavg = y_wtavg / sum(weights)方法3：排序加权原理：对预测结果进行排序，使用次序代替原始取值；优点：适合分类任务，对概率进行集成；缺点：会受到模型原始精度差异的影响；代码语言：javascript代码运行次数：0运行复制rankPreds = []for i, col in enumerate(oofCols): rankPreds.append(oof_df[col].rank().values)

y_rankavg = np.mean(np.array(rankPreds), axis=0)方法4：排序权重加权原理：对预测结果进行排序，使用次序进行加权求和；优点：比均值更加可控；缺点：权重需人工设置，更容易过拟合；代码语言：javascript代码运行次数：0运行复制rankPreds = []weights = [1,2,3]

for i, col in enumerate(oofCols): rankPreds.append(oof_df[col].rank().values * weights[i])

y_rankavg = np.mean(np.array(rankPreds), axis=0)方法5：爬山法加权原理：权重进行搜索，保留最优的权重；优点：可以自动权重权重大小；缺点：更容易过拟合；代码语言：javascript代码运行次数：0运行复制for w1 in np.linspace(0, 1, 100): for w2 in np.linspace(0, w2, 100): w3 = 1 - w1 - w3 如果 w1, w2, w3取得更好的精度，保留权重否则尝试下一组权重组合方法6：线性回归加权原理：使用线性回归确定权重优点：可以自动权重权重大小；缺点：需要额外训练，容易过拟合；代码语言：javascript代码运行次数：0运行复制from sklearn.linear_model import LinearRegression

lr = LinearRegression(fit_intercept=False)lr.fit( 三个模型对训练集预测结果，训练集标签)

lr.coef_ # 线性回归的权重方法7：参数优化加权原理：使用优化方法搜索权重优点：可以自动权重权重大小；缺点：需要额外训练，容易过拟合；代码语言：javascript代码运行次数：0运行复制def f(x): return x[0]**2 + x[1]**2 + (5 - x[0] - x[1]) from scipy import optimizeminimum = optimize.fmin(f, [1, 1])编辑：黄继彦‍‍‍

校对：林亦霖

推荐 7 种机器学习模型加权集成方法

相关推荐

Excel为什么输入数字后会变成乱码？

在国内怎么使用Google服务？有哪些方法?

一文看懂：买股票怎么开户？股票开户分为现场开户和非现场开户，开立账户有三种具体方法。方法一：网上开户网上开户其实很简单，在开户前准备号身份证和银行...

金贝AE BOX PRO矿机详情

怎么找到自己的精准客户

英雄联盟买错装备怎么撤销？

酷玩吧神仙道寻仙之路和贺岁基金即将开启！

阴阳师御魂掉落时间表2025版？SSR爆率提升技巧！

十二生肖，谁是最顾家的那个它？

友情链接