Bagging算法

维基百科,自由的百科全书
跳转到导航 跳转到搜索

Bagging算法 (英语:Bootstrap aggregating,引导聚集算法),又称装袋算法,是机器学习领域的一种集成学习算法。最初由Leo Breiman于1994年提出。Bagging算法可与其他分类回归算法结合,提高其准确率、稳定性的同时,透过降低结果的变异数,避免过拟合的发生。

算法步骤[编辑]

给定一个大小为<math>n</math>的训练集<math>D</math>,Bagging算法从中均匀、有放回地(即使用自助抽样法)选出<math>m</math>个大小为<math>n'</math>的子集<math>D_i</math>,作为新的训练集。在这<math>m</math>个训练集上使用分类、回归等算法,则可得到<math>m</math>个模型,再透过取平均值、取多数票等方法,即可得到Bagging的结果。

参考文献[编辑]

  • Breiman, Leo. Bagging predictors (PDF). Technical Report No. 421. 1994 [2020-01-11]. (原始内容存档 (PDF)于2019-07-18). 
  • Breiman, Leo. Bagging predictors. Machine Learning. 1996, 24 (2): 123–140. doi:10.1007/BF00058655. CiteSeerX: 10.1.1.32.9399可免费查阅. 
  • Alfaro, E., Gámez, M. and García, N. adabag: An R package for classification with AdaBoost.M1, AdaBoost-SAMME and Bagging. 2012 [2016-10-02]. (原始内容存档于2019-09-24).