新笔趣阁 - 都市娱乐 - 离语 - 第350章 好看!

第350章 好看![第1页/共2页]

喜好离语请大师保藏:离语小说网更新速率全网最快。

1、将特性首要程度排序的过程与模型构建过程同时停止的特性挑选体例称作嵌入式特性挑选体例( √ )2、线性回归模型的目标函数为残差平方和最大化(残差平方和最小化 )3、特性向量中间度度量节点在收集合的影响力。收集合每个节点被付与一个影响力分数,一个节点与更多的高分节点相连,其分数也趋势于更高。( √ )4、强化学习利用已标记的数据,按照提早嘉奖学习战略。( 未标记的数据,通过与环境的交互来汇集数据停止学习 )5、过拟合是机器学习中一个首要观点,是指模型过于庞大,导致对测试数据瞻望很好,但对练习数据瞻望很差。( 对练习数据瞻望很好,对测试数据瞻望很差 )3、阐发题(本题满分30分,共含5道小题,每小题6分)1、现有样本以下:0,2,3,4,5,6,7,8,9,10,41,42,43,44,45,46,47,48,49,50。利用等间隔散化来措置该样本,将样本分为5个区间段。有几个区间内样本容量不为0?你的答案:2你的计算过程:起首,计算样本的最小值和最大值:最小值:0最大值:50然后,肯定分为5个区间时的间距:(最大值 - 最小值) / 区间数 = (50 - 0) / 5 = 10接下来,以间距为10停止等间隔散化:区间1:0-9 (共10个样本)区间2:10-19 (无样本)区间3:20-29 (无样本)区间4:30-39 (无样本)区间5:40-50 (共11个样本)按照以上成果,有2个区间段(区间2和区间3)内的样本容量不为0。请重视,这类等间隔散化体例能够导致某些区间没有样本,而其他区间样本较多。2、随机丛林采取的是甚么集成体例?(A. Bagging,B.Boosting,C.Stacking)。这类集成体例合用于甚么环境?你的挑选:bagging你的解释:Bagging(自举会聚法)合用于以下环境:练习数据较少,需求尽能够充分操纵现有的有限样本。数据集存在较强的噪声或离群点,需求通过量个模型的均匀来减小噪声影响。需求降落模型的方差,进步模型的稳定性和鲁棒性。模型庞大度较高,轻易过拟合,需求引入随机性增加泛化才气。Bagging通过对原始练习集停止有放回的抽样,构建多个子模型。每个子模型相互独立地练习,并通过取均匀值(回归题目)或投票(分类题目)的体例停止瞻望。随机丛林就是一种基于Bagging思惟的集成学习