背景：预估问题的一种最简单形式是二分类模型。我们考虑这样一个情况：一批样本的预测结果是0/1，我们检查计算得到样本均值是，但是样本方差离较远。仔细检查后发现是其实样本来源于两个子集，也就是样本存在潜在的分层（A/B两个子集）。在样本（训练集上）可以找到“样本分层”的标签，但在测试集上没有办法直接观测到“样本分层”这个标签。问题1: 对训练集建模，提出两种估计0/1分类的方式。并从Bias-Variance等角度比较模型优劣和适用范围。问题2: 以预测为目的，测试集没有这个“样本分层”的标签，那么怎么建模？问题3: 跳出刚才样本分层，假设模型选择DNN，我们怎么做预测（严格意义叫估计）的方差估计（除了直接计算样本方差，这样非常不准）。

区块链毕设网qklbishe.com为您提供问题的解答

背景：预估问题的一种最简单形式是二分类模型。我们考虑这样一个情况：一批样本的预测结果是0/1，我们检查计算得到样本均值是，但是样本方差离较远。仔细检查后发现是其实样本来源于两个子集，也就是样本存在潜在的分层（A/B两个子集）。在样本（训练集上）可以找到“样本分层”的标签，但在测试集上没有办法直接观测到“样本分层”这个标签。