数据分析归档 - 第6页共13页

数据分析

如何避免欠拟合？

添加新特征。当特征不足或者现有特征与样本标签的相关性不强时，模型容易出现欠拟合。增加模型复杂度。简单模型的学习能力较差，通过增加模型的复杂度可以使模型拥有更强的拟合能力。例如，在...

2023年11月30日 0 0 65 0

数据分析

如何避免过拟合？

扩大样本数据。使用更多的训练数据是解决过拟合问题最有效的手段，因为更多的样本能够让模型学习到更多更有效的特征，减小噪声的影响。降低模型复杂度。在数据较少时，模型过于复杂是产生过拟...

2023年11月30日 0 0 76 0

数据分析

什么是欠拟合、过拟合？

欠拟合指的是模型在训练和预测时表现都不好的情况；过拟合是指模型对于训练数据拟合呈过当的情况，反映到评估指标上，就是模型在训练集上的表现很好，但在测试集和新数据上的表现较差。

2023年11月30日 0 0 69 0

数据分析

超参数有哪些调优手段？

超参数是在开始学习过程之前设置值的参数，而不是通过训练得到的参数数据。 ① 网格搜索网格搜索指查找搜索范围内的所有的点来确定最优值。如果采用较大的搜索范围以及较小的步长，网格搜索...

2023年11月30日 0 0 66 0

数据分析

什么是A/B测试？

A/B测试就是两种模型同时运行，并在实际环境中验证其效果的方式。在互联网公司中，A/B 测试是验证新模块、新功能、新产品是否有效，新算法、新模型的效果是否有提升，新设计是否受到用户...

2023年11月30日 0 0 74 0

数据分析

分类问题模型评估指标？

查准率（Precision）：分类正确数量 / (分类正确数量 + 多分类的数量)，范围[0,1]。简单说来就是“分类对不对”。召回率（Precision）：分类正确数量 / (...

2023年11月30日 0 0 79 0

数据分析

回归问题模型评估指标？

平均绝对误差（Mean Absolute Deviation）：单个观测值与算术平均值的偏差的绝对值的平均。均方误差：单个样本到平均值差值的平方平均值。 MAD(中位数绝对偏差)...

2023年11月30日 0 0 71 0

数据分析

监督学习、非监督学习区别

**监督学习**：回归、分类。监督学习是使用已知正确答案的示例来训练网络。已知数据和其一一对应的标签，训练一个预测模型，将输入数据映射到标签的过程。 **非监督学习**：聚类。 ...

2023年11月30日 0 0 70 0

数据分析

在图像分类任务中，训练数据不足会带来什么问题？

当训练数据不足时，说明模型从原始数据中获取的信息比较少，这种情况下要想保证模型的效果，就需要更多先验信息。具体到图像分类任务上，训练数据不足带来的问题主要表现在过拟合方面，即模型在...

2023年11月30日 0 0 73 0

数据分析

归一化处理适用哪些模型

应用归一化的模型。在实际应用中，通过梯度下降法求解的模型通常是需要归一化的，包括线性回归、逻辑回归、支持向量机、神经网络等模型。不使用归一化的模型。如决策树。

2023年11月30日 0 0 79 0

数据分析

特征归一化常用的方法

线性函数归一化（Min-Max Scaling）。它对原始数据进行线性变换，使结果映射到[0，1]的范围，实现对原始数据的等比缩放。零均值归一化（Z-Score Normaliz...

2023年11月30日 0 0 80 0

数据分析

为什么要特征归一化

为了消除数据特征之间的量纲影响，我们需要对特征进行归一化处理，使得不同指标之间具有可比性。例如，分析一个人的身高和体重对健康的影响，如果使用米（m）和千克（kg）作为单位，那么身高...

2023年11月30日 0 0 64 0

数据分析

求一个3*3矩阵主对角线元素之和

``` mat=[[1,2,3], [3,4,5], [4,5,6] ] res=0 for i in range(len(mat)): res+=mat[i][i] print(...

2023年11月30日 0 0 69 0

数据分析

计算两个矩阵相加

创建一个新的矩阵，使用 for 迭代并取出 X 和 Y 矩阵中对应位置的值，相加后放到新矩阵的对应位置中。 ``` X = [[12,7,3], [4 ,5,6], [7 ,8,9...

2023年11月30日 0 0 76 0