数据分析

  • 如何避免欠拟合?

    添加新特征。当特征不足或者现有特征与样本标签的相关性不强时,模型容易出现欠拟合。 增加模型复杂度。简单模型的学习能力较差,通过增加模型的复杂度可以使模型拥有更强的拟合能力。例如,在...

    2023年11月30日 0 65 0
  • 如何避免过拟合?

    扩大样本数据。使用更多的训练数据是解决过拟合问题最有效的手段,因为更多的样本能够让模型学习到更多更有效的特征,减小噪声的影响。 降低模型复杂度。在数据较少时,模型过于复杂是产生过拟...

    2023年11月30日 0 76 0
  • 什么是欠拟合、过拟合?

    欠拟合指的是模型在训练和预测时表现都不好的情况; 过拟合是指模型对于训练数据拟合呈过当的情况,反映到评估指标上,就是模型在训练集上的表现很好,但在测试集和新数据上的表现较差。

    2023年11月30日 0 69 0
  • 超参数有哪些调优手段?

    超参数是在开始学习过程之前设置值的参数,而不是通过训练得到的参数数据。 ① 网格搜索 网格搜索指查找搜索范围内的所有的点来确定最优值。如果采用较大的搜索范围以及较小的步长,网格搜索...

    2023年11月30日 0 66 0
  • 什么是A/B测试?

    A/B测试就是两种模型同时运行,并在实际环境中验证其效果的方式。在互联网公司中,A/B 测试是验证新模块、新功能、新产品是否有效,新算法、新模型的效果是否有提升,新设计是否受到用户...

    2023年11月30日 0 74 0
  • 分类问题模型评估指标?

    查准率(Precision):分类正确数量 / (分类正确数量 + 多分类的数量),范围[0,1]。简单说来就是“分类对不对”。 召回率(Precision):分类正确数量 / (...

    2023年11月30日 0 79 0
  • 回归问题模型评估指标?

    平均绝对误差(Mean Absolute Deviation):单个观测值与算术平均值的偏差的绝对值的平均。 均方误差:单个样本到平均值差值的平方平均值。 MAD(中位数绝对偏差)...

    2023年11月30日 0 71 0
  • 监督学习、非监督学习区别

    **监督学习**:回归、分类。 监督学习是使用已知正确答案的示例来训练网络。已知数据和其一一对应的标签,训练一个预测模型,将输入数据映射到标签的过程。 **非监督学习**:聚类。 ...

    2023年11月30日 0 70 0
  • 在图像分类任务中,训练数据不足会带来什么问题?

    当训练数据不足时,说明模型从原始数据中获取的信息比较少,这种情况下要想保证模型的效果,就需要更多先验信息。具体到图像分类任务上,训练数据不足带来的问题主要表现在过拟合方面,即模型在...

    2023年11月30日 0 73 0
  • 归一化处理适用哪些模型

    应用归一化的模型。在实际应用中,通过梯度下降法求解的模型通常是需要归一化的,包括线性回归、逻辑回归、支持向量机、神经网络等模型。 不使用归一化的模型。如决策树。

    2023年11月30日 0 79 0
  • 特征归一化常用的方法

    线性函数归一化(Min-Max Scaling)。它对原始数据进行线性变换,使结果映射到[0,1]的范围,实现对原始数据的等比缩放。 零均值归一化(Z-Score Normaliz...

    2023年11月30日 0 80 0
  • 为什么要特征归一化

    为了消除数据特征之间的量纲影响,我们需要对特征进行归一化处理,使得不同指标之间具有可比性。例如,分析一个人的身高和体重对健康的影响,如果使用米(m)和千克(kg)作为单位,那么身高...

    2023年11月30日 0 64 0
  • 求一个3*3矩阵主对角线元素之和

    ``` mat=[[1,2,3], [3,4,5], [4,5,6] ] res=0 for i in range(len(mat)): res+=mat[i][i] print(...

    2023年11月30日 0 69 0
  • 计算两个矩阵相加

    创建一个新的矩阵,使用 for 迭代并取出 X 和 Y 矩阵中对应位置的值,相加后放到新矩阵的对应位置中。 ``` X = [[12,7,3], [4 ,5,6], [7 ,8,9...

    2023年11月30日 0 76 0
QR code