为什么我要知道统计学,最小描述长度,最大似然估计,最小二乘估计,大数定律,贝叶斯,信息熵,辛普森悖论,假设检验,混淆矩阵,F1值,p值,置信区间,基尼系数,数据分布,自由度,方差。经典逻辑,量子计算。
这些概念,帮助我,从纷繁复杂的表象中获得真相,从不确定中获得确定的规律。
问题是,这么多要学的东西,我先学哪个,最实用?
先列问题:
1、为什么L1、L2正则化,可以降低模型的过拟合?
2、做a/b test,达到95%的置信度,需要多少样本?
3、最大似然估计,最小二乘估计;是什么?
4、t检验