Python学习笔记:盖帽法处理异常值
Python学习笔记:盖帽法处理异常值⼀、盖帽法介绍数据分析中,异常值⽐较难于界定,⼀般数据异常值包括⼏种情况:单值异常:结合实际业务进⾏判断(例如:年龄age ≥ 120岁)相关性异常:⼀般收⼊随年龄的增长呈现类线性增长趋势,如果异常情况,需进⾏剔除突发异常:激增异常,添加哑变量(有待理解?)区分(异常值 vs 强影响点)异常值的处理可以通过盖帽法进⾏处理。如果⼀个置信区间左右两边各有3个标准差...
2024-01-05 31 0
Python学习笔记:盖帽法处理异常值⼀、盖帽法介绍数据分析中,异常值⽐较难于界定,⼀般数据异常值包括⼏种情况:单值异常:结合实际业务进⾏判断(例如:年龄age ≥ 120岁)相关性异常:⼀般收⼊随年龄的增长呈现类线性增长趋势,如果异常情况,需进⾏剔除突发异常:激增异常,添加哑变量(有待理解?)区分(异常值 vs 强影响点)异常值的处理可以通过盖帽法进⾏处理。如果⼀个置信区间左右两边各有3个标准差...