基本的统计分析函数
适用于Series和DataFrame类型
方法说明.sum()计算数据的总和,按0轴计算,下同.count()非NaN值的数量.mean() .median()计算数据的算术平均值、算术中位数.var() .std()计算数据的方差、标准差.min().max()计算数据的最小值、最大值.describe()针对0轴(各列)的统计汇总适用于Series类型
方法说明.argmin() .argmax()计算数据最大值、最小值所在位置的索引位置(自动索引).idxmin() .idxmax()计算数据最大值、最小值所在位置的索引(自定义索引) 数据的累计统计分析适用于Series和DataFrame类型,累计计算
方法说明.cumsum()依次给出前1、2、…、n个数的和.cumprod()依次给出前1、2、…、n个数的积.cummax()依次给出前1、2、…、n个数的最大值.cummin()依次给出前1、2、…、n个数的最小值适用于Series和DataFrame类型,滚动计算(窗口计算)
方法说明.rolling(w).sum()依次计算相邻w个元素的和.rolling(w).mean()依次计算相邻w个元素的算术平均值.rolling(w).var()依次计算相邻w个元素的方差.rolling(w).std()依次计算相邻w个元素的标准差.rolling(w).min() .max()依次计算相邻w个元素的最小值和最大值 数据的相关性分析两个事物,表示为X和Y,如何判断它们之间的存在相关性?
相关性•X增大,Y增大,两个变量正相关 •X增大,Y减小,两个变量负相关 •X增大,Y无视,两个变量不相关
协方差•协方差>0, X和Y正相关 •协方差
关注
打赏