智算多多



描述性分析是最基础但最不能忽视的方法。它通过概括和总结数据集的主要特征,来提供对数据的直观理解,主要关注数据的集中趋势、分散程度和分布形状等基本统计特征。
我们主要关注两类指标:集中趋势和离散程度。集中趋势用平均值、中位数、众数来衡量,离散程度则看方差、标准差、极差。
对比分析是数据分析中使用频率最高的方法,通过相同维度下的指标对比,发现数据的差异和变化规律。
对比分析必须满足“同维度、同口径、同时间范围”的三同原则,主要有四种对比方式:同比、环比、横比、纵比。
漏斗分析主要用于分析业务流程中的转化情况,核心是量化每个环节的转化效率,找到流程中的问题。
比如电商的购买流程:曝光-点击-加购-下单-支付-收货,需要计算每个环节的转化率和流失率,转化率=下一环用户数/上一环用户数,流失率=1-转化率,快速定位流失最严重的环节,同时要结合用户行为数据,分析流失的具体原因。
归因分析的核心是确定不同因素对业务结果的贡献程度,常用于营销活动效果评估和用户行为分析。
常见的归因模型有:末次点击、首次点击、线性归因、时间衰减、位置归因、数据驱动归因。这些模型要根据业务场景选择,同时要结合业务常识,避免过度依赖模型结果。
同期群分析的核心是将具有相同特征的用户按时间分组,跟踪不同组群的后续行为变化,特别适合分析用户留存和生命周期价值。
比如做会员体系优化项目时,用同期群分析发现,新注册后7天内完成首单的用户,90日留存率比未完成首单的用户高出40%,就可以推出新用户7日首单优惠政策。做同期群分析时,要保证组群的样本量足够,同时要跟踪足够长的时间周期,才能得出可靠的结论。
聚类分析是一种无监督学习方法,核心是将数据按照相似性分组,使得同一组内的数据相似度高,不同组间的数据相似度低,常用于用户画像构建和市场细分。
最常用的聚类算法是K-means算法和层次聚类算法。K-means算法需要预先指定聚类数量,层次聚类算法则可以生成聚类树,帮助你确定聚类数量。比如分析电商用户,通过聚类分析可以将用户分为价格敏感型、品质追求型、便捷优先型等不同群体。
回归分析是一种监督学习方法,主要分析自变量和因变量之间的关系,即一个变量如何影响另一个变量,常用于预测和影响因素分析。回归分析可分为两大类:
时间序列分析是分析按时间顺序排列的数据的变化规律,预测未来的趋势,常用于销售预测、库存优化、流量预测等场景。常用的方法有移动平均、指数平滑法、ARIMA模型。
做时间序列分析时,要先对数据进行平稳性检验,如果数据不平稳,需要进行差分处理。同时,要结合业务场景中的突发事件,比如促销活动、节假日等,对预测结果进行调整。
AB测试是验证假设最科学的方法,它将用户随机分为实验组和对照组,通过对比两组的指标差异,验证新策略的效果。
AB测试的关键是随机分组和样本量足够,确保两组用户的特征一致。同时,要明确测试的核心指标,比如转化率、留存率、客单价等。
杜邦分析一种财务分析方法,专门用于拆解企业盈利根源,判断财务健康度。
净资产收益率ROE = 销售净利率 × 资产周转率 × 权益乘数。销售净利率反映盈利能力,资产周转率反映运营效率,权益乘数反映负债杠杆水平。通过逐层拆解,能定位是利润太薄、周转太慢还是杠杆过高导致整体收益不佳。
ABC 分析是基于帕累托法则的管理分析方法,它是按贡献度把对象排序分类,实现资源的差异化分配与重点管控。
以款式和销售量为例:A 类对象累计贡献占比 70%—80%,属于核心贡献主体;B 类对象累计贡献占比 15%—25%,属于次要稳定对象;C 类对象累计贡献占比 5%—10%,属于低贡献对象。
该方法适用于商品、用户、库存、渠道等多类场景,分类后需落地对应管理策略,A 类重点监控、资源倾斜,B 类常规管理,C 类简化流程或逐步淘汰,且需定期更新数据重新划分类别。