相关性

2025-04-09 20:00:56    ZenDAS    137

一、相关性分析方法简介

相关性分析用于衡量两个或多个变量之间的线性关联程度,帮助用户快速识别数据中的潜在规律。ZenDAS支持Pearson和Spearman相关系数分析,提供以下核心输出:

  • 散点图:可视化变量间的分布关系;
  • 相关系数(r值):量化关联强度(-1到1);
  • p值:评估相关性显著性(通常p<0.05视为显著相关);

二、数据输入要求

  1. 数据类型
    • 数值型数据:参与分析的列必须为连续数值(如销售额、温度、评分)。
  2. 数据格式
    • 支持Excel导入,或手动输入表格数据;
    • 示例数据表:

三、操作步骤

  1. 选择分析方法和数据:选择“相关性”的分析方法,勾选需分析的数值列(可多选,如“广告费用”“销售额”“用户评分”)。
  2. 配置参数(可选)
    • 方法选择:默认Pearson,可选Pearson或Spearman;
    • 置信水平:默认95,用户可调整范围(0,100);
    • 矩阵图显隐:支持自定义颜色、点大小、回归线显示(默认开启)。

四、输出结果解读

1.相关系数表

  • r值解释
    • |r|≥0.8:强相关;
    • 0.5≤|r|<0.8:中等相关;
    • |r|<0.5:弱相关。
  • p值标记:*表示p<0.05(显著),**表示p<0.01(极显著)。
2.散点图矩阵

3.关键结论提炼
  • 强正相关(如广告费用vs销售额,r=0.92):广告投入增加时,销售额同步增长;
  • 弱相关(如广告费用vs用户评分,r=0.15):广告投入对用户评分影响有限;
  • 显著性判断:若p>0.05,即使r值较高,也可能为随机现象。

五、注意事项

  1. 数据质量
    • 异常值影响:极端值可能导致r值偏差,建议先通过箱线图检测。
  2. 逻辑陷阱
    • 相关性≠因果性:高相关变量间可能存在第三方混杂因素。
鲁ICP备18054969号-34
ZSITE8.6.2