干货丨数据分析之前期准备（下）

Original 萜妹萜心话 2022-09-14

收录于合集 #毕业论文保姆级指南 24个

这周我们终于要进入数据准备的收尾部分，要完成反向、变化量、标准化等等操作，让数据成为待分析的状态~

虽然这些操作在SPSS中也可以完成，但是SPSS的语句是即时的。在小可爱们后续补充被试数量时，还需要把那些操作重复一遍。所以萜妹会选择在Excel中完成这些操作，毕竟在Excel中只需要完成公式填充，补充多少次都不愁。

那萜妹开始跟小可爱们分享公式和技巧吧~

（注：处理方式并非唯一，萜妹只是分享个人经验~）

本期推送目标：将数据处理成如下形式

来源：萜妹自制

在介绍具体技巧之前，要先针对这个模板对小可爱们做一个说明（怕文字讲的不够清楚，萜妹还录了个小视频）。

第一，这里没有领导原始数据。用这里的数据来分析领导量表的信度会产生误差。因为各组人数不同，会导致权重不同，进而影响到结果。所以想分析领导量表的信度需要额外建立一个Excel。

第二，团队变量是指员工变量的均值。SPSS中无法快速处理，推荐用Excel中的公式。

第三，二次加工变量则是标准化、交互项、差值等变量。SPSS和Excel的操作难度都不大，SPSS可能更简单，Excel则是能实时更新。

为了让小可爱们理解上面这个表格，所以萜妹多加了一行，当做注释。实际操作过程中，除去第一行，就是可以直接导入SPSS或者Mplus中分析的数据啦~（为了页面美观，萜妹隐藏了很多列，实际操作时看起来不会这么简单。）

另外，上面的模板是萜妹做的一个比较详细的版本。在具体操作过程中，可能不涉及部分变量（比如团队变量），小可爱们可以自行取舍。

介绍完模板，接下来会介绍具体的公式和作用，包括：题项反向、变量化、领导数据填充、部门编号汇总、计算团队平均值、变量标准化、计算交互项、计算差值。

（可边听视频，边看推送）

题目反向

假设需要反向的题目为A列，那么可以新建B列，在B2输入如下公式，再填充至整列即可。

七点量表：=8-A2；
五点量表：=6-A2；

变量化

假设需要变量化的题目原始状态为下图所示：

方法一：利用Average公式；

AF2=Average(S2,:AB2)
AG2=Average(AC2:AE2)

方法二：利用Averageif公式；

AF2=AVERAGEIF($S$1:$AE$1,"=a*",$S2:$AE2)
AG2=AVERAGEIF($S$1:$AE$1,"=ya*",$S2:$AE2)

两种方式看似差不多，都得自己针对每个变量写公式，甚至方法一写起来还更简单一点。但是面对变量比较多的时候，萜妹还是更推荐方法二的。

首先，介绍一下Averageif函数，可以把这个函数通俗的理解为：averagif(if判断的区域，if的判定依据，数据的计算区域)。

其次，在使用时有一个要注意的点是：=和""要一起用，不用""会报错的。

那么最后，萜妹再来介绍我们的方法二。不难看出，方法二的每个变量公式都是基于：

【=AVERAGEIF(完全固定的语句标题,"=语句编码字母*",仅固定列的原始数据)】的变形。

每个变量不同的地方仅在于，对应的语句编码字母。

我们完全可以使用公式填充完所有的变量，再针对不同的编码字母进行修改，这样可以做到快速填充（而且也不那么费眼睛）。

这样就算有20个变量，也可以在半分钟内都计算出结果啦（10秒复制公式，20秒改每个的字母）~

领导数据填充

萜妹之前不是在（上）卷的时候说过，我录领导和员工匹配的问卷，通常喜欢这样录，看起来一目了然一点。

所以，在真正要分析的时候，我们还要先把空白的数据填充好。

具体步骤：

①选中领导数据，行数与员工数据相同。假设有500份员工数据，就选中C2:M501；

②按【F5】➔点击【定位条件】➔选中【空值】➔点击【确认】；

③在C3输入【=C2】，按住【ctrl】再按下【Enter】（这样能让被选择的空值全部填充完好）。

部门编号汇总

之前，萜妹的数据是有多个ID的。我们要导入其他软件分析时，也需要合成一个部门ID。

最简单的方法是使用&符号。

如图，在B2输入【=C2&D2&E2】，再向下填充即可。

其实这个时候的ID已经可以代表不同部门了，但是我也知道有的朋友喜欢从1开始，就喜欢正正常常的那种序号。

那么这时就需要利用IF函数解决。首先在A2输入1，再在A3输入【=IF(B3=B2,A2,A2+1)】，最后向下填充即可。

计算团队平均值

团队变量的计算也是利用Averageif公式。

在目标单位格中输入以下公式，再向右向下填充：

【=AVERAGEIF($A$2:$A$36,$A2,AF$2:AF$36)】

要注意以下的各数据的固定情况不可以改变，不然在公式填充的时候会发生变形，导致错误。

IF的判断区域（$A$2:$A$36,），需要完全固定，即选中后，按一次【F4】；
IF的判断依据（$A2），则需要固定列，即选中后，按三次【F4】；
数据的计算区域（AF$2:AF$36），则需要固定行，即选中后，按两次【F4】。

变量标准化

变量标准化则是要利用standardize公式、求平均的average函数与求标准差的Stdev.p函数。

在目标单位格中输入以下公式，再向右向下填充：

【=STANDARDIZE(AF2,AVERAGE(AF$2:AF$36),STDEV.P(AF$2:AF$36))】

这里萜妹我再提醒一句，可向右向下填充，意味着，无论你有多少个变量，都只用写一个公式，就可以完成所有变量中所有数据的计算！！！是不是无敌方便！

计算交互项和差值

最后是计算交互项、乘积、差值等。

乘积：=A2*B2；
差值：=A2-B2；

讲道理，这也太简单了对吧，而且也是调整好位置，向右向下一顿填充就完事了。

这不比SPSS一个个算要香多了吗！

啦啦啦，数据准备终于结束了。关于数据的前期处理一不小心就写了这么多了。其实有的小可爱可能会有疑问，觉得数据准备可能没必要写这么详细或者是处理成这样。但是对于萜妹我来说，我不爱走回头路，所以一般来说，我希望我处理完的东西，我不需要再回头去重新算它、调它，又浪费很多心力。

而且萜妹这个无敌大懒鬼，会为了节约自己的时间，而去想一些公式。当我把上面这些公式真正设计出来，并用于实践时，其实我的时间并没有花费的更多。大部分的公式都只需要无脑填充，大规模的变量也可以批量处理，这为我后续的分析也奠定了坚实的基础。所以我认为这样是好的，就想也分享给小可爱这些技巧~

还有关于Excel和数据处理想说的是，比起公式的运用，可能更重要的是，小可爱们要知道自己要完成什么。Excel的公式教学，百度真的轻轻松松。所以当我们知道我想要什么，如何利用公式解决其实就已经近在眼前了~

以上就是萜妹关于数据准备的Excel分享啦，本篇推送涉及的全部公式，都是萜妹自己想的。小可爱们如果也有其他公式，或是其他经验欢迎跟萜妹交流哦~

最后，关于数据可能就只剩筛选啦，考虑到进度，筛选的介绍应该会推后，毕竟它的重要性没有数据分析高~下周就会结合视频开始介绍数据分析啦~

另外，我电脑有点bug，录视频的收音不太好。而且，录到最后录的我嗓子有点哑了，我也是真的尽力了。还是有点委屈小可爱们，萜妹之后会想办法努力解决哒~

那小可爱们，五一假期快乐，我们下周见吧~

往期推送

李尚福、魏凤和双双被拿下，与美国一份报告是否有关？

圈内疯传某谣言

不要放过这些人渣

“辣条二哥”直追卫龙，麻辣王子工厂遇洪受关注

中金跳楼女生诡异之处。

干货丨数据分析之前期准备（下）

您可能也对以下帖子感兴趣

李尚福、魏凤和双双被拿下，与美国一份报告是否有关？

圈内疯传某谣言

不要放过这些人渣

“辣条二哥”直追卫龙，麻辣王子工厂遇洪受关注

中金跳楼女生诡异之处。

生成图片，分享到微信朋友圈

干货丨数据分析之前期准备（下）

您可能也对以下帖子感兴趣