查看原文
其他

干货丨数据分析之前期准备(下)

萜妹 萜心话 2022-09-14

这周我们终于要进入数据准备的收尾部分,要完成反向、变化量、标准化等等操作,让数据成为待分析的状态~


虽然这些操作在SPSS中也可以完成,但是SPSS的语句是即时的。在小可爱们后续补充被试数量时,还需要把那些操作重复一遍。所以萜妹会选择在Excel中完成这些操作,毕竟在Excel中只需要完成公式填充,补充多少次都不愁。


那萜妹开始跟小可爱们分享公式和技巧吧~

(注:处理方式并非唯一,萜妹只是分享个人经验~)



本期推送目标:将数据处理成如下形式





来源:萜妹自制

在介绍具体技巧之前,要先针对这个模板对小可爱们做一个说明(怕文字讲的不够清楚,萜妹还录了个小视频)

第一,这里没有领导原始数据。用这里的数据来分析领导量表的信度会产生误差。因为各组人数不同,会导致权重不同,进而影响到结果。所以想分析领导量表的信度需要额外建立一个Excel。

第二,团队变量是指员工变量的均值。SPSS中无法快速处理,推荐用Excel中的公式。

第三,二次加工变量则是标准化、交互项、差值等变量。SPSS和Excel的操作难度都不大,SPSS可能更简单,Excel则是能实时更新。

为了让小可爱们理解上面这个表格,所以萜妹多加了一行,当做注释。实际操作过程中,除去第一行,就是可以直接导入SPSS或者Mplus中分析的数据啦~(为了页面美观,萜妹隐藏了很多列,实际操作时看起来不会这么简单。)

另外,上面的模板是萜妹做的一个比较详细的版本。在具体操作过程中,可能不涉及部分变量(比如团队变量),小可爱们可以自行取舍。

介绍完模板,接下来会介绍具体的公式和作用,包括:题项反向、变量化、领导数据填充、部门编号汇总、计算团队平均值、变量标准化、计算交互项、计算差值

(可边听视频,边看推送)


题目反向

假设需要反向的题目为A列,那么可以新建B列,在B2输入如下公式,再填充至整列即可。

  • 七点量表:=8-A2;

  • 五点量表:=6-A2;


变量化

假设需要变量化的题目原始状态为下图所示:

方法一:利用Average公式;

  • AF2=Average(S2,:AB2)

  • AG2=Average(AC2:AE2)

方法二:利用Averageif公式;

  • AF2=AVERAGEIF($S$1:$AE$1,"=a*",$S2:$AE2)

  • AG2=AVERAGEIF($S$1:$AE$1,"=ya*",$S2:$AE2)

两种方式看似差不多,都得自己针对每个变量写公式,甚至方法一写起来还更简单一点。但是面对变量比较多的时候,萜妹还是更推荐方法二的。

首先,介绍一下Averageif函数,可以把这个函数通俗的理解为:averagif(if判断的区域,if的判定依据,数据的计算区域)。

其次,在使用时有一个要注意的点是:=和""要一起用,不用""会报错的。

那么最后,萜妹再来介绍我们的方法二。不难看出,方法二的每个变量公式都是基于:

【=AVERAGEIF(完全固定的语句标题,"=语句编码字母*",仅固定列的原始数据)】的变形。

每个变量不同的地方仅在于,对应的语句编码字母。

我们完全可以使用公式填充完所有的变量,再针对不同的编码字母进行修改,这样可以做到快速填充(而且也不那么费眼睛)。

这样就算有20个变量,也可以在半分钟内都计算出结果啦(10秒复制公式,20秒改每个的字母)~


领导数据填充

萜妹之前不是在(上)卷的时候说过,我录领导和员工匹配的问卷,通常喜欢这样录,看起来一目了然一点。

所以,在真正要分析的时候,我们还要先把空白的数据填充好。

具体步骤:

①选中领导数据,行数与员工数据相同。假设有500份员工数据,就选中C2:M501;

②按【F5】➔点击【定位条件】➔选中【空值】➔点击【确认】;

③在C3输入【=C2】,按住【ctrl】再按下【Enter】(这样能让被选择的空值全部填充完好)


部门编号汇总

之前,萜妹的数据是有多个ID的。我们要导入其他软件分析时,也需要合成一个部门ID。

最简单的方法是使用&符号。

如图,在B2输入【=C2&D2&E2】,再向下填充即可。

其实这个时候的ID已经可以代表不同部门了,但是我也知道有的朋友喜欢从1开始,就喜欢正正常常的那种序号。

那么这时就需要利用IF函数解决。首先在A2输入1,再在A3输入【=IF(B3=B2,A2,A2+1)】,最后向下填充即可。


计算团队平均值

团队变量的计算也是利用Averageif公式。

在目标单位格中输入以下公式,再向右向下填充:

【=AVERAGEIF($A$2:$A$36,$A2,AF$2:AF$36)】

要注意以下的各数据的固定情况不可以改变,不然在公式填充的时候会发生变形,导致错误。

  • IF的判断区域($A$2:$A$36,),需要完全固定,即选中后,按一次【F4】;

  • IF的判断依据($A2),则需要固定列,即选中后,按三次【F4】;

  • 数据的计算区域(AF$2:AF$36),则需要固定行,即选中后,按两次【F4】。


变量标准化

变量标准化则是要利用standardize公式、求平均的average函数与求标准差的Stdev.p函数。

在目标单位格中输入以下公式,再向右向下填充:

【=STANDARDIZE(AF2,AVERAGE(AF$2:AF$36),STDEV.P(AF$2:AF$36))】

这里萜妹我再提醒一句,可向右向下填充,意味着,无论你有多少个变量,都只用写一个公式,就可以完成所有变量中所有数据的计算!!!是不是无敌方便!


计算交互项和差值

最后是计算交互项、乘积、差值等。

  • 乘积:=A2*B2;

  • 差值:=A2-B2;

讲道理,这也太简单了对吧,而且也是调整好位置,向右向下一顿填充就完事了。

这不比SPSS一个个算要香多了吗!



啦啦啦,数据准备终于结束了。关于数据的前期处理一不小心就写了这么多了。其实有的小可爱可能会有疑问,觉得数据准备可能没必要写这么详细或者是处理成这样。但是对于萜妹我来说,我不爱走回头路,所以一般来说,我希望我处理完的东西,我不需要再回头去重新算它、调它,又浪费很多心力。


而且萜妹这个无敌大懒鬼,会为了节约自己的时间,而去想一些公式。当我把上面这些公式真正设计出来,并用于实践时,其实我的时间并没有花费的更多。大部分的公式都只需要无脑填充,大规模的变量也可以批量处理,这为我后续的分析也奠定了坚实的基础。所以我认为这样是好的,就想也分享给小可爱这些技巧~


还有关于Excel和数据处理想说的是,比起公式的运用,可能更重要的是,小可爱们要知道自己要完成什么。Excel的公式教学,百度真的轻轻松松。所以当我们知道我想要什么,如何利用公式解决其实就已经近在眼前了~


以上就是萜妹关于数据准备的Excel分享啦,本篇推送涉及的全部公式,都是萜妹自己想的。小可爱们如果也有其他公式,或是其他经验欢迎跟萜妹交流哦~


最后,关于数据可能就只剩筛选啦,考虑到进度,筛选的介绍应该会推后,毕竟它的重要性没有数据分析高~下周就会结合视频开始介绍数据分析啦~


另外,我电脑有点bug,录视频的收音不太好。而且,录到最后录的我嗓子有点哑了,我也是真的尽力了。还是有点委屈小可爱们,萜妹之后会想办法努力解决哒~


那小可爱们,五一假期快乐,我们下周见吧~


往期推送

➪干货丨数据分析之前期准备(上)

➪干货丨数据分析之前期准备(中)

➪干货丨SPSS数据分析之准备篇




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存