查看原文
其他

干货丨数据分析之前期准备(上)

萜妹 萜心话 2022-09-14

上周完成了问卷制作,我们终于可以进入到数据部分啦(撒花)~不过在具体的分析之前,还有一个准备步骤,那就是要把原始数据处理成我们可以分析的样子呀~


萜妹之前看学弟学妹们做数据准备的时候发现,小白们通常不知道哪一步该做什么,导致费时费力还偶尔需要返工。


另外,大家好像比较常用SPSS而忽视了Excel的作用。作为office的狂热粉,萜妹真心觉得在数据的准备过程中,Excel能提供非常大的助力,所以想和小可爱们分享一些Excel的小技巧呀~


那我们开始吧~

(注:处理方式并非唯一,萜妹只是分享个人经验~)



本期推送目标:掌握推送中提及的技巧





从回收的问卷数据变成待分析的可处理数据需要经过:录入、配对、筛选、反向、变量化等步骤。而萜妹通常会在Excel中完成这些步骤,再把数据导入SPSS。


与SPSS相比较,Excel的优点在于:它可以实时更新批量操作(会在后续描述中体现)

  • 实时更新:有新的答卷补充进来时,也可以快速处理为待使用状态;

  • 批量操作:可批量形成新变量。


接下来萜妹给小可爱们介绍并示范用Excel处理数据的全过程,以及其中的一些技巧和经验啦~

第一步肯定是要将问卷数据录入Excel,在这个过程中,萜妹会进行初步的筛选与标记。


前期准备工作

在问卷发放前,萜妹通常会设计出《问卷说明》与《原始数据》两个模板;

①根据问卷内容,设计Excel版《问卷说明》;

做这一步的好处是:把《问卷说明》与《原始数据》打包发给他人,他可以快速得知每个题项的意义。

②根据问卷内容,设计Excel版《原始数据》;

通常我会把问卷第一个题项高亮,这样有利于问卷输入时定位。

接下来,纸质问卷与电子问卷的操作有所不同~


电子问卷操作步骤及技巧

(1)在网站上下载好电子问卷的答卷,并删除【所用时间】外的其他网页自带结果;

(2)删除重复项;

有的员工会重复填写问卷,为避免这种情况,可以在问卷星里直接设置:一个IP/设备只能作答一次。如果没有设置,那么需要在Excel里排除重复值。

萜妹通常以【Tel】为鉴别重复值的依据,具体步骤如下(需结合视频观看)

①排序;

【Ctrl+A】选中全部单元格 ➔点击【排序和筛选】➔点击【自定义排序】➔按【Tel】升序

②拖至表格末端,处理异常值;

③再排序;

④条件格式(使重复值更明显);

选中【Tel】列 ➔点击【条件格式】➔点击【新建规则】

选择【仅对唯一值或重复值设置格式】➔点击【格式】

选择【填充】➔选中某一颜色➔点击【确定】

⑤删除重复值(或者标记重复值)。

(3)标记异常值;

①将【所用时间】的“秒”替换为“ ”,否则排序时会按照文本逻辑,而非数字逻辑;

②按【所用时间】排序,筛选填写时间过短的问卷,如均选中立值这种。


纸质问卷录入步骤及技巧

  • 纸质问卷录入技巧

借助键盘】在不出错的情况下,全程可以只用【Tab】键、数字键盘、【Enter】键和【Home】键完成数据录入。

为什么我推荐用Excel录入问卷,因为在这里可以用键盘减少很多步骤。

技巧一:进入后一空时,使用【Tab】而非【→】

  • 在整行使用【Tab】转换且输入无误时,直接【Enter】可进入下一行的起始输入列。此时不需要鼠标操作,可直接继续录入下一份问卷。

  • 而使用【→】再按【Enter】只能进入下一行的同一列,需要额外操作定位到起始输入列。

技巧二:【Home】键可快速回到行首

比如录完一组员工问卷需要再录领导卷时,按【Enter】会回到员工起始行,而按【Home】则可以回到领导起始行。

巧用公式利用MID()公式可批量录入!!!(重点)

如何在上述技巧上再简化操作,萜妹想到的就是MID()公式。

MID(Text,X,N)含义是从目标文本的第X个字符开始,提取N个字符。

具体操作方法的文字描述不太好写,小可爱们可以自行尝试,如果不会可以也看视频。

另外要注意的是,目标文本不宜过长,个人感觉最好不要超过7个。此外,全部录完后,最好以仅保留文本的方式将其复制到新的文件里,以便后续。

利用替换】如果涉及到月份时,可以先按月份输入,最后再替换为小数。

①先按【年份.月份】的形式输入;

例如,工作1年3个月可先输入为1.3;2年11个月个可输入为2.11;3年10个月可输入为3.01。

10月份的时候输入其他数字也行,反正重点是不需要思维加工。这样在每次到月份时可以不需要心算或者记忆。

②全部录入结束后,统一替换。

替换的时候要小心顺序,有可能需要二次替换。

  • 常见问题及处理方式

团队内成员较多时】在问卷录入前先将每组问卷大致浏览一遍,按问卷质量编号。

为了核查,纸质问卷通常需要手写编号。这时候萜妹会选择先看一遍问卷,再排序、编号。

这样操作的好处:

  • 第一,有利于后期的问卷筛选;

  • 第二,心里大致有个谱,不然边录边发现问卷质量不好,容易影响工作积极性。

多时点的匹配问卷】在时点1时,先录领导卷,再录员工卷。领导卷与第一份员工卷位于同一行。

后续员工的领导卷部分先空置,等最后处理完再一起填充,前期保持空置方便查看。

存在异常值】问卷录入时,遇到异常值可分颜色标识,以下为常见异常:

  • 出现漏填、多填的情况;

  • 所有变量均选中值,如全部问卷都选4;

  • 组内重复度过高,如前后问卷所有题目取值相同。



今天没有啦啦啦了,因为萜妹我完全没想到这篇推送会写这么久,以及还只写完了第一个部分。在我提前准备好大纲的情况下,这篇推送花了我七个小时,简直不可思议(其中起码三个小时花在跟视频作斗争,我太菜了)


所以为了今天能按时更新,这周只有上卷啦~希望下周能更新下卷,千万不要再来个中卷了。


另外,如果有小可爱还是喜欢用SPSS处理问卷,可以考古萜妹以前的推送(往期推送第三篇)。毕竟萜妹写本科毕业论文的时候使用的是SPSS呀~


最后小可爱们,我们下周见吧~


往期推送

➪干货丨问卷制作指南

➪干货丨量表获取方法

➪干货丨SPSS数据分析之准备篇




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存