笔记丨定性比较分析之模糊集

原创 TIE 萜心话 2022-09-14

收录于合集 #QCA合集 9个

啦啦啦，终于要开始介绍模糊集啦~

那我们现在开始吧~

注：考虑到讲座部分资料涉及主讲者个人信息，因此本次资料仅做部分分享（仅包括软件+文献），可后台回复"2019QCA"获得。

第五部分

Q C A 类型详述

首先，萜妹怕基础篇过去太久小可爱们忘了这三类的区别，所以我先带小可爱们回顾一下。

类型

名称

变量范围

变量值格式

csQCA

Crisp-set

清晰集

二元的

present(1)和absent(0)

mvQCA

Multi-value

多值集

多元的

离散的数字：0，1，2，3，4

fsQCA

Fuzzy-set

模糊集

连续的

0~1之间精细的刻度值

之后呢，因为我们前面的所有示范都是清晰集的，所以相信小可爱们对清晰集已经有了比较深刻的理解，这里就不再赘述了。萜妹接下来主要介绍多值集和模糊集。

多值集（mvQCA）

清晰集的弊端

多值集的出现是因为清晰集存在弊端，比如：

之前的民主生存案例，最后的处理超越了 Lipset的理论的简单测试，加入了一个该理论范围之外的条件；
纳入了大量的受人质疑的“逻辑余项”；
难以获得足够简约的最小公式，可能因为条件必须从一开始就被二分。

此外，有些情况并不适合使用清晰集。Eg：交通灯（红黄绿）不会同时出现111和000的状态，所以用二分并不恰当。

多值集的弊端

目前软件尚未开发完善，所以多值集的一致性需要手动算，而且还难算。

解决方式：可将多值集转换为模糊集。

模糊集（fsQCA）

模糊值是指多大程度属于xx条件，如：多大程度觉得自己属于高收入群体，所以取值在于0~1之间。

这里就会涉及一个概念，即交叉点。

交叉点：

定义：交叉点0.5 是属于或者不属于一个集合时的最大模糊点（fuzziness），即取0.5时不知道该将其归类为属于或不属于。

问题：如果有大量的0.5，机器无法判断，那么将无法代入进入。

Eg：100数据里头有60个0.5，那么只有40个数据在被计算。

解决方式：所以针对上述容易出现的问题，小可爱们在设定交叉点的时候可以参考以下技巧。

问卷数据：李克特5点量表转换的时候，不要用3转0.5，用2.9或者3.1，这样可以避免0.5。
具体数据：交叉点设置的时候，要在平均数或者中位数上下浮动一点，这样避免产生太多交叉点。

校准：

因为模糊集的特殊属性，模糊集相比于清晰集最大的不同在于多了校准的步骤。

校准的核心是利用Calibrate函数以及找出三个定性的锚点。

注意：在设置这三个点的时候，研究者需要给出理由。

三个点的设置与原始数据有关，比如看平均值、标准差、中位数……，

软件操作：

模糊集的求解是在原始数据录入后，多了一步校准步骤，具体fsQCA的操作如下：

①导入原始数据后，点击【Variables】-【Compute】，如图。

②第一个小空填写的是计算变量后生成的名字；第二个大空是写表达式：这里先在右侧选定Calibrate函数，并将各个部分对应填写。

③点击【OK】后，可以从数据视图中发现被校准过的变量。

④后续把所有的变量处理完毕，再像之前一样求解就好。

啦啦啦，模糊集其实和清晰集的差别真的没有那么大，所以这次就不再重复已经说过的问题了。另外QCA这个系列可能还有一两次就会结束啦，剩下的内容不是非常的有体系，所以萜妹还在考虑后面的怎么呈现。

另外就是前两天萜妹又出去听了一个数据分析的培训，内容大概是跨层次分析和高级中介、调节。这个内容吧，其实萜妹之前的推送有写过，再写可能只是补充而已；另外，也有考虑介绍一些理论，毕竟技术和理论都是写文章必备的能力啊，所以就在纠结，是继续写操作还是去试试写理论，想看看小可爱们有没有什么建议呀~

不过下周还是QCA的介绍啦，嘻嘻嘻，那小可爱们，我们下周见吧~

【萜心话】

研一新生丨健身少女丨电竞迷妹

交流平台丨回忆手册丨神秘树洞

晚上好~

✬如果你喜欢这篇文章，欢迎分享到朋友圈✬

李尚福、魏凤和双双被拿下，与美国一份报告是否有关？

圈内疯传某谣言

不要放过这些人渣

“辣条二哥”直追卫龙，麻辣王子工厂遇洪受关注

中金跳楼女生诡异之处。

笔记丨定性比较分析之模糊集

您可能也对以下帖子感兴趣

李尚福、魏凤和双双被拿下，与美国一份报告是否有关？

圈内疯传某谣言

不要放过这些人渣

“辣条二哥”直追卫龙，麻辣王子工厂遇洪受关注

中金跳楼女生诡异之处。

生成图片，分享到微信朋友圈

笔记丨定性比较分析之模糊集

您可能也对以下帖子感兴趣