查看原文
其他

定性比较分析(QCA)操作指南:Pappas和Woodside(2021)一文的翻译

长伟 伟识一丁 2022-09-14

本文主要是对Pappas和Woodside的“Fuzzy-set Qualitative Comparative Analysis (fsQCA): Guidelines for research practice in Information Systems and marketing”一文部分章节的翻译笔记,该文发表在信息系统领域国际顶刊《International Journal of Information Management》最新一期,不仅提供了详尽的方法论说明,而且展示了软件操作的每一步骤,是学习QCA的绝佳参考资料。如有翻译出入,烦请雅正,并请以原文为准。

写在前言

许多朋友,包括我在内,学习QCA的参考资料主要是东南大学杜运周老师所翻译Charles Ragin, 的两本经典著作:

【1】QCA设计原理与应用:超越定性与定量研究的新方法. 杜运周,李永发等译.北京:机械工业出版社,2017.7/ Rihoux, B., & Ragin, C. C. (2008). Configurational comparative methods: Qualitative comparative analysis (QCA) and related techniques (Vol. 51): Sage Publications.

【2】重新设计社会科学研究/ 杜运周等译.北京:机械工业出版社,2019.7/ Ragin, C. C. (2008). Redesigning social inquiry: Fuzzy sets and beyond: University of Chicago Press.

以及一些经典的方法论书籍和文章


Schneider, C. Q., & Wagemann, C. (2012). Set-theoretic methods for the social sciences: A guide to qualitative comparative analysis: Cambridge University Press.



Fiss, P. C. (2011). Building better causal theories: A fuzzy set approach to typologies in organization research. Academy of Management Journal


Ragin C C, Strand S I, Rubinson C. User’s guide to fuzzy-set/qualitative comparative analysis[J]. University of Arizona, 2008, 87.
还有最近几年陆续发表的方法论文章
  1. Misangyi, V. F., Greckhamer, T., Furnari, S., Fiss, P. C., Crilly, D., & Aguilera, R. (2017). Embracing Causal Complexity: The Emergence of a Neo-Configurational Perspective. Journal of Management

  2. Greckhamer, T., Furnari, S., Fiss, P. C., & Aguilera, R. V. (2018). Studying configurations with qualitative comparative analysis: Best practices in strategy and organization research. Strategic Organization

  3. Douglas, E. J., Shepherd, D. A., & Prentice, C. (2020). Using fuzzy-set qualitative comparative analysis for a finer-grained understanding of entrepreneurship. Journal of Business Venturing

  4. Fainshmidt, S., Witt, M. A., Aguilera, R. V., & Verbeke, A. (2020). The contributions of qualitative comparative analysis (QCA) to international business research. Journal of International Business Studies.

  5. Furnari, S., Crilly, D., Misangyi, V. F., Greckhamer, T., Fiss, P. C., & Aguilera, R. (2020). Capturing Causal Complexity: Heuristics for Configurational Theorizing. Academy of Management Review.

  6. Park, Y., Fiss, P. C., & El Sawy, O. (2020). Theorizing the Multiplicity of Digital Phenomena: The Ecology of Configurations, Causal Recipes, and Guidelines for Applying QCA. MIS Quarterly.


今天重点介绍Pappas和Woodside的这篇文章,以图文并茂的形式提供了有关如何使用fsQCA的指南。全文篇幅过长,本文仅摘取主体部分进行翻译。

摘要

信息系统和市场营销研究者对模糊集定性比较分析(fsQCA)的兴趣日渐浓厚,因此需要一篇指导论文,讨论该方法的基本概念和原理,为编辑、审稿专家和作者所遇到的典型问题提供答案,并指导研究人员如何使用fsQCA。本文提出了一种非对称的、以组态为重点的研究范式,可帮助读者从其所用数据中获取更丰富的信息,并避免对数据分析结果的粗浅报告。基于已发表的研究,本文:
提供了有关如何使用fsQCA的详细分步指南;
分析同一数据集,并在分析的每个步骤中展示所有详细信息,以指导读者如何使用fsQCA;
讨论了fsQCA与基于方差的方法之间的差异,并将fsQCA与结构化方程模型的方法进行了比较;
概述了实操QCA的阈值和准则,并讨论了如何使用fsQCA扩展和补充采用基于方差方法的现有论文。

1 引言 Introduction

定性比较分析(Qualitative comparative analysis,QCA)是一种非对称的数据分析技术,它结合了具有丰富情境信息的定性方法,以及能够处理大量案例且比对称理论和工具更具普遍性的定量方法的逻辑和经验强度(Ragin,1987)。这种结合定性和定量分析技术的方法,与传统基于方差并采用零假设显著性检验(NHST)的定量分析方法有很大不同。
QCA 可以识别逻辑简化的陈述(statements),描述导致给定结果的不同条件组合(或组态)(Ragin,2008b)。组态是一组具有协同性质的原因变量,用以映射观察到的结果或感兴趣的结果。QCA 主要有三种类型: 清晰集 QCA (csQCA)、多值集 QCA (mvQCA)和模糊集 QCA (fsQCA)。
在组态方法中,指示结果的条件(conditions)被视为相关构念的组态,而非被独立考察的实体。通过分析不同的组态,可以对信息系统和市场环境有系统和全面的了解。QCA 可用于归纳、演绎和溯因推理(Park,Fiss,& El Sawy,2020; Saridakis,Angelidou,& Woodside,2020),也可用于理论构建、理论阐述或理论测试(Misangyi,& Fiss,2013; Misangyi et al. ,2017)。
QCA 在许多研究领域越来越受欢迎,包括e-business (Pappas, Kourouthanassis, Giannakos, & Chrissikopoulos, 2016), social media (Pappas, Papavlasopoulou, Mikalef, & Giannakos, 2020), information systems (Liu, Mezei, Kostakos, & Li, 2017; Park & Mithas, 2020; Park et al., 2020), education (Nistor, Stanciu, Lerche, & Kiel, 2019; Pappas, Giannakos, Jaccheri, & Sampson, 2017), and learning analytics and multimodal data (Papamitsiou, Economides, Pappas, & Giannakos, 2018; Papamitsiou, Pappas, Sharma, & Giannakos, 2020)。
与此同时,陆续出版了QCA研究中的良好实践标准(Woodside,2016a,2016b) ,全面且易于理解的”良好做法守则”(Schneider & Wagemann,2010) ,以及详细描述该方法的教科书(Rihoux & Ragin,2009)。
QCA 研究旨在将定性和定量方法的技术结合起来(Ordanini,Parasuraman,& Rubera,2014; tedlie & Tashakkori,2009) 。定性归纳推理是指QCA通过“个案”而非“变量”分析数据(Ragin,2000) ,定量实证是指QCA通过统计方法确定导致结果的充分和必要条件(Longest & Vaisey,2008; Ordanini 等人,2014)。大多数情况下,QCA服务于定量研究,以获得对数据的深入了解,但也具有定性分析的几个特征。个案研究侧重于描述、解释和预测单个条件与条件组合作为前因对结果的影响,而变量研究侧重于两个或两个以上变量方差的相似性。“条件”是前因或结果的一个点或区间范围,而 “变量”的特征是变化的。这里有几个条件与变量的例子: “ Male”是一个条件,“gender”是一个变量。“Swedish”是一个条件,“nationality”是一个变量。“Expert”是一个条件,“expertise”是一个变量。
本教程扩展当前的QCA工作,作出如下贡献:i)例证了 fsQCA 的应用,ii)论证了执行反向案例分析的必要性,以及 iii)描述了如何执行结果的预测效度。为此,我们将上述三种分析的建议步骤映射到两个流程图中。在此基础上,我们对 fsQCA 和 PLS-SE 进行了比较,并讨论了两种方法在概念上的差异,最后总结了 fsQCA 中常用的一些阈值。

2 定性比较分析的类型
Types of qualitative comparative analysis (QCA)

2.1. 清晰集QCA (CsQCA) 和 多值集QCA (mvQCA)

CsQCA 是 QCA 的第一种类型,用于处理复杂的二进制数据集(Ragin,1987)。QCA 的目标是解释现实生活中复杂现象的“多重并发因果关系”(multiple-conjunctural causation)。多重并发因果指的是“非线性、非可加性、非概率的概念,否定任何形式的永久因果关系,而是强调等效性(equifinality,即不同路径可以导致相同结果) ,条件和条件的复杂组合多样性”(Berg-Schlosser & De Meur,2009)。QCA使用布尔代数和布尔最小化算法来捕捉多重连接因果关系的模式,并以逻辑和整体的方式简化复杂的数据结构。使用布尔代数意味着 QCA 以二进制数据(0或1)作为输入,并使用逻辑运算(即AND/OR),因此对变量进行有意义的二分是非常重要的。
mvQCA是csQCA 的一个扩展 ,将变量看作是多值的而不是二分的(Cronqvist,2004)。MvQCA 保留了对数据集进行综合的想法,结果变量由一种多变量组合的解(solution)来解释(Cronqvist & Berg-Schlosser,2009)。自该方法引入以来,mvQCA 的潜力及其实用性收到广泛讨论 (Thiem,2013; Vink & Van Vliet,2009; Vink & Vliet,2013),但与其他两种 QCA 变体相比(即 csQCA 和 fsQCA,mvQCA仍未得到充分利用(Thiem & Dusa,2013) 。

2.2 模糊集QCA(fsQCA)

CsQCA 的一个重要局限是二进制变量无法完全捕捉随级别或程度而变化的案例复杂性。FsQCA 通过将模糊集和模糊逻辑与 QCA 原理相结合解决了这一问题(Ragin,2000; Rihoux & Ragin,2009)。当与复杂性理论一起应用时,fsQCA有助于获得更深入和更丰富的数据洞察力,最近得到了越来越多的关注(Fiss,2011; Ordanini 等人,2014; Pappas 等人,2016; Woodside,2014) 。

2.3 FsQCA 和聚类分析(cluster analysis)

FsQCA 和数据聚类方法都是基于案例的技术(Cooper & Glaesser,2011)。这两种技术有相似之处,因为它们都运用了多维空间(multidimensional spaces)。fsQCA 和聚类的一个主要区别在于它们能够解决的研究问题(Greckhamer,Furnari,Fiss & Aguilera,2018)。具体来说,数据聚类可以回答“哪些案例彼此更相似”的问题,而 fsQCA 可以识别"构成给定结果的充分和/或必要条件的不同组态"。QCA 通过集合论操作解决了案例在[多维]空间中的定位问题,而数据聚类则依赖于几何距离度量和方差最小化。为此,先前研究比较了两种分析方法(Greckhamer et al. ,2018; Miller,2018) ,并展示了 fsQCA 如何处理细致数据的因果复杂性(Fiss,2011) 。这两种方法适用于不同类型的研究。根据研究重点,研究者应该选择最合适的方法。

3 在相关研究中采用fsqca
Adoption of fsQCA in relevant studies

在过去几年里,组态方法在不同的领域越来越流行,fsQCA在其中发挥了很大作用(Thiem & Dusa,2013)。fsQCA 已经应用于信息系统(Fedorowicz,Sawyer,& Tomasino,2018; Liu et al. ,2017)、在线商业和营销(Pappas et al. ,2016; Pappas,2018; Woodside,2017)、消费者心理学(Schmitt,Grawe,& Woodside,2017)、战略和组织研究(Fiss,2011; Greckhamer et al. ,2018)、教育(Pappas,Giannakos et al. ,2017; Plewa,Ho,Conduit,& Karpen,2016) ,数据科学(Vatrapu,Mukkamala,Hussain & Flesch,2016)和学习分析(Papamitsiou et al. ,2018; Sergis,Sampson,& Giannakos,2018)。在开展更多的实证研究之后(El Sawy、Malhotra、Park和Pavlou,2010;Fiss,2011;Woodside,2014,2017),本教程旨在呼吁在信息系统和营销研究中增加fsQCA的采用。
FsQCA 适用于理论构建、阐述和测试。研究人员可以基于理论或先前发现,探索影响给定结果的所有可能解[Pappas et al. ,2016)]或者测试特定的模型和关系(Pappas,2018) 。尽管如此,这两种方法都可以先识别所有可能的解,然后测试具体的命题。这种分析可以确定样本中的特定案例、验证了特定主张的用户,并指出可以解释相同结果的其他替代模型。基于这些知识,研究人员可以回到案例中,使用情境信息来进一步解释和讨论这些发现。相比之下,基于方差的分析仅确定一个最优解,限制了结果(Woodside,2013, 2016b)。尽管如此,研究可以比较不同数据分析技术之间的发现,以描述隐藏在同一数据集中的不同故事,同时建议尽可能将 fsQCA 与其他数据分析技术结合起来(Schneider & Wagemann,2010)。

4 复杂性和组态理论
Complexity and configuration theories

变量之间的关系是复杂、非线性的,突然的变化可以导致不同的结果(Urry,2005)。基于方差的方法(VBA, Variance-based approaches)假定变量间关系是线性的,将复杂现象作为相关条件的集群,可以克服这一问题(Woodside,2017)。组态理论方法为全面理解这些条件所创造的模式迈出了一步。
一个目的地通常可以由不同途径达到,因而一个结果也可以通过前因条件的不同组合来解释。复杂性理论和组态理论的等效性原理(equifinality)指出了前因条件的多重组合具备同等的有效性(Fiss,2007; Von Bertalanffy,1968; Woodside,2014)。许多因素可以影响信息系统的用户体验,一般来说,这些因素的不同组合,以及同一因素的不同层次,都可以解释它们的技术采纳。这意味着并非所有因素(或前因)都需要用来解释采纳情况,其中一些因素结合在一起可能就能够充分解释采纳率高或使用率高的原因。尽管如此,某个因素对于高采用率或高使用率是必不可少的。
组态理论基于因果非对称原理(causal asymmetry),基于这一原理,解释结果存在的条件(或条件组合)与导致相同结果不存在的条件(或条件组合)并非镜像对立的(Fiss,2011; Ragin,2008b)。例如,感知有用性高可能导致使用系统的意愿高,而感知有用性低可能不会导致使用意愿低。虽然这样的假设似乎很常见,但当我们使用VBA(例如,相关性,回归)时,变量间的关系通常是对称的(高感知有用性——高使用意愿; 低感知有用性——低使用意愿)。在集合论的术语中,高感知有用的存在可能导致高使用意图(充分性)。然而,即使在高感知有用性不存在的情况下,高使用意图也很可能存在,这表明感知有用性的存在是高使用意图的充分不必要条件。此外,在不同的背景下,当存在其他条件(如高感知效益)时,高感知有用性可能是高使用意图的必要不充分条件。此外,有时仅在第三方条件存在或不存在,高感知有用性才可能导致高使用意图(例如,高或低/中感知易用性)。
因为 fsQCA 基于模糊集合,因此该工具能够捕捉到(1)解释结果的充分和必要条件和(2)本身不足以解释结果,但是可以解释结果的解的必要部分。这些被称为 INUS 条件:结果的充分不必要条件的必要不充分部分(insufficient but necessary part of a condition which is itself unnecessary but sufficient for the result,Mackie,1965)。这些条件可能在解中存在,也可能不存在,或者是我们“不关心(do not care)”的条件。这种“do not care”的情况表明,结果可能存在,也可能不存在,而且它不会在特定的组态中发挥作用。必要和充分条件可以作为核心元素和边缘元素存在。核心元素与结果有强烈的因果关系,而边缘元素的因果关系较弱(Fiss,2011)。因此,使用 fsQCA,研究人员可以确定哪些条件是不可缺少的(或不需要) ,以及哪些条件组合比其他条件更重要(或更不重要)。

5 fsQCA 的好处-为什么要使用它?

与传统分析方法相比,fsQCA 可以提供几个好处。FsQCA 使用定性和定量评估并计算案例隶属集合的程度,获取产生结果的充分条件组合(Ragin,2000; Rihoux & Ragin,2009) ,从而在定性和定量方法之间建立一座桥梁。FsQCA 使用校准步骤将不同类型的数据转换到[0,1]范围。校准(Calibration)在自然科学中很常见,但在社会科学中并不常见,它可以用来满足定性研究人员解释相关和无关的变化,以及定量研究人员在精确地将案例相对于另一个案例放置时的需求。
与VBA相比,fsQCA的主要优势在于解决后者的局限(El Sawy 等人,2010; Liu 等人,2017; Woodside,2013,2014)。一般来说,VBA以竞争的方式检验变量,计算模型中变量间的净效应,而 fsQCA 侧重于感兴趣的结果和它的前因之间复杂和不对称的关系。例如,遵循行为科学范式,在典型的“IS/IT 采用(意图)”研究中,传统作为控制变量的变量(例如,性别,经验),在QCA分析中可以成为解的一部分。一个结果可能由多种变量组合导致,每种组合对其都有独立贡献。此外,当我们试图设计一个考虑到“所有用户”(即有不同需求的用户)的系统时,我们需要让研究人员能够为多种类型的用户计算多个解,而非回归分析探索的唯一最佳解。
FsQCA 适用于从非常小(< 50例)到非常大(数千例)样本的研究设计。样本大小为研究人员提供了不同选择。在小样本研究中,研究者可以回到个案并单独解释它们;而大样本的QCA设计能够识别大量案例中的普遍模式(Greckhamer 等人,2013)。此外,fsQCA 适用于不同类型的数据(例如,Likert-scale,clickstreams 和 multimodal data),只要研究人员能够将它们转换成模糊集。同时,fsQCA 可以与不需要转换成模糊集的分类变量(如性别)结合。在这种情况下,一些变量是二进制的(0/1) ,而另一些变量则具有[0,1]范围内的值。
使用 fsQCA 进行数据分析,可以得到自变量的组合,其中也包括不具备显著性影响的变量(Woodside,2014)。FsQCA 将样本分解为多个子集,从而检查多个条件组合。每个组态只代表样本的一个子集,而异常值只会出现在一些可能的解中。因此, fsQCA 对异常值不敏感,样本的代表性不会影响到所有的解,这使得它比VBA更稳健。在使用 fsQCA 之前对反向案例(contrarian cases)进行测试,并检查样本的分布情况,有助于确定异常值,并了解样本中有许多案例没有得到主要影响的解释(详见第6.2节中的反向案例分析)。在现有研究中,通常缺乏反向案例分析。
FsQCA 要求研究者对被检查的变量(条件和结果)、基础理论和背景都有准确的知识。这些知识应用于整个分析过程,包括(1)数据校准(即将变量转化为模糊集合) ,(2)简化多重解,(3)解释结果。研究者应根据定性分析中典型的知识,在不同阶段作出决策。这个行动既是 fsQCA 的限制,也是它的强项。在引入主观偏见的同时,研究者自身对该领域和研究问题的认识和理解可以导致对数据更丰富的分析和理解。在传统的混合方法中,研究人员会采用定量研究(例如,分析问卷、点击流、日志文件) ,然后采用定性分析(例如,对关键参与者进行访谈) ,以获得对本质上难以捕捉的联系和模式的更丰富的理解。FsQCA 的目的不是测量每个变量对整体数据的独特贡献,而是确定复杂的解和自变量的组合。
最近,fsQCA 既可以用于分析定量数据(例如,Pappas 等人,2016; Vatrapu 等人,2016; Woodside,2017) ,同时也可以将定性数据校准到模糊集(Basurto & Speer,2012; Henik,2015)。同时,QCA 也被用于混合方法研究(Cairns,Wistow,& Bambra,2017)。
FsQCA 提供了一种分析当前数据集的新方法,可以将定量或定性数据集合在一起,拓宽了我们的方法论和数据分析。但在采用fsQCA时仍存在一些需要考虑的局限性 (Liu et al. ,2017; Mendel & Korjani,2012; Woodside,2014)。此外,在采用QCA时应考虑已经提出的一些最佳实践(gleckhamer 等人,2018; Schneider & Wagemann,2010; Woodside,2016b)。值得注意的是,当涉及到数据分析时,fsQCA 为研究人员提供了更大的灵活性,它可以用于探索性或验证性的目的,研究人员不应机械地使用它。在分析过程中应报告所有主观决定,以显示研究的有效性和可复制性。

6 如何使用 fsQCA
在一个典型的电子商务研究中逐步使用 fsQCA 的例子

本节使用最近一项研究中的数据(Pappas et al. ,2016),提供了fsQCA逐步分析的教程。图1展示了 fsQCA 的推荐步骤。
【补充,本节仅翻译6.1-6.6,涵盖一个主流QCA范式的基本步骤】

6.1 研究背景介绍

本文所基于的研究考察了在个性化电子商务环境中,认知和情感感知作为网上购物行为的前因(Pappas et al., 2016)。采用滚雪球抽样方法来招募参与者,样本包括582名具有网上购物和个性化服务经验的个人。通过问卷调查收集数据,附录A列出了构念的定义、测量,以及描述性统计和负荷。
在定量研究中,首先需要评估构念的信度和效度。构念的信效度,顾名思义,是指构念本身,而不是用来检验构念间关系的分析方法,因而与fsQCA分析并没有直接关系,这一步是否需要执行还需视情况而定。本文的验证性分析部分可以在原始论文中找到(Pappas et al. ,2016)。

6.2 反向案例分析 Contrarian case analysis

反向案例分析是在 fsQCA 之外执行的,它可以简单而快速地检查样本中有多少案例未被主效应解释,不会被包含在典型的VBA(例如,相关性或回归分析)的结果中(Woodside,2014,2016a)。先前仅有少数研究进行了反向案例分析(Pappas 等人,2016) ,许多使用 fsQCA 的研究没有汇报反向案例的测试。事实上,当检查两个变量之间的关系时,样本中的大多数情况都验证了主要关系(正向或负向)。然而,样本中某些案例似乎存在相反关系的情况。这种情况可以通过反向案例分析来确定(Woodside,2014),因为反向案例的发生与主效应的显著性无关。
进行反向案例分析,首先需要分割样本,以调查被检验变量间的关系。为此,我们使用五分位数(quintiles,将样本分成五个相等的组)来分割相同的结果。应该避免其他分割方法,如中位数分割,可能导致统计能力的降低,以及当变量相关时产生假结果(Fitzsimons,2008)。接下来对五分位数进行交叉表格处理,交叉表格能够计算变量之间的联系程度,表明两个变量之间的依赖关系,并描述了它们之间的主效应。任意两个变量的处理结果是一个5×5的表,它显示了样本中两个变量之间所有情况的所有组合(附录 b 图B4) 。左上角和右下角的案例代表主要主效应(例如,关联程度) ,而左下角和右上角的案例则不能用主效应来解释。后者即样本中存在的反向案例。

关于如何进行反向案例分析的所有细节见附录 b,所有变量的反向案例分析结果见附录 c 。研究结果表明,这些变量之间存在着各种各样的与主效应分离的关系,支持进行组态分析的必要性。

6.3 校准 Calibration

6.3.1. 数据处理 Data treatment
在 fsQCA 中最重要的一步是数据校准。大多数类型的数据都可以被使用(例如,调查回复、点击流、用户/绩效数据和生理数据)。当一个变量或构念用多个题项进行测量时,我们需要为每个构念计算一个值,用作 fsQCA 中的输入。换句话说,对于数据集中的每个案例(行) ,每个构念(列)都需要一个值。最简单的方法是计算所有题项的平均值,以便为每个案例提供一个单一值。
此外,fsQCA 并不测试构念的信度和效度,因为这些测主要用于测量而不是分析方法。如果研究中使用的构念需要测试其信度和效度,那么这是在 fsQCA 分析之前进行的,遵循传统的方法,并且必须相应地报告。
FsQCA 将数据从定序或区间尺度转换为目标集合中的隶属度,这显示了一个案例是否或在多大程度上属于特定的集合。一个模糊集隶属度给一个陈述(statement)赋予了一个真实值,而不是一个概率。例如,可将购买意愿变量编码为”高购买意愿”,我们将探究高购买意愿条件的存在或不存在(”购买意愿”是变量,”高购买意愿”是条件)。
FsQCA 单独计算条件的存在或条件的对立面(即否定)。条件的否定在文献中被称为条件的缺席(absent)(Fiss,2011; Pappas,2018; Ragin,2008b)。缺席这个术语也被用来描述当这种情况在组态中无关紧要的时候(Nagy et al. ,2017; Woodside,2017) ,类似于文献中经常使用的“do not care”(Fiss,2011; Pappas et al. ,2016)。然而,二者是有区别的,研究人员在未来的工作中清楚地定义这些术语(Pappas,2018) 。
6.3.2 将数据转换为模糊集
在 fsQCA 中,需要将案例的某一变量值校准为0至1的模糊集隶属度,从而成为一个集合(Ragin,2008b)。模糊隶属度为1说明该案例完全隶属于该集合(完全在集合中) ,而模糊隶属度为0说明该案例完全不隶属于该集合(完全在集合外)。模糊隶属度为0.5也称交叉点、中间点或最大模糊点,指一个案例既是模糊集的隶属又是非隶属。
校准方法可分为直接和间接两种方式。在直接校准法中,研究人员需要精确地选择3个定性截断点,截断点定义了每个案例在模糊集中的隶属水平(完全隶属,中间点,完全不隶属)。在间接校准法(也叫赋值法)中,需要在定性评价的基础上对测量结果进行重新标定(rescaled)。研究人员可能会根据研究问题,以及研究人员对数据和基本理论的实质性知识,选择不同的校准方法(Rihoux & Ragin,2009)。建议使用直接校准法,这种方法更为常见。此外,清楚地汇报阈值是如何选择的,有助于研究更严谨,可重复和验证。
6.3.3 为直接校准法选择阈值
为了校准数据,我们可以选择值0.95、0.50、0.05作为三个阈值(注意,这里是对应的模糊集隶属度,而非在软件中输入0.95/0.50/0.05) ,把数据转换为0到1之间的值。我们不使用精确的1和0作为断点,因为对于概率对数而言,这两个隶属度分别对应于正无穷和负无穷(Ragin,2008a)。要查找数据集中与0.95、0.50和0.05相对应的值,通常使用百分位数。百分位数允许任何数据类型测量的校准,不管其原始值是多少。具体来说,可以在 SPSS 中使用“百分位数”函数(频率 > 统计数据 > 百分位数)计算95% 、50% 和5% 的值,并使用这些值作为 fsQCA 软件中的三个阈值。尽管如此,阈值应当视情况改变或调整,研究人员不能机械地选择阈值。例如,如果数据不是正态分布,而是倾斜的,那么完全隶属、中间点和完全不隶属的阈值可以分别设置为原始数据的80% 、50% 和20% (Pappas,Mikalef,Giannakos,& Pavlou,2017)。在任何情况下,阈值的选择都应该得到合理的解释和相应的报告,并附上一个表格,列出与每个阈值相对应的原始值(图2)。

对于广泛使用李克特量表,有其独特的校准方式。先前研究表明,对于7点量表,可以用6,4,2作阈值(Ordanini 等人,2014; Pappas 等人,2016)。类似地,对于5点李克特量表,阈值可以为4,3,2。图2所示的例子使用了7点李克特量表。我们注意到,对于大多数变量,百分位数给出的值与我们直接选择6、4和2给出的值相同。然而,并非所有变量都是这样。具体来说,弱负面情绪总体得分最低,95% 、50% 和5% 分别是4.33、2.00和1.00。由于这是一个用7点李克特量表测量的构念,如果我们使用95%作为完全隶属,这意味着分数4.33或更高的用户完全隶属于集合。然而,这将是一个不准确的情况,因为4.33更接近于7点量表的中点。因此,使用阈值6、4、2可以更准确地表示示例。
【这里我额外做一点补充,Pappas这里的意思应该是不管数据倾斜度,对所有的量表采用统一的刻度值。而先前一些使用李克特量表的研究则提出了相反论点,即当数据分布有偏时,校准点也应当调整。例如7点量表使用6,4.5,3(Mikalef和Pateli, 2017);5点量表使用5,3.5,1 (Jacobs和Cambre, 2020)】
6.3.4. 在 fsQCA 软件中校准数据
一旦确定了阈值,我们就进入 fsQCA 软件(fsqca3.0版本)中的数据校准(Ragin & Davey,2016)。数据集文件需要使用“comma-separated values” (.csv)格式。校准通过使用软件的Compute > Calibrate 功能来执行,将待校准的变量和3个锚点(从最高值到最低值)作为输入。应该指出的是,研究人员可能会使用其他软件的校准程序,并不是必须使用Logistic校准所有值。相反,也可以使用其他隶属函数(线性或非线性)(Mendel & Korjani,2012年)。此外,fsQCA 软件也存在一个用于 R 的包(Thiem & Dusa,2013)。
在 fsQCA 中,恰好在0.5隶属度的案例被从分析中删除(Ragin,2008b)。为了克服这个问题,Fiss (2011)建议在隶属度为1以下的前因条件中加入0.001的常数。
【补充,一些研究仅将隶属度为0.5的值修改为0.501(Campbell等, 2016),而非修改全部;也有改为0.499(Crilly等, 2012)】
校准后,数据集包括每个变量的两个版本(图3)。下一步运行模糊集算法和真值表的生成。

选择软件中的“ Analyze > Truth Table Algorithm ”程序。选择要分析的变量(图4)。具体来说,前因条件是自变量,结果是因变量。研究者可以选择计算结果的存在或不存在。通过单击 OK,fsQCA 生成真值表。

真值表计算可能发生的所有可能的组态或组合,一共有2^k行(k 代表前因条件的数量),每一行代表每一种可能的组合。所有真值表行都包含案例频数(即每个可能组合的观测案例数目) 。有几行的频数为零,这意味着它们不能解释样本中的任何案例。随着分析中变量数量的增加,可能的组态数量呈指数增长,因而变量越多,频数为零的真值表行越多。因此,在分析中包括更多的变量可能会受益于更大的样本容量,这在典型的定量分析(例如,MRA,SEM)中是常见的。

接下来,真值表需要按照频数和一致性进行筛选(Ragin,2008b)。由于频数描述了所在组态覆盖的样本数量,为了确保获得用于评估关系的最小个案数,需要设置频数阈值(即column number)(图5)。更高的频数阈值意味着每个组态包含更多的案例,但是结果会降低覆盖样本的百分比(即覆盖度)。另一方面,较低的频数阈值增加了样本的覆盖度,但会包含一些琐碎组态。对于大于150例的样本,频数阈值可设置为3(或更高) ,而对于较小的样本,频数阈值可设置为2(Fiss,2011; Ragin,2008b)。本文样本是582,频数设置为3,并且所有频数较小的组合都从进一步分析中剔除。
筛选频数后,应该设置一致性阈值,最小推荐值为0.75(Rihoux & Ragin,2009)。选择一致性阈值的第一个依据是确定已经获得的一致性中的自然断点,但这并不是绝对的。详细地说,在图6中,我们注意到最低一致性为0.862958, 0.859605, 0.839190, 0.781378, 0.695669。这些值表明,0.781378和0.839190可能是截断点和潜在的频数阈值。因此,研究者需要决定哪一个是适当的阈值,并证明这一选择。为了帮助研究人员,fsQCA 软件计算了 PRI 一致性,它代表“不一致性的比例减少”(Proportional Reduction in Inconsistency),是社会研究中子集关系一致性的替代测量,仅与模糊集相关。PRI被用来避免结果和结果否定中组态的同时子集关系(simultaneous subset relations of configurations)。PRI一致性分数应该接近原始的一致性分数(例如,0.7) ,而 PRI 分数低于0.5的组态表明明显的不一致性(Greckhamer 等人,2018)。因此,本文考虑了 PRI一致性阈值。
【补充,作者并没有汇报采用多少的PRI阈值,但从图6的真值表行来看,最低的PRI值为0.45】

最后,fsQCA 软件计算 SYM 一致性(即,对称一致性) ,这是为模糊集开发的,当研究人员检查结果的存在和否定并希望使用相同的一致性标准进行分析时可以使用。一般来说,大多数论文在分析中都没有呈现真值表,但呈现真值表可以增加研究结果的效度,并加强过程的严格性。应该注意的是,低一致性阈值会导致识别更多的必要条件,减少第二类错误(false negatives) ,但会增加第一类错误(false positives) ,反之亦然(Dul, 2016)。
处理真值表的最后一步是确定每个组合是否解释了结果。研究人员须在结果变量的列中插入1或0的值。选择1或0可以决定一个组合是否能够解释结果。一旦完成,研究人员可以(通过标准化分析)继续获得解(command: Standard Analyses)。
接下来,研究人员需要决定是否一个单独自变量应该在所选择的组态中存在或缺席(图7,这一步即反事实分析) ,有助于中间解(将在下面解释)。除非另有需要(例如,基于理论或文献) ,建议选择“Present or Absent”,以获得所有可能的组态。


6.4. 获得组态/解
FsQCA 计算出三种解,即复杂解、简约解和中间解。在这里,“解”指的是一个由大量案例支持的组态组合,其中的规则“组合导致结果”是一致的。
复杂解基于传统的逻辑运算提出了所有可能的组合条件(图8)。一般来说,由于确定的组态数量可能非常大,复杂解数量可能非常大,使得解的解释相当困难,在大多数情况下不切实际。由于这个原因,复杂解将进一步简化为简约解和中间解。

简约解是基于简化假设的复杂解的简化形式,它提出了任何解都不能忽略的最重要条件(图9)。这些被称为“核心条件”(Fiss,2011) ,并由 fsQCA 自动识别。简约解和复杂解的主要区别在于,复杂解排除了涉及有限简化的反事实案例,而简约解包括任何可以促成逻辑上更简单的解的反事实组合。

最后,在对复杂而简单的解进行反事实分析时,只包括理论上可信的反事实,从而得到中间解(Liu et al. ,2017; Ragin,2008b)。中间解使用那些用来计算简约解的简化假设的子集,它应该与理论和经验知识一致。基于先前知识,研究人员可以选择每一个的变量是否应视为仅存在,仅缺席,或二者兼有。默认情况下,推荐计算“present or absent”。关于每个前因条件和结果之间联系的任何决定都需要基于理论或实质性知识(Fiss,2011)。
中间解是复杂解的一部分,并包含了简约解。同时出现在简约解和中间解中的为核心条件,但在简约解被消除并且只出现在中间解中的条件被称为“边缘条件”(Fiss,2011)。换句话说,由于中间解同时提供了核心和边缘条件,而边缘条件从简约解中去除,因此确定核心条件的一个简单方法是检查简约解,因为它不包括边缘条件。通常情况下,我们可能会遇到在一个给定的案例中同时出现多个核心条件的情况。假设,如果我们有一个A + BC + BD 的简约解和一个 AcD + BCE + ABF + ABCDf 的中间解,我们报告 AcD + BCE + ABF + ABCDf,用粗体字表示核心条件。
此外,简约解通常比中间解小。然而,它们可能完全相同,这意味着除了简约解之外,没有任何细化是有用的。比较图9,图10,我们看到中间解比简约解的一致性更高。Mendel和Korjani(2012)对反事实分析的步骤进行了更详细、更精确的描述。
【补充:如果选择“present or absent”,复杂解和中间解就会完全一致,即本文中的情况】

6.5. 解释和呈现解

为了改善研究结果的表现形式,我们可以将 fsQCA 输出的解(图9,图10)转换为一个更容易阅读的表格(表1)。通常,条件的存在用一个黑色的圆圈表示(●) ,缺席/否定用一个划叉的圆圈表示,“do not care”条件用一个空格表示(Fiss,2011)。核心和边缘的区别分别使用大圆和小圆。研究人员需要呈现整体的解的一致性和整体解的覆盖度。整体覆盖度描述了结果在多大程度上可以通过所有组态得到解释,类似于回归方法的R方(Woodside,2013)。在我们的例子中,结果显示整个解的覆盖度为0.84,这表明结果的很大一部分被9个解覆盖。
【补充,整体解的覆盖度和样本量以及数据情况有关,并无推荐标准,有些研究甚至很低,例如0.18(Campbell等, 2016);0.10(Misangyi和Acharya, 2014)等】

fsQCA 的调查结果可做如下阐述。对于高购买意向的出现,解1-3反映了认知和情感知觉的存在与缺失组合。个性化品质和强烈的积极情绪是核心构念,说明这些因素的重要性。具体而言,高质量的个性化与对个性化服务的强烈积极情绪的结合,以及消息质量和两种类型的消极情绪的缺失,导致了高购买意愿,无论个性化的好处和弱积极情绪的水平如何(解1)。为此,当所有的认知知觉都存在时,为了达到高购买意愿,它们可能与(i)强烈的积极情绪、弱积极和弱消极情绪的缺席相结合,无论强消极情绪水平如何(解2)或(ii)与所有类型的情绪相结合(解3)或(iii)消极情绪的缺席相结合,无论积极情绪水平如何(解4)。在所有情绪缺席的情况下,高购买意愿可以通过高度的个性化和信息质量来实现,无论其好处如何(解5) ,或者仅仅通过高个性化好处实现,无论其质量如何(解7)。解6结合了个性化质量和强负面情绪,以及消息质量和其他情绪的缺失。个性化收益在这个解中只起到边缘作用。另一方面,在解8中,利益是与信息质量相结合的一个重要(核心)因素,仅有积极情绪的存在(消极情绪的缺失)会导致高购买意愿。最后,同样结果(高购买意愿)也可以通过弱积极情绪的出现以及所有其他情绪和所有认知知觉的缺失来实现(解9)。
7 何时 fsQCA 优先于基于方差的方法
本节为QCA方法与传统定量方法的对比结合,有兴趣的朋友可以自行查阅原文。

8. 总结

研究问题和研究目标决定了分析问题和分析方法的选择。尽管如此,各种各样的限制可能会影响这些选择,例如样本大小限制、工具的可用性,以及学者对特定工具和方法的知识。通常,我们倾向于持续使用相同的分析工具和方法,因为我们已经获得了一定程度的专业知识以及它带来的便利程度。这可能会导致对新的工具和方法的抵制,因为需要额外的努力和资源来度过学习曲线。方法论定义了我们如何研究一个现象以及我们如何看待它(Bagozzi,2007)。虽然定量和定性方法各有优缺点,但是采用混合方法可以使我们更深入地了解我们的数据集,扩展我们所研究的现象。QCA是一个将定量和定性方法结合在一起的分析工具,将大多数缺口中存在的定量和定性场域连接起来。
与 Gefen,Straub 和 Boudreau (2000)关于如何在研究中进行结构方程模型和回归分析的开创性研究相似,我们的目标是提供一个简单易懂的指南,描述如何在信息管理和市场营销的典型研究中逐步应用 fsQCA。本教程也可以在其他使用类似方法的领域进行研究。
从文献来看,虽然使用 fsQCA 的文章数量在增加,但是很明显一些期刊或会议更频繁。主要是因为在这些期刊具有更多专业审稿专家(和编辑) ,从而有可能更好地理解该方法及其含义。这创造了一个自然集群,使用 fsQCA的研究人员通常寻找已经使用该方法发表文章的场所。尽管如此,越来越多的期刊和会议将会接受这样的文章,人们对该方法的兴趣正在增加。编辑和审稿人可以引导作者使用 fsQCA,并从不同的角度看待他们的数据。必须清楚的是,fsQCA 不是所有问题的解决方案,而且并不总是合适的。作者应该证明使用 fsQCA 的原因,并始终遵循建议的阈值和指导方针,以便提供有意义的和有效的结果。FsQCA 不应该机械地盲目使用。基于我们个人的经验,编辑和审稿人可能会不同意或无法决定手稿的适当性,甚至是方法上的合理性。正如20年前在 SEM 上的教程一样(Gefen 等人,2000)。本教程的目的是帮助研究人员更好地理解 fsQCA,他们可以作为作者,或作为编辑和审稿人,并为那些不太熟悉QCA的学者提供一个实用指南。

补充部分的参考文献

Campbell J T, Sirmon D G, Schijven M. Fuzzy Logic and the Market: A Configurational Approach to Investor Perceptions of Acquisition Announcements[J]. Academy of Management Journal, 2016, 59 (1): 163-187.
Crilly D, Zollo M, Hansen M T. Faking It or Muddling Through? Understanding Decoupling in Response to Stakeholder Pressures[J]. Academy of Management Journal, 2012, 55 (6): 1429-1448.
Jacobs S, Cambre B. Designers' road(s) to success: Balancing exploration and exploitation[J]. Journal of Business Research, 2020, 115 241-249.
Mikalef P, Pateli A. Information technology-enabled dynamic capabilities and their indirect effect on competitive performance: Findings from PLS-SEM and fsQCA[J]. Journal of Business Research, 2017, 70 (1): 1-16.
Misangyi V F, Acharya A G. Substitutes or Complements? A Configurational Examination of Corporate Governance Mechanisms[J]. Academy of Management Journal, 2014, 57 (6): 1681-1705.

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存