查看原文
其他

为什么受伤的总是女人? 学生评教都存在性别偏见!

计量经济圈 计量经济圈 2022-05-11

凡是搞计量经济的,都关注这个号了

箱:econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

正文

关于下方文字内容作者:郑诗琨,南京大学经济系,通信邮箱:christopherzheng@foxmail.com

Anne Boring. 2017. "Gender biases in student evaluations of teaching." Journal of Public Economics,  145: 27-41.
This article uses data from a French university to analyze gender biases in student evaluations of teaching (SETs). The results of fixed effects and generalized ordered logit regression analyses show that male students express a bias in favor of male professors. Also, the different teaching dimensions that students value in male and female professors tend to match gender stereotypes. Men are perceived by both male and female students as being more knowledgeable and having stronger class leadership skills (which are stereotypically associated with males), despite the fact that students appear to learn as much from women as from men.
摘要:
文章使用了法国一所大学的数据分析了学生评价教学质量中的性别偏见(SETs)。固定效应和广义有序logit回归分析的结果表明,男性大学生对于男性教授的教学质量评价更高。这种歧视与传统的性别刻板印象大致相同,即无论是男学生还是女学生,都认为男性教授更加知识渊博、更能领导班级(在刻板印象中,领导能力确实和男性联系)。尽管,学生从女教授身上学到的东西似乎和从男教授身上学到的一样多。
一、引言:
作者运用了学生教学评价(SETs)研究性别偏见如何影响学生对教学质量的评价,发现:在法国一所专门研究社会科学的大学中,女教授的得分却较低于他们的男同事,尽管教学质量相同。
在作者的数据集中,本科一年级的学生必须修六门必修课,学生分配给男女教授的任务是随机的,学生在网上对教授进行评分是强制的,所有学生都参加同一期末考试。数据集囊括了五个学年的20197条观测数据。
作者首先研究学生与教授性别是否匹配影响教授的整体满意分数,发现男性学生更喜欢给男性教授更高的分数。其次,作者研究了教学满意度的不同方面(如内容、授课方式等),发现无论是男性学生还是女性学生,在评价教授时都遵循了性别刻板印象,即男性更权威、有领导力,女性更热心、有条理等。结果符合一致角色理论。
根据统计歧视理论,当评价者对于被评价者的产出知之甚少时,他们倾向于根据刻板印象评分,这一现象随着信息增加而减缓。但此处,经历了一个学期与男性和女性教授的接触,歧视现象依旧存在,这可能是因为学生不能评价教学的实际有效性。
本文表明,如果大学使用学生教学评价(SETs)来决定升职、合同续签,那么这将对女性有歧视。如果称职的女教授因为这种歧视被打了低分,那么女性学生在高等教育阶段的选择与成功也会受到负面影响。
二、有关学生教学评价(SETs):
“三人组”的安排保证学生在课程选择上不存在选择性偏差。学生在秋季学期选择一个“三人组”(即三位教授的课程组合),之后不能更改。于是,同一“三人组”内的学生的教授相同。到了春季学期,“三人组”固定,但教授更换。可见教授的安排是随机的。
样本涵盖了2008-2009学年至2012-2013学年总共5年的数据。作者通过置换检验,发现除了2012-2013学年,所有年份的男性学生比例与男性教授的比例的相关性不显著。于是,作者剔除了2012-2013学年秋季的数据。
学生的课程评价在期末考试前于线上完成,是强制的。教授在学期结束、打分结束前不能查看课程评价结果。评价包括封闭性问题与开放性问题,学生必须评价总体满意度,随后评价四个维度的封闭性问题:课程内容、教学安排、授课方式、教授学识。
学生打分标准为:0分代表不适用,1分为不满意,2分为一般,3分为较好,4分为极佳。没有学生对总体满意度打0分,极少学生在其他问题上打出了0分。
学生参加统一的期末考试。除了政治课的期末口试,均采取双盲批改。所以,期末考试可以客观地衡量教学的有效性。
三、数据:
该数据库共有20197项观察:11522项是女生的评价,8675项是男生的评价。对总共1050个研讨会,有4362名不同的学生(57%的女生和43%的男生)和359名不同的教授(33%的女性和67%的男性)进行了评价。几乎所有的学生都为18岁。
对于多数教授来说,他们的合同将在学期末更新,而教评分数决定他们的合同续签,所以教授有追求高的教评分数的动机。
作者进行了描述性统计,发现①男性学生在总体满意度、与教学风格和教授知识相关的维度上对男性教授的评价显著高于女性教授。②在教学内容和作业的维度上,男生对男教授和女教授的评价不存在显著差异。③女性学生在领导班级的能力、处理当前问题的能力以及对智力发展的贡献方面,也给了男性教授更高的分数。然而,女性学生在课程内容和作业的教学维度上,对女教授的评分较高。④女性教授所教授的女学生平均而言获得了略高的研讨会和期末考试成绩,但唯一显著的差异是秋季学期的研讨会成绩。
四、估计总体满意度得分中的性别偏见:
作者对学生使用固定效应,来比较同一个(男或女)学生如何评价(随机分配的)男教授和女教授。

回归结果显示,男性教授得到更高的总体满意度评分有两个原因:其一,男性学生给了男教授相比于女教授的更高分(秋季高0.252分,春季高0.185分);其二,相比于女性学生,男性学生在评估男性教授时,其整体满意度评分较高(秋季高0.156分,春季高0.117分)。男性与女性学生对女教授的评分趋于一致;两者差异在秋季是弱显著的(为0.110分),而在春季则不显著。

为了补充固定效应模型的结果,作者使用广义有序logit偏比例优势模型。相比于一般的有序logit模型,这一模型放松了平行线假设,而主要的性别偏见效应正是在于教师获得“较好”和“极佳”评价的概率。这一模型也显示,与男性学生对女教授的评价相比,以及女性学生对男教授和女教授的评价相比,男生更倾向于对男教授的打出“极佳”的评价。

另外,由于学生在评价教授时已经基本知道了研讨课的成绩,所以研讨课成绩越高,教授得分越高,而教授有动机以高的研讨课分数贿赂学生。理论上来说,女教授可以使用这一策略来补偿学生的性别偏见,而实际上却没有这么做。
最后,学生的期末分数与对教授的总体满意度是不相关的,可见学生不是按照实际的教学有效性评价教授的。
为了检验主结果可靠性,作者又做了一组回归,加入了男学生变量与教授特征的交互作用项,发现主结果是可靠的。
五、估计不同教学维度的性别偏见:
作者只讨论春季学期的情况。相比于女性学生,男性学生在所有维度上给男性教授打的分数都较高。男生对男性教授的评价通常也高于女教授。
总体而言,在与课程内容和作业有关的教学方面(课堂准备与组织、教学材料质量、考核方式明确、反馈有效性),女教授的评分与男教授相似。

女性在与教学方式相关的维度(沟通的有效性、领导班级能力)上的得分明显较低(除了鼓励小组合作方面)。

在与性别刻板印象更为相关的维度上,男性与女性教授的得分差异更显著。在领导班级的能力方面,男女学生对女教授的评价明显低于对男教授的评价。与之类似,和教授个人知识水平相关维度的结果也显示了性别差异。

这些结果表明,性别刻板印象可能推动学生对教授的评价。在符合对传统女性标准的维度上,学生们有时倾向于给予女性教授高分(至少不是低分);而在符合对传统男性标准的维度上,学生们系统性地倾向于给男性教授高分。
六、结论
总体而言,教学评价中的性别歧视存在,但学校依然将它作为提拔、合同续签的依据,导致女教授在比较花时间的教学维度上付出了更多精力(如课堂准备),从而产生机会成本(如研究时间减少),阻碍了她们的职业发展。
性别偏见的影响可能是与环境相关的,这表明没有简单的系统性方法来纠正偏见。
最后,这些性别偏见可能存在于雇主根据消费者对员工能力的评估做出晋升决定的其他情况下。
关于一些计量方法的合辑,各位学者可以参看如下文章:实证研究中用到的200篇文章, 社科学者常备toolkit”、实证文章写作常用到的50篇名家经验帖, 学者必读系列过去10年AER上关于中国主题的Articles专辑AEA公布2017-19年度最受关注的十大研究话题, 给你的选题方向2020年中文Top期刊重点选题方向, 写论文就写这些。后面,咱们又引荐了使用CFPS, CHFS, CHNS数据实证研究的精选文章专辑!这40个微观数据库够你博士毕业了, 反正凭着这些库成了教授Python, Stata, R软件史上最全快捷键合辑!关于(模糊)断点回归设计的100篇精选Articles专辑!关于双重差分法DID的32篇精选Articles专辑!关于合成控制法SCM的33篇精选Articles专辑!最近80篇关于中国国际贸易领域papers合辑!最近70篇关于中国环境生态的经济学papers合辑!使用CEPS, CHARLS, CGSS, CLHLS数据库实证研究的精选文章专辑!最近50篇使用系统GMM开展实证研究的papers合辑!

下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

2.5年,计量经济圈近1000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 | 官员方言  | 微观数据 | 内部数据计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存