查看原文
其他

大数据视角下的大学录取分数排行

爬虫俱乐部 Stata and Python数据分析 2022-03-15

本文作者:孙雪丽 

文字编辑:方   言

技术总编:张馨月



Stata暑期线上课程招生圆满结束~

    重大通知!!!爬虫俱乐部于2020年7月11日至14日在线上举行为期四天的Stata编程技术定制培训,招生工作已经圆满结束啦!!!

另外,应广大学员需求,爬虫俱乐部将于2020年7月25日至28日线上举行Python编程技术训练营,帮助大家在掌握Python基本思想的基础上,学习科学计算技术与网络数据抓取技术,详情可点击《Python云端培训课程开始报名~》



2020年的高考有些特殊,也因疫情的影响更加牵动人心。高考在某种程度上像是一场成人礼,被赋予了极大的期待,也承载着许多复杂的情绪。对考生而言,成绩的得与失会在当下被无限放大,但在更长远的未来里,保持专注与努力才是一生的必修课。经历了疫情的考验,祝愿见证历史的2020届考生可以调整好心态,为自己交上一份满意的答卷。为了给考生助力,爬虫俱乐部特此制作了大学录取分数排行榜,希望可以为考生和家长提供一些参考。
说明:本排行根据新浪教育高考院校库中高校在各地的历史录取数据计算得到。该数据库中共包含394892条高校-省份-年份-理科录取数据,及322651条高校-省份-年份-文科录取数据。截止年份为2018年(2019年数据尚未更新)。计算方法为高校各年在各地录取平均分的简单平均(本文承认此计算方法存在诸多不足,如未考虑各高校在各地招生的差异、计算的权重问题等,本文的目的仅在于反映历史录取的平均情况,不足之处欢迎各界批评指正)。并在计算中剔除以下数据:
  • 录取平均分缺失的数据;

  • 在31个省份录取信息少于150的高校(招生年份不足5年,或仅在个别省份招收较少数量学生的高校,如香港大学、香港理工大学等);

  • 异常数据(除海南省的其他省份录取均分超出750分的数据;海南省的录取均分超出900的数据);

  • 仅招收文科生或理科生的高校;

注:

  • 仅列示计算结果中排名前300的高校;

  • 此排名仅供参考,因部分抓取内容缺失,结果为NULL。


祝参加高考的各位考生乘风破浪,金榜题名,带着勇气、努力和一点运气,继续上路~







对我们的推文累计打赏超过1000元,我们即可给您开具发票,发票类别为“咨询费”。用心做事,不负您的支持!
往期推文推荐
集成学习介绍之二——Boosting算法

PDF文本信息提取(二)

取长补短、互通有无 ——集成学习介绍之Bagging &随机森林
PDF表格信息提取
神经网络——brain
marktouse标记使用变量
换种视角看问题——支持向量机(SVM)
提取PDF文本信息:入门
毕业季|b站《入海》评论爬取
Stata云端课程来啦
利用广义线性模型实现的分类——Logistic回归
Requests get爬虫之设置headers
数据分析薪资待遇如何?——跟我来,带你看
Vardistinct一键去重计数
从statsmodels到线性回归
Pandas的GroupBy机制
首行数据如何快速转变量名?

关于我们



微信公众号“Stata and Python数据分析”分享实用的stata、python等软件的数据处理知识,欢迎转载、打赏。我们是由李春涛教授领导下的研究生及本科生组成的大数据处理和分析团队。

此外,欢迎大家踊跃投稿,介绍一些关于stata和python的数据处理和分析技巧。
投稿邮箱:statatraining@163.com
投稿要求:
1)必须原创,禁止抄袭;
2)必须准确,详细,有例子,有截图;
注意事项:
1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里为作者署名,并有赏金分成。
2)邮件请注明投稿,邮件名称为“投稿+推文名称”。
3)应广大读者要求,现开通有偿问答服务,如果大家遇到有关数据处理、分析等问题,可以在公众号中提出,只需支付少量赏金,我们会在后期的推文里给予解答。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存