查看原文
其他

爬虫俱乐部年度总结|《请回答2020》

爬虫俱乐部 Stata and Python数据分析 2022-03-15





























爬虫俱乐部2020年度总结 


荼垒灵馗挂扉户,神傩烈竹轰光雷。

珍馔罗绮开席筵,明日今时送腊梅。

今古九州同此夜,贤愚贵贱添一岁。

回首向来萧瑟处,山海可平疫可摧。

——改编自唐·胡浩然

《送入我门来(除夕)》

回顾2020,我们目睹了新冠疫情的肆虐,见证了雷神山、火神山的速度,感受了中国人民团结一致战胜病毒的巨大力量;我们遭逢了一而再的延迟开学,为了“认(tao)真(bi)”上网课各显神通;我们响应号召,居家抗疫,真正成为一个个宅在家里为国家和人民做贡献的“宅男宅女”;我们从“为延迟开学而惊喜”到“对学校归心似箭”;我们配合封闭式管理,帮助外卖小哥磨炼送餐技能;我们积极应考,为了不挂科使出了洪荒之力;我们终于迎来了2020的除夕,盼望着除去这一年的痛苦和灰尘,心中却思念着“就地过年”不能归家的亲人......


2020,爬虫俱乐部与你一同成长

2020年,Stata and Python数据分析微信公众号累计50916人关注,其中净增长12103人。公众号粉丝分布中国大江南北,特别是北京、广东、湖北、上海等省市,粉丝数均超过4千人;不过聚焦于大数据产业发展的贵州省粉丝数量并未凸显。


微信公众号关注人数 


粉丝数量各省分布图


2020年,爬虫俱乐部原创推文220篇,其中有7篇阅读量超过5000,43篇阅读量超过2000,约70%的阅读量超过1000人次。特别是接力《发哨子的人》Stata版,阅读量最高,超过20000人次。


  原创推文的阅读情况

 

其中,

你最爱看的排行榜是:

//这些年,经管类C刊都在研究什么?

//高校经管类核心期刊发文排行榜|2010-2019

//在Sustainability上发文最多的原来是这些高校

//明星闪闪亮:各校高被引论文

//光阴十载,见证了《经济研究》中的“高被引”

//全国31省GDP排行强势登场!



你最感同身受的事件是:

//一位大学党委书记的自我结束——风波里的学者本真

//卫健委的“糊涂账”



你最想知道的Stata&Python技术是:

//中国知网爬虫(CNKI) 批量下载PDF格式论文

//提取PDF文本信息:入门

//统计年鉴数据整理小技巧

//PDF表格信息提取



你觉得最有趣的爬虫是:

//【爬虫实战】喜茶的门店都开在了哪里?

//【爬虫实战】恒大的底气?--恒大楼盘数量爬取



你最感兴趣的研究主题是:

//Seminar | 来自女儿的塑造:高管、女性社会化与企业社会责任

//Seminar | 作为飞行员,我比别的CEO多了什么?

//Seminar | 企业社会责任披露如何影响企业绩效?

//Seminar | 眼见为实吗?高管面部可信度、审计师任期与审计费用



2020,爬虫俱乐部与你同在

2020年初,突如其来的新冠疫情打乱了所有人的生活,爬虫俱乐部一直密切关注着疫情的形势,主动发起捐款活动,共筹集资金10.22万元,并发布了多篇与新冠疫情相关的原创推文,与武汉人民、全国人民手牵手心连心。

//携手战疫,我们在行动

//湖北省各市疫情数据爬取

//卫健委的“糊涂账”

//过了14天潜伏期真的没事了?

//我听到了企业的哀鸣

//从流调数据中寻找感染真相


3月,爬虫俱乐部接力《吹哨子的人》,删得掉的是推文、帖子,删不掉的是我们对英雄的敬意。

  

4、5月,国内疫情逐渐稳定,而海外的疫情却仍旧在蔓延,未能得到有效的控制,我们也在用数据密切关注海外疫情的发展。

//今日头条海外疫情数据爬取

//国外疫情怎么看?——实时新闻获真知

//海外疫情仍严峻,劝君更在家中留

 

6月,2020年的毕业季,比往年来得更晚一些。尽管返校十分仓促,朋友未能齐聚,但离别的日子终将到来。她/他们曾经带着梦想与憧憬踏进这座校园,在研究生涯里收获累累硕果,也在爬虫俱乐部这个家庭里获得了满满的感动、欢笑、泪水和回忆。这个夏天并不是结束,而是一个崭新的开始。




 

7月,2020年的高考有些特殊,也因疫情的影响更加牵动人心,为了给考生助力,爬虫俱乐部特地制作了大学录取分数排行榜,希望可以为考生和家长提供一些参考。同期,我们也戏仿平安经,使用Stata推出了《爬虫俱乐部平安经》。

//大数据视角下的大学录取分数排行

//爬虫俱乐部平安经

 

8月,爬虫俱乐部逐步推出自研的Stata中文地图系列命令;同期,爬虫俱乐部李春涛教授在天演融智和武汉大学联合主办的公益活动——Stata研讨会及系列讲座中向大家介绍此系列命令使用方法和应用场景,最高峰时吸引了近万人观看。

//定位神器——cngcode

//cnaddress命令——实现经纬度转换为中文地址

//让Stata完美牵手中国地图之cnmapsearch

//轻松获取通行数据——cntraveltime命令介绍

 

9月,全国哲学社会科学工作办公室公布2020年国家社科基金年度项目、青年项目名单,名单中有3549个社科项目和1080个青年项目。我们搜集了项目名单,并使用词云图分析了社科基金的高频话题。

 

10月,对于爬虫俱乐部而言是一个特别的月份。2020年10月1日,爬虫俱乐部大师兄薛原与其爱人王春相识相伴1881天后终于一同走进婚姻的殿堂。2020年10月7日,涛门爱徒司海涛与其爱人李钰燕相伴相依在婚姻的殿堂接受亲朋好友的祝福。在此,爬虫俱乐部全体成员再次向两位师兄及其爱人送上最诚挚的祝福~

 

11月的热门话题离不开双十一。数据显示,天猫双十一狂欢季在0:00至0:30的成交额突破3723亿元,京东在开场9分钟内下单金额达到了2000亿元。那么,大家在拼手速、算满减、抢红包的过程中都在关注些什么呢?

 

12月,2020即将离去,不能忘却的记忆却扑面而来。在这一年的最后一天,我们爬取了B站《武汉UP实拍,封城后的24小时,“空城”武汉的物价、交通 、生活状态》的弹幕,让全国人民在谣言与真相充斥的社交网络之中了解到封城后的武汉以及英雄的武汉人民是什么样子。

回顾2020,我们为因新冠肺炎逝去的4634位同胞深感痛心,我们为战胜病毒的英雄的武汉人民和中国人民无比自豪。此时此刻,我想对2020说:再见,再也不见。

展望2021,我们将为祖国的繁荣富强和人民的幸福安康祈求福祉,我们将为团队的健康成长和你的继续关注不断奋斗。今时今日,我想对2021说:你好,有你就好。


你想对2021说什么呢?


































对我们的推文累计打赏超过1000元,我们即可给您开具发票,发票类别为“咨询费”。用心做事,不负您的支持!
往期推文推荐
春节假期临近,来爬爬豆瓣看看有什么好剧
putdocx生成Word文档so easy!

模糊匹配我只用这一招!

利用tushare获取财务数据

爬虫实战|Selenium爬取微信公众号标题与链接

轻轻一点,就知有没有|rqrs命令介绍

强大的正则表达式

自动群发邮件(二)——附带附件

自动群发邮件--email和smtplib基本模块的使用

批量处理变量名和标签的小方法

计算工作日的小能手——workdays

Seminar | 企业错报与银行贷款合同

Seminar | 共同基金行业的性别歧视
Seminar | 来自女儿的塑造:高管、女性社会化与企业社会责任

小贴士:Markdown的基本语法

听说相貌也能量化 | 调用百度人脸检测API实现颜值打分

列出指定属性的变量|findname命令比ds命令

新一代的标签转码小能手
【爬虫实战】亚马逊网站Top100畅销书爬取

Json文件好帮手——JsonPath

数据转置pro之sxpose2
文件"搬家"小助手:mvfiles

pyecharts绘图——河流图展示

关于我们


微信公众号“Stata and Python数据分析”分享实用的stata、python等软件的数据处理知识,欢迎转载、打赏。我们是由李春涛教授领导下的研究生及本科生组成的大数据处理和分析团队。

此外,欢迎大家踊跃投稿,介绍一些关于stata和python的数据处理和分析技巧。
投稿邮箱:statatraining@163.com
投稿要求:
1)必须原创,禁止抄袭;
2)必须准确,详细,有例子,有截图;
注意事项:
1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里为作者署名,并有赏金分成。
2)邮件请注明投稿,邮件名称为“投稿+推文名称”。
3)应广大读者要求,现开通有偿问答服务,如果大家遇到有关数据处理、分析等问题,可以在公众号中提出,只需支付少量赏金,我们会在后期的推文里给予解答。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存