查看原文
其他

周杰伦的《说好不哭》,20万点评Python来分析

以下文章来源于菜鸟学Python ,作者菜鸟小编

作者 | 菜鸟小编

来源 | 菜鸟学Python(ID:cainiao_xueyuan)

最近几天,小编被周杰伦的新歌刷屏了,朋友圈纷纷晒出周杰伦的新歌,即便不是周杰伦的歌迷,但是提起他的新歌,想必大家应该都会知道,那就是《说好不哭》。不得不说,周董的号召力还是很强的。看到这首歌如此的受到大家的关注,小编忍不住想要对其分析一下,看一下大家对于这首歌的评价究竟如何。

1
爬取QQ音乐点评


这次小编找的是QQ音乐的评论,看这周董的帅气的封面,音乐才子名不虚传,短短3天已经卖了700万张,看一下评论数有21W的点评数,这人气太旺了!

既然有20万的点评,这个数据量还是很大的。二话不说,用Python迅速爬取。如下图所示,大家可以按照下图箭头所指的位置,找到大家的评论。

经过检验发现,当请求的时候,需要大家不断改变的是pagenum和lastcommentid这两个参数。评论爬取的部分程序如下图所示。

这里,通过不断的更新页面数值,并根据爬取的commentid数值来更新lastcommentid的数值,便可以源源不断的爬取到大家的评论,这里,小编爬取了大家的评论和评论时间,昵称以及commentid四个参数,爬取了20万+条评论,如下图所示。

得到数据之后,接下来是对于数据的处理我们首先来看一下,评论数目前十名的评论有哪一些,如下图所示,很简单的一句程序,便可以得到我们需要的结果。


在所爬取的数据中,点赞第一名有14100+的点赞数量,他的评论是这样的:


评价很专业,很走心,一看就是铁粉干的,而且还是很有档次很懂音乐的funs。

2
看一下点评的数据


下面我们看一下,大家的评论数目随着时间的变化情况,如下图所示。

如上图所示,歌曲是16号23点正式上线与大家见面,立刻引起了大家的评价,可以看见,在歌曲出来的短短一两个小时内,评论数目激增,然后随着入夜大家睡去,评论数目略有下降。而第二天的评论数目虽有小幅度的提升,到那时提升的幅度并不是很大。

这部分的程序如下图所示:

程序利用的是seaborn库,程序将柱状图与折线图结合起来,更加立体的为大家呈现出评论数目与时间的关系。


3
词云看20W的点评


最后为大家展示的是大家评论的词云制作,看看大家对该首歌的印象。

首先,需要对大家的评论进行预处理,因为爬取到的结果中包含众多的字符,这些字符需要去除。程序如下图所示。

上述程序中,我们匹配中文字符和中文标点符号,然后写入指定的文件内,最后利用wordcloud库来制作词云即可:


看一下大家都说了点啥

由上图可以看出,大家对于周董的新歌是非常喜欢的,并且都非常的开心,由于信的加入,导致大家在评论的时候会加入五月天的元素。

以上就是本次小编带来的对于周董新歌的分析,小编也准备去买个vip听一下,好好的欣赏周董的新歌曲啦。

(*本文为Python大本营转载文章,转载请联系原作者,原标题:3天2100万!周杰伦的说好不哭,20万点评Python来分析)

精彩推荐



推荐阅读


你点的每个“在看”,我都认真当成了喜欢

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存