小伙伴关心的问题:哔哩哔哩干杯由来(哔哩哔哩干杯来源哪里),本文通过数据整理汇集了哔哩哔哩干杯由来(哔哩哔哩干杯来源哪里)相关信息,下面一起看看。

哔哩哔哩干杯由来(哔哩哔哩干杯来源哪里)

番剧区属于哔哩哔哩元老级的分区之一了~宅在家里打开哔哩哔哩,寻找最近的新番是很多ACG爱好者的日常。

今天就让我们对哔哩哔哩番剧来一次大起底,看完这篇,说不定这个周末你就决定补番!

本次数据通过Python爬虫获得,爬虫教程如下:

<python3爬虫>bilibili完结番剧分区数据抓取(第二节)​www.jianshu.com/p/4cde71d39fde

一共爬取了完结区、未完结区和番剧索引里三部分的数据,生成三个csv文件,导入SQL后成为三张表:

包含的数据都是截止至2018年10月31日之前发布的数据。

完结分区(finished)表内共有16767条数据,未完结分区(unfinished)表内共有25900条数据,番剧(bangumi)表内共有67032条数据。各表内包含的字段和意义如下:

蓝色表示SQL表中的主键也就是唯一标识号,番剧(bangumi)表的主键有两个,也就是靠这两个字段共同完成标识

由于数据是从json文件读取的在格式和重复性上都没什么问题。

(不了解json文件的童鞋请戳:

JSON_百度百科​baike.baidu.com/item/JSON/2462549?fr=aladdin

观察数据,我们发现了奇怪的两栏:

含义是时间,但却是这种不明所以的十位数,真让人不解。

其实这是「UNIX时间戳」,是指1970年1月1日开始经过的秒数。幸好SQL里有专门的函数把它转化成我们看的懂的时间:

查询结果:

变得nice!

接下来看看完结(finished)表和未完结(unfinished)表,我们又发现了这样一个问题:

虽然众所周知av号是每个视频的唯一编号,可是有的番剧是每集都是不同的视频(好多av号),有的番剧是一个av号,里面按每一集分了很多p啊!

拿经典老番「EVA 新世纪福音战士」和今年的大热门「工作细胞」对比一下:

一个26p的视频和13个1p的视频这怎么比啊喂~

番剧(bangumi)表里才是正确的打开方式:

但是bangumi表中又没有我们需要的播放量等数据,所以我们需要把三张表通过SQL中的join语句联系起来:

在这个语句的基础上,我们将三张表合并为一张表,即首先在finished和unfinished表中加入字段「finish」来表示番剧是否完结并合并这两张表,再与bangumi表通过av号进行连接,加入字段「bangumi」来表示视频所对应的番剧名,就合成了用于以下分析的新表allvideo。至此数据清洗完毕~

整理好的数据可以在此获取:

https://pan.baidu.com/s/1H_VIRuI9zNXbP3skZ3KtaQ​pan.baidu.com/s/1H_VIRuI9zNXbP3skZ3KtaQ

之前都是前菜,这里正餐开始,看看b站的番剧都有什么秘密辣

首先看看番剧的数量吧:

通过以上查询可以得到完结和未完结分区里的番剧集数(是集数,不是部数哟)为226949集!然而这其中只有55796集是在b站的番剧索引中的,分别属于2781部番剧。

突然想看看哪部剧的集数最多呢~

得到集数排在前20的番剧:

哈哈哈「哆啦A梦」以2577集一骑绝尘~榜上的番大多都是连载多年的老番了,是不是勾起了童年回忆(总也看不完,总也不知道哪一集了)?

20多万集番剧的出现也并非一日之功,b站10年的累积才慢慢有了这个庞大的分区,来看看十年间剧集数量的变化吧:

注意纵轴是log10坐标哦

从2009年的200多,到2017年的7万多,真的是不小的飞跃呢!从绝对值来看,比上一年剧集数增加最多的是2015年,这也是b站开放注册,下降用户门槛的一年,完结剧集数量从2万猛增到了3.3万。而2016年10月起,b站有了大会员制度,开始有番剧需要付费观看。需要付费的番剧数量今年大涨,说明版权付费在b站已成趋势。

榜单时间到!各种top10将通过以下SQL通道来袭:

得到以下榜单:

「工作细胞」力拔头筹,「OVERLOAD」霸榜「齐木楠雄的灾难」靠集数取胜,「OVERLOAD」继续霸榜「Re」18集转折引发大讨论,打赌很多 *** 在「埃罗芒阿老师」轻喜剧下大家乐意发言投币多的都是整集高能~「OVERLOAD」再居榜首,播放高≈投币多

溜了一圈以上榜单,发现大多数都是2015年以后的剧集了。那么我想找找以前的番怎么办?下面的查询告诉你,每年的热门是什么:

2017年的最热番「小林家的龙女仆」有些弱呢,不论是单集还是整部剧的播放量都不如2016甚至2015诶~

这样,就可以了解到每一年的最热番是哪一部了~

B站番剧一般分为原创和搬运,来看看这两大阵营的PK吧:

中位数在SQL中没有函数,这里是利用Excel得到

原创完败呢!仅有的7部剧单集播放量中位数为141429,搬运番剧的播放量中位数是其7倍!哔哩哔哩的原创作品还要加油呀。

再来看看上传这些宝贵的番剧的有爱的up主们~首先是勤劳的小蜜蜂up主:

B站官方大大我们就不说了,「小清水亜美」才是封神up!4000多的投稿数,远远超过其他up主。

但是如果计算单集平均播放量,则是另一个结果:

这些一投即获得高播放的up主锦鲤无疑了!

以上就是对b站番剧的大致分析辣,最后福利时间,为大家推荐几部总播放量1000万+的2018年下半年的新番~快去追番吧少年!

--END--

更多哔哩哔哩干杯由来(哔哩哔哩干杯来源哪里)相关信息请关注本站,本文仅仅做为展示!