本
文
摘
要
2018年过去了,照例来一个2018年的年终网文书单,为书荒中的老白书友提供一个找书参考。
完全自己挑选,太过唯心,不够权威,但如果都从起点之类的大平台排行榜来筛选,又基本是小白文,对书荒的朋友而言完全没有意义。
遂打开爬虫,爬取了优书网的书籍信息。可能很多朋友没有听过优书网,你可以大体把这个网站视作网文界的豆瓣。这是一个依托龙空论坛的网文评论网站,他的主要用户群体是资深老白网文读者,新老网文作者,所以从数据样本来说有其局限性,但目前网文界应该还没有更好的同类产品,所以只能是他了。
知道有些童鞋心急,所以先放个男频TOP10,对赤戟榜单算法感兴趣的童鞋可以拉到最后。
需要注意的是,该盘点旨在解决网文老白读者的书荒问题,入选的书籍都是2018年左右的新书,且相对冷门,没有出现在本榜单的书不代表书不好,但能进入这个榜单的书,绝对有值得一试的价值。
那些试图在这里寻找各大排行榜上热门书的童鞋,可能会失望了,这里是不太可能出现诸如:
《明朝败家子》《史上最强赘婿》《如意小郎君》《诸界末日在线》《天道图书馆》《全球高武》等今年大热的书籍。
更不会出现《剑来》《牧神记》《大王饶命》《超神机械师》《修真四万年》《赘婿》《临高启明》《圣墟》《将夜》《永夜君王》《异常生物见闻录》《全职法师》《放开那只女巫》《修真聊天群》《美食供应商》《重生之出人头地》等往年佳作。
方法和去年一样,先用爬虫抓取老白读者聚集的优书网评分数据,再以基于统计的方法筛选书籍,增加了字数项,给出2018年老白群体中人气口碑最好的100本书。
找到好书不用感谢我,找到毒草我也不负责,这个榜单纯粹是数据说话,我没有人工干预的,看之前最好看下小说的评分,榜单仅供参考!接下是男频的TOP100,女频的没梳理完,过两天发:
上面这个是算法跑出来的榜单,不掺杂个人意志,下面这个是赤戟选择了2018年内各个门类中最具代表性的10本新书,一一作了详细的点评和同类推荐,偏男频,感兴趣的童鞋可以看一看。
2018年过去了,这一年有什么好的网络小说值得推荐吗?3811 赞同 · 385 评论回答然后说说赤戟制作榜单的思路,不管是年度盘点还是每月的数据看优书,都是先用爬虫抓取老白读者聚集的优书网评分数据,
但年度盘点与每月发布的数据看优书的排序算法不同,月榜采用的方法简单粗暴,直接采用新增积分(评分*人数)来倒序排名,这利用新书初期打分人数较多的情况,筛选出近几个月新出的好书,如果年度盘点也采用这个算法,会导致一些争议书排名过高,冷门优秀作品以及下半年才出来的新书排名靠后,难以出头等种种问题。
针对这些问题,在算法层面进行了优化:
一是引入了IMDB评分榜使用的贝叶斯平均(Bayesian average)算法对‘用户评分’进行了一个预处理,公式如下:
二是,针对‘评分人数’项进行优化,通过对评分人数求底数,削减热门书在最终乘积中的比重。