阅读设置(推荐配合 快捷键[F11] 进入全屏沉浸式阅读)

设置X

第16章 AI模型训练(2 / 2)

现在网上最大的网络小说平台,非点娘不可,他提供的小说类型非常丰富,包括武侠、玄幻、奇幻、仙侠、历史等多种类型。

它是一个付费的网站,在小说的公众期和免费期过了之后,再看它里面的小说,都是需要花费真金白银的。

在用户规模方面,点娘的用户数量庞大无比,其月活跃用户数超过1亿人,点娘中文网的品牌知名度更高,也更受到文学界的认可。

因此,很多知名作家会选择在起点中文网上发表自己的小说。

但是,王卿的心里面也没有底气,虽然说他现在掌握的AI模型非常强大,但是一张3070TI显卡,能训练成什么样子,他也不清楚。

要是到时候拿一部狗屁不通的小说,然后被点娘的编辑给拒稿了。

那丢脸可就丢大发了。

西红柿小说网可就不一样了,它是一个免费网站。

网站的收入,主要来源于投放的广告。

用简单的话来说,就是读者可以通过看广告,来给作者支持。

这里面的学问,可就比较大了。

“我起码有一百种方法,在这西红柿小说网里面,混出一番名堂来。”

“现在,就开始训练模型吧。”

王卿开始着手准备训练自己的写小说AI模型。

为了训练这个模型,他需要一个足够大的小说数据集。

“数据集,自然是在网上获取。”

于是,他开始在各个小说网站上寻找可用的小说数据。

首先被他盯上的,自然是点娘小说网。

他打开了网站首页,看到了里面的分类,点击进去,他发现了分类下有很多小说。

“这个分类下有不知道有多少本小说啊,要是一个个点进去再爬取,肯定会花费很多时间,还是写一个爬虫自动化一下吧!”王卿自言自语道。

于是他开始着手写爬虫,他打开了自己的代码编辑器,开始写起了代码。

他先写了一个简单的爬虫程序,测试是否能够爬取小说的标题和作者。

“先牛刀小试一下。”

信息技术掌握五级,让王卿看到现在的代码,感觉处处都是机会。

但是,未经过实践过,他也不知道自己掌握的东西是不是井中月水中花。

还是要在电脑上跑一跑,心里面才有底。

程序运行了几分钟后,王卿打开了生成的数据文件,看到了里面的内容,没有问题,数万本小说的标题和作者都被写入了数据库之中。

上一页 目录 +书签 下一章