阅读设置(推荐配合 快捷键[F11] 进入全屏沉浸式阅读)

设置X

第499章 AI进度(2 / 2)

这个水平,的确不高。

也难怪版本号是0.1,而不是1.0。

“你觉得如果我们这个DH0.1如果需要提升,目前最欠缺的是什么?”

“数据。”魏龙毫不犹豫地回答道,“绝对是优质的数据,我们这个模型的水准还是不错的,就是数据实在是太少了。”

“数据吗……”

陈腾倒是没怀疑魏龙说的模型水准。

因为这个DH模型的基础,其实是【LSM人工智能语言学习大模型】。

就是陈腾上次五连抽,在系统上抽到的那个。

系统出品,怎么都不会太差劲的。

在抽到这个大模型之后,魏龙手下的技术团队又基于这个模型做了一定程度上的改进。

所以模型水准陈腾是非常信任的。

不过模型的学习能力强是一回事,数据又是一回事。

如果将模型比作一个人,优秀的模型就是天赋很高的天才。

可就算是顶级的天才,没有高质量的学习资料,能学到的东西也有限。

现在腾达的这个DH模型,缺乏的就是学习资料。

“我们现在的数据源有哪些?”

“就是各大平台上网友们交流的一些数据,比如短视频平台的评论区,直播平台的弹幕。不过这些数据的质量,实在是太低了。”

陈腾微微点头。

魏龙说的很有道理。

短视频平台的评论区,有相当多的一部分评论都是没什么意义的回复。

这个没意义,指的是对AI训练没意义。

比如颜值博主的评论区什么“好美”“好漂亮”的夸赞。

对于AI训练来说,意义不大。

经过筛选处理过后,能用的数据少得可怜。

陈腾又想到了GPT。

实际上第一代的GPT是在2018年推出的。

但是第一代的GPT在市场上,并没有搅动什么风云。

因为智能水平太低了,根本没有人乐意与这样的AI对话。

直到四年之后,足足喂了四年的数据,这才有了许多人愿意对话聊天的GPT。

可见AI的学习与发展,是一条十分漫长的路。

“如果按照现在的学习速度,你觉得我们的AI需要多长的时间,才能通过图灵测试?”

所谓图灵测试,就是让一个人去问AI问题。

看看这个人,能否发现正在与自己聊天对话的是AI。

上一页 目录 +书签 下一章