裁员后,我成了科技教父

第110章 OpenAI最近有点儿跳,得限制一下!(1/1)

天才一秒记住【康妮小说网】地址:https://m.vkni.org

首发:~第110章 OpenAI最近有点儿跳,得限制一下!

郝成请了一顿饭,何钢吃了满肚子的心事。

饭局刚刚一结束,他就立刻回到酒店,联系上了于东。

“老何,我咋发现你每次一去临州,都会变得这么慌慌张张的呢?”于东甚至调侃上了。

“你先别忙,听我说。”

何钢仔细的将郝成在车上的话简单跟于东复述了一遍,而后总结道:“可不要看这东西是郝成在扯闲篇,是在泛泛而谈大路的概念,是没有透露任何ai训练方法的。

“但实际上,他这个泛泛而谈,跟我们一大群人去聊天,他不一样!”

“我知道,他已经训练出小沙了,他的大路概念那是正确的概念。”于东长长的呼了口气:“从这泛泛而谈中或许能找到方向。

“但光听这些也没有用啊!”思索了很久,于东也是无奈道:“你说的所有的东西,我只能总结出三个字‘类似人’,而这种方向,团队早就考虑过了。

“但现在的问题不是方向,是方法,我们没有找到任何的方法。唯一的好消息是,我们以传统方式训练ai的成本也大大的降低了,效率却大大的提高了。”

于东说的这个倒是实情,不仅仅是华为、抖音、腾讯甚至openai,训练ai的成本都降低了。

究其原因,也很简单,他们让小沙帮他们做数据清洗、标定和反馈。

数据清洗原本是一个非常复杂且繁琐的工作,也是训练ai非常关键的步骤,数据清洗的质量越高,ai训练的质量也就越高。

以往,这个工作都是由人工来实现的,也有用ai来做的,但是效果就会很差,往往会投喂一些垃圾数据,造成模型被污染,进而产生一些低级错误。

而现在有了小沙,这项工作可以更快速的进行,准确率甚至不比人工清洗差。

而更关键的一个问题,以往gpt类的模型,是rlhf,也就是基于人类反馈的强化学习。

怎么做的呢:就是先预训练一个语言模型,然后做微调。

微调怎么调呢:就是你问一个问题,语言模型给你回答,然后人工给这些回答进行排名,然后获得一个有质量排序的数据集,用这个数据集反过来再去微调相关的模型参数,一遍又一遍循环往复,然后答案就会越来越接近人想要的。

而现在,小沙代替了人工的这个步骤。

rlhf模型先前被认为不可能无限提高,其中最重要的一个原因就是,随着参数越来越多,数据量越来越大,人工去获取一个有质量排序的数据集也变得越来越不可能。

于是有人就认为,自我反馈模型,也就是让模型自我去评价去提升的模型才是未来,纵然它有时候显得很弱智。

但是现在,有了小沙,小沙替代【基于人类反馈的强化学习】里边的人类,变成了【基于小沙反馈的强化学习】,这一切就又变得可能了!

不仅解决了自我反馈容易弱智的问题,同时解决了人工反馈效率过低、成本过高的问题。

这就相当于将两个模型的优点直接结合了。

而且,超大规模超超大规模,也不用担心人工的问题了。

所以,各家的模型现在进步都非常大,原因就在于此。

想要变得跟小沙一样厉害,那当然不可能——基于小沙训练的ai想超过小沙那本身就是一个悖论。

但是,只要舍得堆积算力,无限的堆积算力,再加上用小沙代替人类进行反馈的强化学习,理论上最终能极限逼近小沙的水准。

当然,理论只是理论,现实中不存在无限算力,考虑实际情况,用这种方式结合超大算力训练一年,达到小沙的六七成水准应该是可能的。

华为这边默默的评估过,现在几乎所有的ai训练企业都在偷偷的这么干。

“需要跟郝成说一下这个情况吗?”何钢问了一嘴。

“这他应该知道吧?”于东一愣:“以前,很多模型都用chatgpt反馈做初期训练,训练到一个阶段了才转人工反馈的,都是惯例了。”

“我估摸着他还真不知道,他现在应该没关注其他的ai同行。”

听何钢这么说,于东直接嘴角一抽,是啊,一群弱鸡同行,有什么好关注的呢:

“那还是说一下吧,这事影响还是挺大的。尤其是openai,他那算力堆的,而且最近有点儿跳,得限制一下。”

“对了,苹果指望就是这个呢吧?”何钢脑子里突然把两件事儿联系到一起了。

“嗯。”于东笑道:“苹果之所以现在还没有彻底急眼,就是得到了openai的承诺,而openai之所以这么有把握,是因为他们又购买了上千亿美元的显卡。

“对投资者号称是研发了一种新的算法,可追赶小沙。实际上,说白了就是【基于小沙的深度学习】。”

“【趋同于人】的【类似意识】。”于东一说【基于小沙的深度学习】,何钢不自觉的就嘀咕了这么一句。

“什么‘趋同于人的类似意识’?”于东一怔,问道。

何钢把郝成关于这方面的说法一字不落的给于东叙述了一遍。

“那这就有意思了!”华为这边倒是没问题,但是openai那问题可是大了。

经过万亿亿次的循环之后,由小沙反馈训练而成的chatgpt的“思想”是什么样子,那可就是由小沙控制的了!

都说科技无国界,但训练的ai其实是有“偏向”的,别说郝成说的什么【趋同于人】的【类似意识】这种技术概念,就传统的ai,也夹杂着训练者的各种意识形态。

甚至,哪怕不体现在ai本身上,规则限制和人工干预,也必须达到这种效果。

……

“原来是这么回事儿!”

郝成还真没特别关注过用户使用小沙都干了些什么,就算想关注也关注不过来。

除非是一些违法违规的操作,由小沙的【ai可控方向】进行监控和限制。

法无禁止即可为,利用小沙去做数据标定、去做结果反馈,然后训练别的ai,这事儿郝成没有特意交代过,小沙也就没有做任何限制。

再有就是,数据使用和溯源的要求,用户的数据,怎么获取的,怎么流动的,最终干了什么,用户自己那是必然需要了如指掌的。

数据溯源的公示算法就在那里,人人皆可验证,白驹科技也无法例外。

这在一定程度上也是阳谋,因为小沙本身实在是太强大了,如果再完全是一个黑盒子,很多人就该担心害怕了。

而现在,白驹科技控制核心算法,而将信息溯源、推荐等外围算法公示开源,人人都可以进行监督验证,那使用起来就放心很多。

不过,何钢刚刚说的事儿——

郝成想起了苹果的诸悦来之前,李清波跟自己说的“布罗克曼告诉苹果的ceo库克,他说openai将最迟在明年三月之前解决问题,达到小沙的水平。”

“原本你以为是布罗克曼在忽悠库克,敢情是这么一回事儿!”

郝成摇了摇头,终于理解诸悦先前为什么是那样的态度了:

“我还是大意了!”

(本章完)

辰小序提示您:看后求收藏(康妮小说网https://m.vkni.org),接着再看更方便。

人气小说推荐More+

七零哥哥身硬心软,小娇妻撩着过瘾
七零哥哥身硬心软,小娇妻撩着过瘾
她本来有个条件还算不错的未婚夫,是在学校代课的老师。不仅如此,未婚夫弟弟也是部队的军人,能嫁入这样的家庭,已经是她上辈子修来的福气了。可她不知怎的,竟然掉进河里,救她上来的还是小叔子。小叔子为她做了人
佚名
天灾人祸流放路,满门忠烈我来护
天灾人祸流放路,满门忠烈我来护
关于天灾人祸流放路,满门忠烈我来护:(无系统,有空间,纯架空)社畜谢长生穿越到一个历史上都不存在的古代架空世界里,起初有那么一瞬间他是满意的,因为自己的身份是护国公府的二公子,吃喝玩乐不用愁,日子就能
卿月佳人
夫君请自重,六公主上门抢亲了
夫君请自重,六公主上门抢亲了
现代兵王意外穿越成汝阳王府的废物赘婿,面对新婚离家的郡主妻子、虎视眈眈的世家大族还有暗流涌动的朝堂纷争。凭借现代智慧还有过人胆识,他在王府后院破阴谋、朝堂之上定乾坤、沙场之中挽狂澜,却逐渐解开自己身世
会飞的鸽子
官道之红色权力
官道之红色权力
我升迁在即,想不开心都难啊!前段时间公司高层位置空出来了。领导跟我去参加招商引资会,在一番辛劳后,我顺利拿下破了招商引资纪录的188.88亿大单,领导亲口向我许诺这个位置非我不可。领导的许诺都给了,还
佚名
开局穿越大夏,我在战场杀敌成神
开局穿越大夏,我在战场杀敌成神
林风穿越大夏,觉醒杀敌系统。从此,杀,成就战神。杀,他有了十人小队;杀,他杀成了百人统领;杀杀,他统领着千人精英。杀杀杀他拥有10万之师,称呼你陛下。如今,我拥有百万雄师,你又称呼我什么?江山?美人?
大鹅大哥