第266章 寻找合作伙伴4

第266章寻找合作伙伴4

林远和张言两人一块吸着面条。

“师兄,你有没有打算隐居。”张言没来由突然来了句。

“啥”林远愣了下,“隐居不符合你疯批的性子呀。我现在才25岁,难道提前过退休生活”

“你看看现在。”张言捧着碗呶了下嘴示意四周,“窗帘都不敢拉开。晚上睡觉都要小心翼翼生怕弄出动静,楼上楼下都是值守的同事。

这都过的什么日子呀。

我都能想到我们以后的生活,走到哪里都要有人跟着。”

林远放了下碗筷,“我也没想到会是这样,我就是简单的想做点好事,一个冲动就把代码开源了。说实话,我现在挺后悔的。我最开心的时候是挣到第一个一百万的时候。

那时觉得自己有钱了,又没有名利带来的负担。

现在想想,小富即安也挺好的。

可我真要是那样了,你应该也就看不上我了。”

张言想了下,“这倒也是。我希望我跟的人与众不同,可我现在才意识到,与众不同本来就是有代价的。

但是,”张言忽的目光灼灼看向林远,“既来之则安之,刀山火海我们一起闯。”

“说的没错。我去看看东西下载好了没。我发现了家不错的ai小公司。大公司指望不上,我想试试能不能推一把这些小公司。”

“你去忙吧,碗筷放着,我来收拾。”

“下回干脆点外卖吧,洗碗洗筷子多麻烦。”

“不麻烦,现在这样也挺好。我爸说,正好磨炼一下我的心性。”事实上张言从出身以来,从来没有这么密集地干过家务。

林远回到房间,即便是在千兆光纤的加持下,ds-ll通用大语言模型也还在下载中。

【speed:986bps,process:67.2%】

黑色的命令行窗口下,光标忽闪忽闪的。林远眼看几分钟内是下不完的,于是干脆跑出去帮着张言收拾家务了。

“咦终于想起我来了还知道来帮我。还是香香软软的老婆更好吧。”张言欣喜道。

“嗯,主要是整个模型的文件太大,还没下完呢。”

“你大爷。”张言怒了,“你电脑小三正忙着,你就来消遣我你倒是会节约时间。”

林远只是笑着去把碗给洗了。

但凡他忙工作的时候,这些家务都是张言在操持。看着张言这样的千金小姐撸起袖子洗碗碟,林远还是有些过意不去的。因而他得空就会去帮忙。

两人一通打闹结束,厨房的台面上被甩的到处是白色的洗洁精泡沫。

“你看看你,越帮越忙。”张言一边擦着飞溅的泡沫一边吐槽着。当然,实际上她心里是美滋滋的。

“你去忙吧。心意我领了。对了,晚上想吃啥。不许说随便。”

“吃你!”林远没来由来了句。他最讨厌的就是思考下一顿吃什么。反正如今吃的都是特供的肉菜蛋奶,突出一个原汁原味绿色无污染。做啥都好吃。

“还吃我呢”张言撅着嘴,“你都多久没吃我了”

“额,,,”林远忽然想起来,最近的精气都喂给算力系统了,确实忽略了张言。“我最近不是忙嘛,我先闪了。”

“悠着点!”张言的声音在身后传来,“我还想和你长命百岁呢。”

张言显然把林远的力不从心当成了是身体脱力的证明。

林远再次回到房间,这回总算是下载完成了。

272gb!!!ds-ll67b的模型权重文件、源代码、各类工具链、说明文档,整个加起来足足有272个gb。

林远看着那个可怕的模型权重文件,那可是要加载进入gpu的。结果这玩意儿的大小竟然达到了268gb。即便可以通过降低精度来降低模型权重文件的大小,可是这东西最小也要126gb。“得嘞!ai真特么烧钱。”

即便ds-ll号称已经比openai的chat-gpt4模型权重文件小得多,毕竟后者的同类文件大小是用tb作为计算单位的,可仍旧达到了百gb级别。

模型权重文件,这是ai模型最重要的东西。

砸钱买一堆的gpu,再烧掉大把的电费,最后训练出的就是这么个玩意儿。

ai模型对语言的理解和答复的所有奥秘,都在模型权重文件中了。

但你以为有了文件你就能理解ai的推理过程了休想。

以chat-gpt4来说,其参数规模已经达到了万亿级别,林远眼前的ds-ll也已经有670亿的参数。

你想搞清楚某个参数在ai模型推理过程中的具体作用那还是省省吧,那是完全不可能的。

把ai模型的推理过程逆向过来,只会看到一条条向量。人类只能理解其中很小部分的关联过程,对于ai大部分的推理过程,人脑如今已经跟不上了。

ai已经成了事实上的,按照人类的部署在干活。人类提供思路,ai完成工作。至于其中的具体过程,黑盒,完全就是不可见的黑盒。

林远被ai大模型的参数规模给惊到了。

他忽然意识到,这特么难道不应该是顺理成章的嘛,老子为什么要惊讶

他突然就想到:为什么自己要惊讶呢。

最先进的ai大模型的参数早就已经到了万亿级别,自己难道不该对模型权重文件的大小有所心理准备嘛。

‘所以,老子为什么要打算用一台笔记本来跑这种大语言模型’

林远自己被自己蠢哭了。

细思一番之后,他终于想到了原因。这是因为他在算力系统勾勒的模型强度面前已经习惯了。

林远习惯了系统产出的模型的精简,习惯性地忽略地球人类眼下粗狂的ai模型方法。

按照眼下的堆算力的粗放路线,模型权重文件可不就得这么大么。

林远简单算了下,ds-ll67b的满血版需要268gb的显存,那特么3块h100都不够哇。每块h100的显存是80gb,那至少要准备4块。

他可不打算去买,这年头还是直接租用云算力更加方便。

“小张,”林远大声把张言喊了过来,“我买云算力需要走审批手续不。”

由于林远现在身份敏感,还被安保小组看护着,因而各种举动都要提前报备。

“什么,是云算力。”

“就跟买云服务器差不多。”

“奥,那肯定是要报备的。”

于是林远很无奈的开始了填申请表。

“特么我买云算力和我人身安全有什么关系唠。难道人家还能顺着网线来打我”

“别闹,规定就是规定。你嫌麻烦的话我来填,你告诉我用途就成。”

“用途最终目的是拿来做空对岸科技公司的股票。”

“额,,,”张言显然不能这么写,“我就给你写,,,为了从事科学研究,争取为国为民再创佳绩。”

“小爷只想做空对岸的科技股狠狠出口恶气。当然,,,顺带搞点钱。”

“你闭嘴,别闹了。”最近转码严重,让我们更有动力,更新更快,麻烦你动动小手退出阅读模式。谢谢