第一千零一十一章 :快进到仿生人?
周瑞:“用英语說吧,這個自然语言大模型,现在到什么程度了?”
安德烈說:“目前是第二版,最早的Beta版,我們用了开明智能的已有的交互数据库进行了数万次预训练,1.0版则是从互联網选定了一些內容进行训练,也进行了几万次。”
能够這么快速出现“1.0”,也和开明智能多年积累的交互数据库有关。
上一代产品起,开明智能的无人机已经采用了“中心化处理”的方式,为普通无人机提供交互能力,不過路线上更接近于用固定模式处理特定需求,类似于Siri。
只不過处理中心本身,是强大的“机械智能網络”,才显得在硬件控制上很有灵性。
安德烈:“自然语言大模型的核心,一個是基于统计学的数学模型,另一個则是基于自然语言的训练內容,抛出問題,给出回答,提问者反饋,继续优化”
“如果数据量和训练次数足够庞大,在交互上可以做到与真人无异。”
“因为开明智能的交互库以中文为主,所以它目前也是這样,对了,我們還对文本反饋做了优化,可以生成表格、统计图等。”
周瑞微微点头,思路上和前世基本一致,无非就是训练规模還沒彻底跑起来
不知道大模型的水平是更高還是更低
应该高一些,安德烈的天赋是系统认证的,他理应能够做出一些对于整個人类文明来說都算“惊艳”的事情,即便现在不如,持续优化后也应该能超出。
“它能承担有创造性的工作么?”
安德烈思索片刻后說道:“所有信息都是基于人类社会提供,所有结果都是基于数学模型优化,我不觉得這属于创造性。”
“我举個例子,比如我提问午饭应该吃什么,给個建议,它会可以给我许多內容,如果我要求這個建议长达1000字,它甚至能写一篇文章出来推薦我吃哪些东西,但這并不是创造性。”
一旁的宋进补充道:
“类似的還有比如炒股,如果允许它抓取股市歷史信息进行采样,那么它会给出许多關於购买哪支股票的建议,甚至生成表格,嵌入工具可能還能帮助买卖,也许真的能帮到炒股者,但這本质上還是信息检索和统计,然后用‘如同人一般’的口吻表达,听起来像是给了一個创造性的建议,但其实也不是。”
“它抓取范围可以比大部分人的知识边际大许多倍,所以显得很神奇,但在专业领域和前沿领域,它更像一個一眼会被看穿的门外汉.因为這些部分可以抓取的训练內容太少了,越前沿、越专业,它越傻,越大众,越机械,它越聪明。”
周瑞点点头。
见识越少,越觉得大模型神奇,见识足够少.它能颠覆世界!
每個版本都能!
不過,這并不意味“自然语言大模型”沒有价值,无论实用价值還是商业价值,都有很大的潜力。
周瑞凑上前去:“我来试试。”
想了想,输入了一個問題:“‘午餐肉’晚上吃叫什么?”
画面上出现了三個点
安德烈三人额头上也出现了三滴汗
半晌后,屏幕上回答:“晚上午餐肉,晚上午餐肉是午餐肉的一种.”
然后巴拉巴拉几十個字。
在周瑞看来,显然是超纲了,在用废话掩饰。
然后继续输入到:“学法律的为什么不叫法师而叫律师?”
回答:“法师是一种特殊职业,拥有较高的输出和薄弱的生存力”
然后巴拉巴拉又是一大堆。
周瑞:“一個半小时,是几個半小时?”
回答:“一個半小时是一個半小时”
周瑞转头看向三人:“嗯看来需要训练的东西還有很多”
安德烈不知道从哪裡开始吐槽.就刚才三個問題,他這個中文渣人类都答不出来,何况一個1.0版本的大模型。
不過還是說道:“确实,它现在還太弱了,不過想要增强它需要海量的抓取库和算力,算力又包括硬件和电力.這种投入是极大的,光靠我們三人不现实。”
“想达到理论上限,保守估计,可能需要专门成立分公司,并且投入数以亿计的资金来构建算力底座,再开放外界的使用权来让普通用户参与到训练中.烧掉许多电力”
周瑞不置可否的点点头,就還是前世的老路,堆算力无非就是安德烈的這個模型可能性价比更高罢了。
有价值,但沒意思,比起机械智能差远了。
周瑞正在思索之际,却听见安德烈道:
“不過我們的第四成员,提供了一個天才般的想法,他建议将大模型做成分布式运算,植入机械智能中,我們在全球有数千万各类智能设备!這些都可以视为训练者!”
“让机械智能!来训练人工智能!效率可比人类用户一個一個提问要迅速多了!直接将节省80%的成本。”
“机械智能控制硬件,人工智能进行交互,那么体现出来的效果,恐怕真的会如同科幻作品裡的‘仿生人’一样.”
:https://www.zibq.cc。:https://m.zibq.cc