第41章 未来模型的大与小-《重生之AI教父》


    第(3/3)页

    孟繁岐虽有重生的优势,但有一位长者说得好。

    人呐,就不知道,自己不可以预料。

    一个人的命运啊,当然要靠自我奋斗,但是也要考虑到历史的进程。

    “华国的氛围是否适合最前沿的ai技术发展?此话怎讲?”李彦弘如今也是走在开拓道路上,这件事情自然是他非常关心的事情。

    “李总是这个时候唯一愿意亲自出马来找我的人,我便也掏心掏肺跟您说几句心里话。”孟繁岐回顾了一下ai整体的发展脉络,如此说道,“alexnet和我的dreamnet现在彻底打开了深度学习的大门,可以预见,在短时期内,各个方向和领域的ai模型性能将会有一个巨大的突破。”

    “不错,如今正是比拼时速的时候,一步快,则步步快。”李彦弘点头称是,肯定了这个前提。

    “技术上的指标是一回事,从总体的趋势上来看,如果想要真的把ai的技术落地,让人们都可以使用,无非就是把模型做大或者做小。”

    “做大或者做小...?你是指终端还是云端两种发展的方向?”李彦弘很快跟上了孟繁岐的思路。

    “没错,学术研究的时候起初不会过多关注模型的参数量大小,和它的计算损耗。但实际投入使用的时候,则会必然分出极致优化缩减的小模型,和强调性能开放接口给人使用的云端大模型。”

    “在早期的时候,可能会反复魔改和调整模型的结构和设计,让模型尽可能快,尽可能好。但久而久之,随着数据的积累,筛选,更高质量的标注,以及最重要的,更大的模型参数量。”

    “规模极其庞大的模型,会在某一个临界点彻底产生质变,让绝大部分小模型失去价值。尤其是以语言语音类,和图像生成类模型。它们的使用体验是无法向下的。”

    孟繁岐回想起重生前,李总面对chatgpt(3.5版本)和gpt-4,强行顶住压力提早推出的大模型文心一言,不得不在心中叹了口气。

    其实文心一言并不是一无是处,只是这种与人交互的智能模型,如果相形见绌,就会显得特别不堪一击。


    第(3/3)页