第91章 数据基建-《重生之AI教父》
第(1/3)页
会程结束后,一行人滞留西尼又游玩了几天,这段时间是难得的放松。
可惜欢乐的时光总是短暂的,除了孟繁岐和唐璜两位休了学的人,其他的四位仍旧有学业在读。
这次正常上课的时间,能和孟繁岐一同过来,已经是相当不容易了。
再拖延了几天,终究还得赶回学校,否则挂上三四科也不是没有可能。
孟繁岐有心提携身边人一把,但也不至于一路护送,让人本科也别念完,这个不现实。
这次带他们过来,主要是让他们见识了解一下ai界现在的情况和潜力。
准备继续留在国内的刘旭,麦芒和秦慧三人,孟繁岐自然是有着自己的安排和打算的。
他希望几人协助去做的最重要的事情,就是在国内建立一个优质中文数据库。
这个东西是未来中文chatgpt能够取得成功最最关键的因素。
孟繁岐有信心凭借自己的能力把西方ai界的资源尽数收入囊中,但他却解决不了中文优质数据不足的这个根本难题。
这也是重生前,困扰华国诸多科技公司的最大原因,优质的中文数据远少于英文。
而优质数据就是ai时代的石油。
华国互联网起步晚,数据积累逊色一些是一方面,一个個都忙着在赚快钱则是另一方面。
这种白白投钱进去,收集数据,标注数据的脏活累活谁肯做呢?
为了中文和华国ai在四五年后的chatgpt时代能够跟上节奏,这件事就只能由孟繁岐提前布局了。
这可是个黑洞一般吞噬金钱的大工程,一位员工的使用成本,一年少说就得十万块,招百来个人,一年过去就是数千万。
收获得只有一堆堆无情的数据,这件事情短期内不会有任何的营收。
四五年的长线,孟繁岐少说得砸三五个亿进去,如果想要数据的质量和规模上精益求精,十几个亿进去也不是没可能。
“还好跟谷歌签了分成合约,否则真不知道哪里去弄这些钱。”
孟繁岐感到了些许的压力,仔细计算了几笔账之后,他意识到自己想做的事情成本似乎远高于自己的想象。
第(1/3)页