第57章 太diao了吧-《重生之AI教父》


    第(1/3)页

    也是了,孟繁岐恍然明悟。

    检测任务的数据集收集和标注的成本更高,这也是为什么孟繁岐夺冠的大赛,分类图片一千多万张,检测图片才几万张。

    目前所有的这些内容全部都是人工去标注。

    一张分类图片,只需要标注一个标签,它是什么即可。

    而标注一张检测图片,经常需要在上面添加数个,甚至十数个检测框,需要细致到具体轮廓,然后再添加类别。

    标注的成本,自然是十数倍的差别。

    为图片添加选框和标签的工具也不完善,操作繁琐,就更使得其缓慢。

    截止到现在,深度神经网络为基础的检测算法还有展现出什么实际的商业价值,还停留在实验室研究阶段,实际上并没有得到这些大公司足够的重视。

    目前商业用的检测算法,还是传统技术为主,并不需要训练数据,而是通过人工设计的滤波器去提取特征。

    孟繁岐演示使用的公开voc检测数据一共就几万张,相比日后动辄几千亿的模型参数量,几个t的数据量,这个规模有点像过家家。

    此时此刻,就白度内部而言,李彦弘这个深度学习研究院,也只在私下积累了不到十倍的私有数据量,也就差不多二三十万张。

    对于白度来说,基于这个本钱,想直接像后来的chatgpt一样,提供一个人人可用的ai智能,那还差了十万八千里。

    “李彦弘开这个技术发布会的意图,其实就是伸手要数据。”孟繁岐稍一思索就想明白了,“通过展现这种神奇的效果,诱惑需要工业检测的厂商,需要医疗图像检测的机构,想要开发自动驾驶的车企。”

    “你们给我数据,我就能帮你们做这个功能。”

    李彦弘这是想趁这个技术优势,收割一大波免费的数据啊!

    这小算盘,打得太精了。孟繁岐心中啧道。

    这个时间段,这种图片数据的价值还没有得到广泛的理解,借助检测技术的飞跃,白度收割这些图片起来就像噶韭菜。

    再过一段时间,就没那么容易白赚了。
    第(1/3)页