在10月10日启动的华为全联接2018大会上,华为轮值董事长表示虽然当前AI的发展令人感到兴奋,但是仍旧存在较大的落差。华为认为,要让人工智能真正改变人类的未来,当前人工智能必须做出10项改变。
而这些华为口中的改变,至少会影响到人工智能领域里的两类人:一类是人工智能领域目前暂不可少的数据标注AI民工;一类是具备高级技能的AI人士或专家。
1.为什么说AI民工将会被快速取代?
对于当前人工智能来说,有了越精确的数据标注,才能够获得越好的算法模型。但是这些结构化的数据往往来自人工一点一点的标注。往往需要人工为文字、图片、语音、视频进行数据标注,人工智能公司再将其用于模型训练。
可以想象,如此繁重的工作是如何进行的。甚至,我们不妨以例子进行说明,在AI界大牛李飞飞参与建立的ImageNet数据集中,当时来自167个国家的48940名工作者,总共花费了2 年时间,共清理、分类、标记了近十亿张通过互联网搜集到的图片,最终得到的才不过是拥有1500万张标注图片的数据集。繁复程度可以想象。
极客公园曾经在6月份对此进行报道,并称其为“数字富士康”,这多少表明了数据标注是一种劳动密集型的行业。虽然数据标注是必不可少的一环,但这些标注者在AI产业链条中所处的生存环境也并不十分友好。造成这种问题的很大一部分原因是,“原来干淘宝刷单的,现在也能摇身一变做 AI 数据标注。”甚至腾讯在微信建立了一个众测平台,面向社会大众进行数据标注,并提供一定金额奖励。这多少也说明这个行业的需求以及门槛。
但值得注意的是,在标注过程中出现标注问题就势必影响算法模型。而AI最终想要实现的却是取代大量重复的工作。似乎是一个悖论,毕竟智能背后站着人工。甚至不妨得出“有多少智能就有多少人工”,甚至有人以猫教会老虎捕捉的故事表示,“即使是被替代,数据标注师也将是最后一批被替代的人。”
但在华为那里,认为这种现状是急需改变的。如此效率低下的重复标注,仍旧依赖于人,显然只要依赖于人,就会是效率低下的。华为在10条改变中的第五条表示,未来这一过程将是自动化/半自动化的。尤其是在数据标注、特征提取,模型设计和训练等方面。似乎只有这样才能实现AI的快速智能化,进而避免“没有人工就没有智能”的尴尬局面。但是到底如何实施,在华为的表述里并没有呈现。但可以想见,到了这个时候作为AI民工的数据标注人员或许真的没有存在必要了。但那在目前来说,或许更多的是一种期望。
2.具备高级技能的AI人士会去哪里?
但华为期望的改变并不单单局限于数据标注该领域。如果说数据标注仅仅牵涉到底层的AI民工的话,那些拥有高级技能的AI人士呢?
在去年这个时间,各大媒体纷纷表示当前AI人才的欠缺,并指出AI领域人才薪酬令人艳羡。甚至在年底期间,这种人才的紧缺与被看好,通过各大高校纷纷设立人工智能学院而凸显得更为明显。大量院校跟风似地设立人工智能学院,并没有实际考量自身是否有着相应教学能力,这无疑让人担忧。但它确实成为了一种风气,似乎人工智能马上就会实现巨大的跃进。
然而,这个领域真的需要那么多技术大牛去从无建立一切吗?答案显然不是。重复性的无意义的工作显然是会被取代的。基于此,华为表示希望实现由一站式平台支持的基本技能。进而让这些高技术人才、专家有其他用武之地。
华为是这样说的,也是这样做的。在10月10日的全联接大会上,华为发布了全栈式全场景的解决方案。所以真正的技术大牛会进入到更为基础的研究工作中去,而即将培养出来的AI人才可能将做的是成为当前程序员一般的角色。仅此而已。但那天何时到来,或许就看大厂的进度了。