好比,假如要教AI熟悉苹果,可以用1000张标注“苹果”的图片以及更多的不包罗“苹果”的图片作为练习集,呆板会从中学习得到一个模子,以后再碰到相干图片时就能认出是不是苹果。
随着人工智能财产的飞速发展,产生了大量垂直范畴的数据需求,也驱动着浩繁企业涌入数据标注市场。那么,国内AI数据标注市场的近况和发展趋势是怎样的?什么样的玩家可以或许突围?
随着人工智能在各个行业加快落地,比年来数据标注行业飞速发展。据统计,现在国内市场上可查的数据标注公司快要40家。专家表现,人工智能范畴团体融资金额中,约有15-30%都投向了数据标注市场。由此,守旧估计国内数据标注市场规模已达150亿到300亿元。
数据标注有着广泛的应用场景。好比,人脸关键点标注、人脸特性标注,可以为人脸辨认算法提供所需数据。主动驾驶技能必要大量的标注数据对算法模子举行练习和调优。在天下级无人驾驶大赛中,主理方每每提供近亿张图片和数十万张标注图片供参赛团队练习利用。
市场供给方面,除了少数大厂选择自建数据标注基地之外,大部门服务供给来自第三方服务商。根据艾瑞咨询发布的《中国人工智能底子数据服务行业白皮书(2019年)》,服务商提供了团体数据标注市场79%的服务,企业自建只占21%。
与任何发展初期的行业雷同,现在国内数据标注行业处在高速发展、粗放竞争的低级阶段。服务商鱼龙稠浊,暂时外包模式、众包模式很常见,有些小型服务商乃至只是负责转包的中心商。行业尺度不清楚,服务商质量乱七八糟,缺乏专业技能和履历,都导致了数据标注质量难以保障。
另一方面,由于获取数据标注服务是一项恒久固定本钱,AI算法公司广泛盼望有更好的性价比选择。总体来看,数据标注市场亟需专业玩家来引领。
2、服务同质化,竞争加剧,怎样突围?
企查查数据表现,停止2021年3月,我国共有人工智能相干企业32.3万家。此中,2020年整年新注册企业16.9万家,同比增长323.6%。在AI财产高速发展的配景下,数据标注服务的缺口肯定是巨大的。
现在,数据标注的本领以人工标注为主,呆板辅助。由于数据标注工作门槛比力低,属于AI范畴的入门级岗位,操纵员颠末简朴培训即可上岗。信赖随着AI数据处置惩罚平台学习本领的不停提拔,呆板终将不停代替人工负担重要标注工作。但是在此之前,依靠人工举行数据标注将恒久存在。
那么,将来数据标注行业将走向何方?
一方面,颠末数年高速发展,国内数据标注市场中,各家公司的产物和服务趋于同质化、竞争呈胶着状态。随着竞争的加剧,行业格局方面,一些服务质量不达标的小企业将面对镌汰,头部公司气力将渐渐凸显。
另一方面,随着AI技能加快落地各个行业,服务需求方对数据标注的要求也水涨船高。最典范的就是,垂直场景的定制化数据标注和收罗将成为主流。好比,针对人脸辨认场景的人脸人像数据服务、针对视频主体的视频标注服务,针对主动驾驶场景的数据服务。
图 / 摄图网,基于VRF协议
一些AI公司乃至盼望数据公司可以或许更懂算法技能、更懂需求场景,乃至能到场到算法的研发中来,给出数据采标方面的优化发起,这也成为数据服务商打造差别化竞争的着力点。
别的,数据安全、合规也成为AI公司偏重思量的因素。一些数据标注过程中会涉及到许多敏感数据,好比人脸、语音等内容,这就要求从数据的收罗、数据的标注,再到数据的存储,每一个环节都必须包管数据不被泄漏、不被盗取。
3、驻足东南亚的数据标注专业玩家
只管市场同质化严峻,但一些头部服务商依附差别化上风已经开端崭露锋芒。
领创智信(ADVANCE.AI)是一家总部在新加坡的专业数据服务品牌。多年来对峙自建数据标注基地和自建数据收罗服务,为AI企业提供全流程一体化的数据服务办理方案。
领创智信的业务范围覆盖图像、语音、视频等全范畴的数据标注和收罗服务,满意市场上90%的标注需求。现在,领创智信的数据收罗和标注业务已经服务凌驾几十家行业客户,在金融科技、零售、电子商务、医疗、物联网、出行等范畴积聚了精良的口碑。
通过对领创智信企业上风的分析,我们可以从侧面看出怎样靠差别化竞争力在数据标注市场突围:
起首,领创智信的业务覆盖国内和东南亚,可以借助东南亚人力资源本钱上风,提供更高性价比的数据标注服务。
已往几年,在环球人力资源市场,中国正在失去低价劳动力的上风。因此带来劳动麋集型财产、低端制造业等向东南亚等地域转移,这对国内财产升级和经济转型实在是利好。
领创智信在印度尼西亚、菲律宾和泰国设有数据交付中央和数据收罗基地,很好地使用了东南亚人力本钱上风,赋能中国AI财产。以印尼为例,其总生齿 2.7亿,是仅次于中国、印度和美国的环球生齿第四大国家。而且印尼社会总均匀年事只有约 30岁,有超一半以上的生齿年事低于30岁。领创智信正是将印尼的生齿红利为己所用。
其次,领创智信接纳自建数据标注团队和数据收罗基地的模式,具备交付高质量数据服务以及深耕垂直场景的本领。
领创智信拥有数百人的自建数据标注团队,团队稳固,有恒久标注收罗履历。领创智信在东南亚各地搭建了当地化的实行团队,他们认识外洋人力情况、宗教文化、当局关系。而且这些团队具备丰富的AI数据项目管理履历,可以和谐多个国家的标注资源。专业的团队使得领创智信的服务可以满意90%以上标注需求,数据标注服务及格率到达99%以上。
在垂直场景方面,领创智信在面部辨认、文件辨认、文件处置惩罚、货架物品辨认等范畴积聚了丰富的履历。好比,在人工智能面部辨认范畴,领创智信可以提供关键点标注、拉框标注、语义分割等全品类标注服务,支持活体检测、人脸图像对比、人脸搜刮、人脸反敲诈、多维数据人脸名誉评分等丰富的应用场景。
第三,小语种数据标注上风,赋能国内AI企业出海东南亚。在语音标注收罗方面,除中文、英文外,领创智信还拥有印尼语、越南语的语音收罗、语音转写、语音判定、语音分割本领。比年来,由于地区经济潜力大、消耗互联网财产发达发展,东南亚已经成为许多中国企业出海的首站。领创智信独特的小语种上风,将为中国出海的AI应用提供小语种场景数据底子。
别的,在数据安全方面,领创智信的全部产物和服务均内置强盛的安全保障技能,这些技能可以或许帮忙检测并制止黑客攻击。其还与互助同伴白帽子互助,进步金融数据安全尺度,为金融企业提供更安全的数据情况。
为了让更多AI初创企业享受更具性价比的数据标注服务,行业头部企业领创智信开展了为期3个月的促销运动。3月31日到6月31日期间,凡数据标注服务每月付费凌驾或累计凌驾5万元人民币的企业,即可免费得到领创智信提供的整套收罗/标注的方案计划。
*文中题图来自摄图网,基于VRF协议。返回搜狐,检察更多