RELATEED CONSULTING
相关咨询
选择下列产品马上在线沟通
服务时间:9:30-18:00
你可能遇到了下面的问题
关闭右侧工具栏
如何运营一家数据标注公司 第三篇
  • 作者:dianwo
  • 发表时间:2018-12-07 11:44
  • 来源:未知

如何运营一家数据标注公司

(资源特点篇)

在“基础架构篇”中我们提到的资源,也就是数据标注公司要面对的甲方:AI公司、AI企业、AI研究所。那么问题来了,人工智能公司、人工智能企业、人工智能研究所多种多样,作为一个数据标注公司应该如何定义自己的服务方向呢?

首先我们要能够准确的了解资源公司的特点,这样才能更好的为其提供符合自身特点的服务。

目前市场上的AI公司、AI企业、AI研究所大致分为以下几种,对于与数据标注公司的合作来说他们各有各的优势和劣势,这里对以下突出的几类进行分析:

1. 初创型  

这里指的初创型公司一般指未进行过阶段融资的初次创业型公司。

优势:

a)         沟通成本低初创型公司的核心创始人一般都是公司的核心技术人员,所以他们对数

据标注的结果有清晰的需求认知,能够清楚严谨的表述出需要标注数据的规则,数据标注公司与此类资源公司在沟通上比较简单,能够快速的直入主题,迅速建立供需关系,省去冗长的上报、各级的批复等沟通环节。

b)        结算时间快这类资源公司本身公司架构也相对简单,对于标注完成后的结款时间相对也较短。

劣势:

a)         需求连贯性不强因为初创型公司很多没有稳定的甲方,同时公司在同一时期对接的甲方数量并不是一定的,有可能在某个月中会有很多,同样也可能一个没有。这就导致了在数据的需求连贯性上并不是很强。

b)        标注需求量不大在与甲方沟通合作的路上,展示型项目产品并不需要大量数据的验证。更多时候都是以小批量数据进行产品的小样展示,因为初创公司也要考虑项目的成功率和标注成本之间的关系。

 2. 企业型

这里指已经形成一定规模的人工智能企业,同时可能已经获得多轮融资。

优势:

a)         数据连贯性强这里指的一定规模的人工智能企业可能已经是市场上第一梯队的领跑者,因为有成熟的产品和合作对象,其在产品需要进行迭代和研发关联产品时是需要大量标注数据作为模型训练的。同时因为其在业界的影响力,与新的需求商进行合作时的成单率也要远高于初创AI公司。

b)        数据价值高因为大型公司需要综合保密、质量、工期等多方面因素,同时因为已经与需求公司建立了正式的合作关系,此类型的AI公司在提供的数据标注单价上是要略高于初创型企业。

劣势:

a)         结算周期长因为此类公司的结构相对复杂,同时结构越复杂的公司其对于支出资金的流程也越谨慎,这种谨慎就会导致合同内的结款周期远远高于初创型企业。

b)        沟通成本高因为此类公司的架构相对复杂,一般一个项目的启动流程是“算法团队将需求提供给项目经理,项目经理联系数据标注公司试标-数据标注公司试标完毕反馈-项目经理检查并反馈给算法团队。这其中就避免不了多人传达规则时出现的模糊情况,需要大量的时间进行沟通和验证。同时在项目启动时的流程也相对复杂,不仅需要算法确认规则,需要财务确认支付方式,需要法务进行合同审核,需要项目主管领导批准,这些都会使数据标注公司的沟通成本大大增加。

3. 科研型

这里指各类政府、大学等行政事业单位的科研部门。

优势:

a)         结算时间短一般的科技机构的审批方式都是先进行项目报备,在项目报备通过的时候其实这部分的项目资金就已经预留出来了,只要数据标注公司能够按时按量的完成项目内容同时提供合同内规定的相关发票,就可以顺利结算。

b)        沟通成本低一般的科研机构都是由项目负责导师指定联系人进行与数据标注公司的沟通,同时被指定人一般也都是项目的参与人,所以在规则的制定上更为清晰,与初创公司一样,能够快速的进入主题,大大节省了数据标注公司在沟通方面所花费的时间。

劣势:

a)         数据连贯性不强因为此类科研所的项目基本都是阶段性的,一类产品上线后,相关产品再进行上线需要周期。 

b)        找寻成本高因为科研机构的特殊性,在市场上很难准确就定位到需求部门,在众多部门中确立需求部门并与之建立起合作关系是需要耗费大量的时间和精力。

 4. 综合型

向AI化转型的各类传统行业企业。

优势:

a)         数据连贯性强因为涉及传统生产的转型,该类企业一般都有独立的AI产品研发组,同时因为此类公司本身的体量和市场占有率,会使其对于需要转型的领域和需求产品更为宽泛。

b)        数据量大因为AI转型除了成熟的技术支撑之外,最重要的就是时间,越快将生产结合AI的企业,其市场竞争力也就越明显。而如何能让计算机快速的进行训练呢?除了算法团队的技术支撑,剩下的就是给计算机提供大量的符合模型识别的标注数据。

劣势:

a)         结算周期长和企业型公司性质相同,由于庞大的内部结构,项目资金的结款周期相较于初创型公司和研究所会大大增长。

b)         工期紧张因为有转型这个宏观任务,所以一般此类企业都对转型项目的落地时间有明确的规定,说简单一些就是工期紧、任务重。由于这种特点,数据标注公司在承接此类公司的项目时,需要有大量的人手进行数据标注,这对于公司本身的管理无疑也是巨大的挑战。

本文来自觉醒向量