第四范式戴文渊:企业智能化转型的“1+N”模式

  • 日期:01-26
  • 点击:(968)


IDC对中国人工智能市场的研究数据显示,2018年,中国人工智能市场将投资约25亿美元,其中超过66%将投资于以计算能力为核心的基础设施硬件市场。国际数据中心预测,到2022年,中国人工智能市场的投资规模将超过100亿美元,未来五年复合增长率将超过59%,形成规模为1000亿元人民币的全新人工智能基础设施硬件产业生态。人工智能计算力承载着人工智能应用的平台和基础,加速了人工智能系统的快速发展和进化。

随着人工智能的大规模登陆,企业在制定人工智能转型路线时可以考虑“1 N”的应用场景模式,“1”是将公司的核心业务结合起来,将对业务影响最大的一个或几个场景发挥到极致;“N”是使用最高的效率在大规模上着陆尽可能多的应用场景,以最大化场景的整体价值。

人工智能是当今一个特别热门和令人困惑的话题。火灾是由于各界的高期望造成的,混乱是由于公众在新闻媒体上看到更多的人工智能集中在感知层,如人脸识别、语音识别、无人驾驶汽车等。然而,回到我们的业务运营,似乎与无人驾驶汽车等技术没有任何联系。没有像英美烟草这样享受人工智能奖金的企业是靠人脸识别来运营的。第四种范式致力于解决如何将人工智能技术与各行各业的企业生产经营相结合的问题。企业和组织通常从上到下分为三个角色:战略制定者、战略制定者和战略执行者。在过去的20年里,互联网和移动互联网解决了战略实施的问题。未来20年,人工智能将通过改革“战略制定”环节来改善企业的经营状况。

企业愿景的第四个范例是人人共享的人工智能。我们希望把人工智能技术带到每个行业,如金融、零售、能源、安全、医疗、媒体等。帮助企业实现智能化转型。回到企业本身,不管人工智能技术是否被使用,我们首先需要关心的是企业需要增强什么样的商业价值。

首先,每个企业可能有一个或多个核心业务,这些业务的推广将带动整个企业的推广。例如,近年来,互联网应用越来越关注“成千上万的人和成千上万的脸”。本质上,个性化服务应用程序用于增强客户活动和降低客户流失率。客户活动的改善将促进企业的整体改善。对于零售或制造企业来说,提高供应链效率和降低成本也将提升企业的核心竞争力。面对这些核心应用场景,我们需要人工智能来实现“极端效果”,因为每增加一个百分点的效果对企业来说都是至关重要的。

其次,许多企业还经常面临场景应用极度分散的情况。例如,在大型金融企业中,它们的业务往往是分散的。在这种情况下,人工智能的大规模登陆往往比单一场景的极端效果对企业更重要。假设一个企业有1000个场景,其中一个场景比整个企业高10倍,只有1%。然而,如果我们能有效地完成1000个场景的全部覆盖,即使每个场景只翻了一倍,它也会得到100%的改善。因此,面对多场景的企业,人工智能的大规模登陆能力是企业智能化转型的关键。

我们习惯于称企业的核心场景为“1”,众多场景为“n”。一般来说,企业的智能化改造需要一个“1 N”的应用模式。这里应该指出,“1”不一定只有一个应用程序。有些企业可能有几个核心应用程序,如“1”,但肯定不多。

企业的业务必须与其发展目标相关联。例如,我们为一家着名的国际零售集团服务,并根据其发展目标将其业务分为“开源”和“节流”。“开源”的目标主要是与客户相关的,包括提高客户保留率、单一c

“1”必须达到最终效果,这种对标应用对人工智能系统有更高的要求。一个是高维,也就是说,精细,人工智能的维数越高,效果越好。在过去,专家模型的维度(规则数量)通常从几个到几千个不等。传统的高维模型通常局限于一万维。由第四范式开发的高维机器学习引擎可以支持数万亿(10 ^ 12)个维度。通过极高的机器计算能力,它可以实现远远超过传统几个数量级的精度。第二是实时。随着在线服务和对极限体验的需求,对服务实时响应的需求越来越高。尤其是在高维的情况下,我们发现我们过去能够做实时系统,但不能做高维。可以做高维系统,不是实时的。为此,第四个范例独立开发了RTiDB系统,以实现数万亿维模型毫秒响应的精确决策。第三是闭环(自我学习能力)。没有一个系统是完美的,也不会出错。我们更害怕的不是人工智能犯错误,而是人工智能一直在犯同样的错误。因此,持续使用来自业务应用程序的反馈数据进行系统自我更新和优化的能力是未来人工智能系统极其重要的核心能力。我们还经常发现人工智能系统最大的改进并不是来自系统上线的那一刻,而是来自上线后几年的自我迭代改进。

云图片

“N”追求大规模着陆。现在我们服务的许多企业正面临着“全面人工智能转型”。当面对1000甚至10000个场景时,如果每一个都达到完美,成本和效率是不够的。大规模着陆的途径与最终效果并不完全相同。首先,我们需要建立一个统一的方法,让更多的人用统一的方法大规模生产人工智能。第四种范式建立了基于“库珀学习圈”理论的人工智能方法,并在此基础上构建了“先知”平台。人工智能开发过程分为“行为数据收集、反馈数据收集、模型培训和模型应用”四个标准步骤。我们帮助客户和合作伙伴的开发者根据这样的1234在先知上生成人工智能。以我们服务的一家大型中央企业为例。它的开发者很多,但是人工智能开发者非常有限。我们为开发人员提供了统一的方法和平台,以便根据业务目标在其上开发各种人工智能应用程序。

其次,在人工智能规模应用的过程中,有必要具备完善的数据治理能力,尤其是对于大中型企业来说,数据治理非常重要。也许我们过去已经构建了大数据系统,但是它们通常是为商业智能而构建的。商业智能大数据主要帮助人们总结一些经验,因此它更加强调查询、统计和可视化等功能。人工智能大数据是机器可以看到的数据。我们需要的是一个完整的、实时的闭环,支持机器的自学习。这两个大数据系统的设计理念自然是不同的。我们经常看到企业在过去已经建立了面向商业智能的大数据系统,并且在这个系统上建立了人工智能。它不但没有帮助人工智能,反而成了人工智能登陆的障碍。因此,在大规模人工智能实践过程中,企业需要一套面向人工智能的数据管理系统,能够访问PB级甚至更多的日志,支持实时存储,并形成一个在线数据收集和处理的闭环。

云图片

云图片

最后,人工智能计算能力。过去,人们关注两个方面:一是通过购买大量服务器和图形处理器来提高计算能力。第二是通过芯片加速人工智能。然而,计算能力是一个完整的体系结构,不仅包括硬件,还包括软件和硬件的“组合”。只有了解人工智能算法的计算架构和逻辑,才能对硬件进行深度优化。人工智能系统实际上是一个具有固定计算模式的“常规”设计。它需要特殊的计算,不像大数据和软件,后者需要一般的计算。根据专用计算的特点,算法和软件实际上可以直接定义计算,而硬件可以预先定义计算部分。此外,传统的通用通信协议和存储系统也面临着过去无法支持人工智能的困境,这就需要对其进行深入的优化