当前位置: > 热博

深度KWeaver:价值驱动,认知智能走向开源共创

时间:2022-10-03 13:30:56 热博 我要投稿

文|智能相对论

作者|叶远风

在底层硬件创新之外,软件创新对提升中国前沿科技竞争力同样重要,这其中,开源的必要性毋庸置疑。但是,在全球范围内开源项目硕果累累的大背景下,中国开源过去的发展却不够快,直到最近几年才开始发力与加速。

这个过程,有大厂的宏观布局,也有垂直领域的创新企业的积极参与,整个市场的热情已经被点燃。例如,不久前全域数据能力服务商爱数正式开源了其认知智能开发框架“KWeaver”,这个产品脱胎于爱数的AnyDATA Framework 2,通过数据+AI,推动领域认知智能。

但是,KWeaver并没有采用全套高举高打的方式,爱数低调务实同时又信心满满,这背后,或也反映出中国开源项目内在的价值驱动要求。

政策驱动表象下,开源藏着价值驱动的里

基本上,能够叫得上名号的开源项目,无论是业界还是普通大众,对其印象往往都是大量的推动政策,背后的商业公司投入一系列资源,让项目有更多的参与者、更好地参与其中,加速项目的发展。

典型如,华为在新计算产业的代表昇腾AI,其全栈体系中的开发框架MindSpore开源两年,华为不断从高校人才合作、创新赛事、大模型产业联动(MindSpore在大模型训练上有特殊优势)来推动MindSpore的发展,意图更快地向Google TensorFlow靠拢。

此外,华为开源的服务器操作系统欧拉(openEuler)脱胎于过去其自用的EulerOS操作系统,在推动项目发展过程中,华为不断动用自身的产业资源优势,通过新计算架构的生态链构建来吸引开发者,推进欧拉社区的活跃度。

类似的还有百度在飞桨开源后,几乎年年都举行大规模人工智能产业创新大赛,除了提供丰厚的奖励,还邀请行业内的创投机构作为评委提供开发者将项目落地的机会。

还有更多开源项目都是如此,给人的印象都是一套技术基座配合开发者共创工具、模型、产业案例与实践经验,然后要给予大量政策支持,对接产业需求、建立产学研用正循环,把火烧旺。

但是,这些可能只是表象。无论什么开源项目,能够有起色最根本还在于其背后的商业价值或社会价值。

MindSpore、飞桨开源能够走下去,核心在于当AI进入工业化大生产时代,需要批量出产AI应用的时候,一个优质AI开发框架填补空缺十分必要,享受更便捷的开发框架是AI开发企业、产业伙伴的共同追求。

欧拉开源项目的发展,更是因为中国服务器操作系统严重空缺,而世界范围内那些传统的操作系统存在各种与当下计算需求(尤其是异构计算)的不匹配,这时候,寻求计算能力突破、数字化变革的企业们,迫切需要一个更高效和便捷的服务器操作系统。甚至,随着这种需求的进一步发酵,欧拉还在成为整个数字基础设施的操作系统,与鸿蒙在物联网终端的落地打起了配合。

在中国开源项目亟待快速发展的今天,毫无疑问,这样的价值内核才是开源项目能够高质量、快速发展的根本所在。

换句话说,如果是一块石头,怎么烧,火都是烧不旺的。

回过头来看,KWeaver这类项目的出现,也在基于价值驱动的内在逻辑,也是人工智能发展到认知智能解读的必然。

人工智能有两条线,感知智能与认知智能,目前无疑认知智能是热点,而领域认知智能是认知智能在各个场景下的不断垂直细化。领域即业务,用简单的话说,领域认知智能就是让组织拥有与人一样的“智商”,能够在吸收大量数据和信息后对外做出有逻辑的判断、推理,帮助组织解决特定的业务问题。

随着数字经济的发展,只会刻板“看数字”的业务能力已经无法满足组织的需要,能够“理解”和“解释”业务,通过数据做系统性的推理、规划,才能更好地帮助组织发展,这是数据驱动型组织的本质。这种实现了人类独有认知能力的领域认知智能,对推动数字化转型、解决业务痛点、实现降本增效有直接的价值。

KWeaver的推出,仰仗的就是这样的价值,也必须有这样的价值。

例如,KWeaver孵化自爱数三年的产品积累,其背后的 AnyDATA已经建立起了系统的数据编织到知识网络构建,再到认知推理分析的体系。在某智慧城市,构建了一套基于产业经济学理论的五维产业链模型,通过内外部数据融合,结合产业链推理分析场景,帮助区域实现从产业链精准招商、主动企业服务优化营商、内外部关联产业与经济分析,完全通过数据和业务关系网络来辅助区域产业布局、招商引资、数字化营商新模式。无论是政府数字化转型,还是企业数字化转型,爱数已经构建起来了数字化的认知模型:

定目标:从战略目标拆解到业务流程结构;

深观察:通过系统和数据观察业务状态;

反思优化:通过指标对比与风险监控发现问题,通过知识网络定位根因,再形成优化路径;

决策执行:最终形成认知分析报告和建议,指导数字化优化和执行。

认知智能是人工智能的下一程,领域认知智能的发展,让这个赛道上的开源项目有了价值支撑—在很多有价值的技术领域,新的开源项目可能已经在路上。

开发者、企业、行业,开源的价值还必须走向多方共赢

具体到不同的主体,开源项目又需要有不同的价值体现,任何一方无法获益,项目将最终无法走下去。

1、 对开发者,商业或社会价值带来最终的参与内驱力

参与到开源项目的开发者,包括专注于技术的开发人员,或者产业链中的客户企业等,项目带给他们的价值是参与到社区的最终内驱力。如果一个项目只是给予各种政策而缺乏实际的价值产出,很容易浪费资源甚至沦为“骗补贴”的游戏。

欧拉的快速发展,得益于众多参与项目的企业都能够开发出自己的商用版本,共享一些便捷的技术能力,例如操作系统厂商可以做出更加适合市场需要的版本,服务于其客户。

而KWeaver同样如此,想要通过AnyDATA推动认知智能的企业,一方面能够共享到许多技术方案,另一方面也能够通过开源将KWeaver集成到自身相关的系统中,做更智能的搜索、建设自己的认知中台等。

另外,开发者通过爱数的平台,还能实现诸如数据交易、知识变现等价值。

2、对企业,带来新兴领域发展的杠杆效应

在商业市场上,开源对主推项目的企业而言,至少要实现三种价值中的一种:培养用户、确定行业标准或者获得商业价值,否则开源项目就会失去往往是最大的技术支持来源。

以KWeaver为例,其对爱数而言,是在领域认知智能领域以技术共享的方式快速培养用户,并通过算法开源一定程度上确定行业标准,最终在领域认知智能全面开花后,凭借自家的AnyDATA产品获取对应的商业价值,实现三者兼顾。

实际上,这些价值背后,开源项目通过更多方面的参与,让企业能够撬动发展的杠杆,让更多人共享也就是让更多的人参与,加速技术创新——KWeaver让领域认知智能在各种细分领域都有对应的开发者,完成爱数一家企业无法完成的全领域认知智能,推动领域认知智能在全场景的落地,在这个过程中,爱数只需要做好底层技术服务、做好标杆领域示范即可。

3、对行业,根本上改变技术和产品发展的轨迹

众人拾柴火焰高,开源的一个重要价值,是在行业层面推动技术的快速演化,尤其是在全球化的力量参与下,更快实现技术进步、行业崛起,这种价值让整个行业有更好的发展前景,也才能支撑开源项目一直走下去,这其实是一个类似于推动“朝阳产业”发展的过程。

MindSpore、欧拉背后,新计算产业快速发展,带来了广阔的市场机遇,反过来又让开源项目越来越有期望,更多的加入者、更好的前景,一步步滚雪球。

KWeaver也是如此,其开源让领域认知智能获得全球化的参与力量,不再只有爱数一家企业推动,让人工智能中的认知智能能够以垂直细化的方式全面落地。在这个过程中,更多的企业也将获得普惠化的认知智能,使认知智能走下高高的神坛,以垂直化的方式深入千行百业,营造出广阔的发展前景。

价值驱动的同时,开源项目还要完成“底色”的描绘

当然,开源项目在价值驱动的同时,一些必要配套工作也必不可少,科技大厂们那种大量资源投入的政策做法可以看作是这方面的代表,但从KWeaver来看,还有两个方面的动作必须完成。

一是在更高代码质量要求的情况下,能够源源不断输入优质技术能力。

越是初期,来自项目主推企业的技术支撑就越为重要。一个AI开源项目最开始被贡献出来的代码质量奠定了开源社区的“品质”基调。

2019年立项,2021年1月发布1.0版,2021年正式走向商业落地,2022年3月正式发布AnyDATA 2.0……在KWeaver走向开源前,爱数已经在AnyDATA上进行了3年多的打磨,保障了开源项目最基本、最核心的技术能力。

目前,KWeaver提供有可视化的知识网络工作台,可视化的认知智能应用开发调试工具,丰富的数据加工及模型训练工具,以及所见即所得的API文档等。这背后,还离不开爱数十多年精益研发经验,对代码质量的把控,在各种测试上的有效覆盖,才能有底气做开源。

二是开源的态度建设,越开放的心态、越少的限制,越能够激发开发者的热情和创新能力。

基本上,越是成功的开源项目,在对开发者的限制上就越少,甚至“放任自由”。与此同时,越是早期的开源项目,对开发者的“放任”就越能带来更积极的结果。

KWeaver选择了Apache license 2.0作为开源许可证,原因可能就是如此。这是一个比GNU、GPL、BSD等常用许可证更加自由的标准,几乎对开发者不加以限制,可以自由利用代码。

事实上,KWeaver的出现还带有普惠技术赋能产业的色彩,人人都可以在 GitHub上获取代码,其源代码开源且技术透明,任何参与项目的用户都可以查看全部技术细节,同时还支持多元异构数据源对接,提供SDK兼容更多的第三方知识抽取模型,提供 API和 Web组件的整合方式,几乎是全方位的自由。

总而言之,中国开源项目任重道远,但遵循价值驱动的逻辑,随着各大开源项目尤其是AI开源项目的发布,这个进程正在加快。在一开始就盯住价值的情况下,这些开源项目也锁定了长期的发展潜力,为中国开源项目带来更多可能性,在全球软件创新竞争中获得更多优势。

*本文图片均来源于网络

此内容为【智能相对论】原创,

仅代表个人观点,未经授权,任何人不得以任何方式使用,包括转载、摘编、复制或建立镜像。

部分图片来自网络,且未核实版权归属,不作为商业用途,如有侵犯,请作者与我们联系。

•AI产业新媒体;

•澎湃新闻科技榜单月度top5;

•文章长期“霸占”钛媒体热门文章排行榜TOP10;

•著有《人工智能 十万个为什么》

•【重点关注领域】智能家电(含白电、黑电、智能手机、无人机等AIoT设备)、智能驾驶、AI+医疗、机器人、物联网、AI+金融、AI+教育、AR/VR、云计算、开发者以及背后的芯片、算法等。

最新推荐