文:邹大斌
来源:云数科技圈
2022世界人工智能大会(WAIC)于日前落幕。
经过过去四届的发展与沉淀,今天的世界人工智能大会已成为人工智能领域最有影响力的国际盛会之一,今年大咖云集、国际大厂扎堆,充分彰显了大会的国际影响力和磁力效应。亚马逊云科技受邀参加了2022世界人工智能大会,并主办了“人工智能前沿技术趋势与最佳实践”的线上分论坛。
论坛上,亚马逊云科技人工智能与机器学习产品副总裁Bratin Saha博士、亚马逊云科技上海人工智能研究院院长、资深首席科学家张峥教授、亚马逊云科技人工智能开源项目首席产品经理、开源AutoML框架AutoGluon的开发负责人叶文铭、亚马逊云科技机器学习加速芯片Inferentia和 Trainium 的首席架构师 Ron Diamant等人工智能领域科学家、产品专家、高级学者分享了亚马逊云科技在人工智能与机器学习领域的探索过程以及该领域最新前沿趋势与行业洞见。
01 机器学习重塑数据洞察
人工智能是当下增长最快的市场之一。IDC报告显示,到2023年人工智能系统支出将达到979亿美元,与2019年相比增加了2.5倍。在人工智能众多分支领域中,机器学习是研究和应用最为活跃的领域之一。根据Gartner的研究分析,到2024年,75%的企业将把机器学习技术真正用于生产,为业务所赋能。背后的原因在于,机器学习解决了对非结构化数据的分析问题,重塑了对数据的洞察。
在人工智能和机器学习的推广应用上,亚马逊云科技是积极的实践者并一直走在前沿,从亚马逊智能语音助手Alexa、无人便利店Amazon Go到亚马逊电商网站都有机器学习的身影。从2016年开始,亚马逊云科技决定将机器学习的专业能力对外输出,为客户提供各种人工智能和机器学习服务。
如今使用亚马逊云科技的人工智能和机器学习功能服务的客户超过10万,覆盖金融、汽车、医疗、工业制造等众多行业,其中包括众多行业头部客户,如Capital One、飞利浦、汤逊路透、NFL、F1赛车、西门子和拜耳等,它们利用亚马逊云科技的机器学习能力取得了重要的业务成果。
大量客户应用亚马逊云科技的人工智能和机器学习服务,进一步加速了该业务的成长,使其成为亚马逊云科技有史以来增长最快的服务之一。
“在服务客户的过程中我们学到了很多宝贵的经验。其中之一就是,机器学习不再是我们需要规划的未来,而是我们现在就需要驾驭的当下。”亚马逊云科技人工智能与机器学习产品副总裁 Bratin Saha博士在其主题演讲中表示。
亚马逊云科技人工智能与机器学习产品副总裁 Bratin Saha博士
02 丰富的工业化工具集为AI赋能
在亚马逊云科技一直在推动机器学习普及工作,为此推出了丰富的机器学习工具集,以赋能具有不同AI/ML机器学习需求的开发者和使用者。这些工具集可以分为三层:
基础层是为机器学习专家提供的经过优化的深度学习框架。如Tensorflow、MXNet,方便专家们快速地构建环境,避免框架兼容性和依赖性等问题,从而提升训练速度、降低推理延迟。
值得一提的是,除了对现有深度学习框架进行优化外,亚马逊云科技还做了大量创新的探索工作,比如纽约大学、亚马逊云科技上海研究院等共同开发的面向图神经网络以及图机器学习的开源框架Deep Graph Library(DGL)和亚马逊云科技研发并开源的AutoGluon代码库。
会上亚马逊云科技上海人工智能研究院院长、资深首席科学家张峥教授就DGL最新进展进行了分享。张峥教授透露,目前DGL 0.9已经推出,年内将发布DGL 1.0版。亚马逊云科技人工智能开源项目首席产品经理、开源AutoML框架AutoGluon开发负责人叶文铭分享并演示 了AutoGluon 如何在 5 分钟内通过 3 行代码彻底改变机器学习工作流程,助力开发者轻松构建超大规模的机器学习应用。
位于中间的是Amazon SageMaker。这是一个端到端的机器学习平台,它覆盖机器学习应用的全流程,从数据标记、数据处理、特征存储、算法探索、模型推理到上线再到边缘端设备管理等为开发人员提供全过程支持。
最上一层是各种开箱即用的机器学习和人工智能服务。它们让客户无需机器学习的经验,就能快速地把这些能力集成到他们自己的应用或者业务流程中,如人脸识别、聊天机器人,以及个性化推荐、企业级搜索、欺诈检测等。
值得一提的是,与很多技术供应商不同,亚马逊云科技在推动人工智能和机器学习落地的过程中,非常重视机器学习的工业化,致力于实现智能化技术的普惠。
“机器学习要从极少数的专用应用程序,演变到在我们的生活中无处不在,就要通过自动化、工具化,通过部署和标准化的流程,即通过软件的工业化来实现的。”Bratin Saha说。
03 强大的算力为AI提供强力支持
人工智能应用大多数是算力密集型应用,非常依赖强大的算力支持,特别是一些参数高达数十亿个的大模型训练,对于算力的需求尤为突出。为了推动人工智能、机器学习的普及,亚马逊云科技一直致力于为机器学习量身定制的基础设施,让客户能获得最佳性能,并且以最低成本来大规模部署机器学习应用。
一方面,亚马逊云科技充分利用业界最新的研究成果,能为客户提供基于英伟达、英特尔、AMD、赛灵思等新一代的GPU和加速器的实例,并持续不断地优化成本。比如,G5实例相比基于G4dn为推理提供3倍的性能增强;EC2 P4d实例与上一代P3和P3dn实例相比,可以降低高达60%的训练成本,且训练深度学习模型的性能提高2倍。
另一方面,亚马逊云科技通过自主设计的AI专用芯片进一步降低机器学习的算力成本。Inferentia是亚马逊云科技推出的首款AI定制芯片,面向推理场景。和基于GPU的实例相比,基于Inferentia的实例可提供多达2倍的吞吐量,每次推理的成本降低了70%。Trainium是另一款机器学习芯片,面向训练场景,基于Trainium的实例也能提供比GPU更高的性价比。
“训练模型的计算需求正以类似的速度增长,但传统服务器计算能力的增长并没有这么快。两者的差距正在增大,差距的扩大意味着机器学习变得越来越复杂和昂贵。”亚马逊云科技机器学习加速芯片Inferentia和 Trainium 的首席架构师 Ron Diamant在演讲时表示。
他说,亚马逊云科技研发Inferentia和Trainium的目的就是要为客户提供快速、易用使用、可扩展和负担得起的机器学习加速实例。
04 让更多的人使用机器学习
让更多人能够构建机器学习解决方案,也是机器学习普及的关键驱动因素。根据Linkedin关于新兴职业的调查,在过去4年里,对人工智能和机器学习专家的招聘需求增了74%,是其他新兴职业增长率的2倍。然而,机器学习仍处于早期,企业很难找到合适的人才。
除了提供专业的工具外,还有什么办法能帮到这个行业,让更多人能使用机器学习术?亚马逊云科技想到了一个解决方案,这就是Amazon SageMaker Canvas。Amazon SageMaker Canvas是一个低代码开发平台,它让业务分析人员、营销和销售分析师,以及其他对机器学习并不熟悉、不会编码的人也能从机器学习模型中获得洞察。
当然,仅有Amazon SageMaker Canvas还不够,学生也是亚马逊云科技重点关注对象。为了让学生也可以学习机器学习,亚马逊云科技推出了Amazon SageMaker Studio Lab。它是一个无需设置和付费的机器学习开发环境,甚至不需要有亚马逊云科技的账户,只要有一个邮箱就可以开始使用。它不仅提供免费计算,还提供免费的存储空间。
亚马逊云科技还承诺到2025年,帮助世界各地的2900万人培养技术技能,为之提供免费的云计算技能培训,机器学习教育也是其中之一。
另外,截至目前已有来自150多个国家、超过14万的开发者在亚马逊云科技的DeepRacer项目接受过机器学习的培训。这是一辆比例为1:18的全自动赛车,由机器学习技术驱动。亚马逊云科技还提供免费的教育课程,这些课程原本是为亚马逊内部的机器学习大学准备的。比如,亚马逊云科技编纂了《动手学机器学习》这门课程已经被多所大学采用,如斯坦福大学、清华大学、新加坡国立大学、剑桥大学等,在GitHub上也开源了这门课程。
结束语
今天,成为数据驱动的企业成为不少企业的目标。根据Forrester的研究,数据驱动企业每年平均保持30%的增长率,同时,仍有68%的组织认为他们没有从数据中获得实实在在的价值,原因是没有现代数据战略。而这正是亚马逊云科技的用武之地。
实际上,帮助企业成就其现代数据战略,真正实现数据的业务价值,才是亚马逊云科技的真正布局,而人工智能和机器学习只是整体布局下的一环。它与亚马逊云科技的数据库、数据仓库、大数据平台等共同构成了亚马逊云科技的现代数据战略。
应该说,经过多年的努力,亚马逊云科技围绕数据已经构建起非常完整的工具栈,并一直持续迭代创新,为企业利用数据创新提供最大程度地支持。现在,工具已经备齐,如何用好它们就看企业自己的了!