现阶段,中国人工智能处在商业化较快的时期,人工智能已广泛应用于人们日常生产、生活的方方面面,从产业的层面来看,人工智能的引入也为中国数字经济发展带来巨大的增量。
人工智能的高速发展,离不开人们对美好生活的追求。值此之际,科大讯飞召开全球1024开发者节,展会将汇聚1200余款AI明星展品,通过九大主题展馆,展示AI创造美好生活的最新实践。
作为面向AI开发者举办的人工智能盛会,自2017年创办至今已是第六届,本次1024开发者节以「AI向新·数智万物」为主题,是科大讯飞年度重磅打造的规格最高、影响因子最大的人工智能行业生态盛会。
此次科大讯飞董事长刘庆峰,科大讯飞总裁吴晓如,科大讯飞消费者BG总裁于继栋,科大讯飞AI研究院副院长高建清等高管也来到现场,分享了讯飞在提升自身AI服务能力上的探索。
科大讯飞董事长刘庆峰在1024开发者节的开幕式报告中提到:“我们说洞察未来最好的方式就是创造未来,我相信人工智能在我们的共同努力下,一定会以解决人类刚需而被更深刻的载入史册。”
科大讯飞此次将会给我们带来哪些新技术与新产品?让我们一同走进这AI盛宴。
人工智能走向人机高效协同时代
“这不过是将来之事的前奏,也是将来之事的影子。”AI之父阿兰·图灵,曾留下过这样一句经典名言,倾诉其对未来人工智能趋势的笃信。
眼下这样的判断正在成为现实,随着人工智能相关技术的持续演进,人工智能已在教育、安全、金融、交通、医疗健康、家居、游戏娱乐等多个领域实现技术落地,几乎已融入人类生活的方方面面。
智能语音作为人工智能市场比重较大的应用场景,也纷纷在各种场景中发力,根据1024开发者节披露的数据:
社交场景,输入法调用增速亮眼,Z世代成语音输入新力军;家庭场景,电视助手调用增长515%,全年龄段语音交互习惯渐成;出行场景,车载语音调用增长104%,多语种交互助力车企走向全球。
等等,随着AI高度融入人类的生产和生活,可以预见的是,人工智能正从当前的机器被动交互走向与人机高效协同的时代,无论是在物理还是数字世界,机器人正在拓展人的能力边界,推动产业蓬勃发展。
作为最早看到这种趋势并参与进来的人工智能玩家,2022年初,讯飞正式发布“讯飞超脑2030计划”,旨在构建基于认知智能的人机协作、自我进化的复杂智能系统。
为了该计划能够顺利推进,“讯飞超脑2030计划”给出了三个清晰的阶段:第一阶段(2022~2023年),将推出可养成的机器宠物、仿生运动机器狗等软硬件一体的机器人,同期推出专业数字虚拟人家族;
第二阶段(2023~2025年),公司将推出自适应行走的外骨骼机器人和陪伴数字虚拟人家族,老人通过外骨骼机器人能够实现正常行走和运动,同期推出面向青少年的抑郁症筛查平台;
第三阶段(2025~2030年),最终推出懂知识、会学习的陪伴机器人和自主学习虚拟人家族,全面进入家庭。
而在发布会上,科大讯飞展示了“讯飞超脑2030计划”的重头戏,机器人超脑平台AIBOT。该平台通过多模交互、深度理解、运动控制、硬件模组等能力,快速构建机器人运动能力,当下已应用在多种领域。
譬如在AI科技馆,搭载了讯飞机器人超脑后,依托讯飞领先的AI+运动、导航、语音交互、视频分析等算法的讯飞AI+四足机器狗“小黑”,具备了走路、跑步、上台阶、攀爬、穿越复杂地形等技能。
不仅如此,“小黑”还具备三大能力:自主导航,可在室内外进行自主导航行走和避障;自适应步态,不需要切换步态即可通过高难度地形;多模感知,可实现语音交互、视觉分析、气味识别、声音成像等能力。
“拥有这三大能力的机器狗,已可以在工业巡检、园区巡检、访客接待等场景中发挥作用,例如搭载了声学成像仪的机器狗可以在变电站、燃气站进行声学局放故障巡检,对气体泄漏等故障点进行搜寻。”
作为指引公司中长期的技术与产品发展路线,“讯飞超脑2030计划”有助于科大讯飞实现“全球人工智能产业领导者”的长期愿景。此次讯飞多种新产品的首秀,恰恰说明超脑2030计划的蓝图正在展开。
讯飞开放平台2.0战略,赋能千行百业
随着开放平台2.0战略稳步推进,行业开发者生态也更加繁荣,当下,讯飞开放平台已经汇集AI能力513项、开发者总数370万、应用总数157.6万、生态合作伙伴数超500万、累计终端设备数36.6亿。
作为首批国家新一代人工智能开放创新平台,讯飞人工智能开放平台始终通过科技赋能效应持续构建AI行业生态,拓展人工智能行业落地方案和场景。
在当天的1024计划年度发布会上,科大讯飞总裁吴晓如还展示了讯飞开放平台在源头技术上取得的技术成果。
近年来,科大讯飞持续在机器翻译、自然语言理解、图像识别、图像理解、知识图谱、知识发现、机器推理等各项国际评测中取得全球第一。这离不开科大讯飞坚持系统性创新,不断拓展科技的广度和深度。
科大讯飞总裁吴晓如主要介绍了多模感知、多维表达、深度理解、运动智能四大技术。
以多模态技术为例,早期深度学习算法专注于从一个单一数据源训练其模型,而多模态人工智能是计算机视觉和交互式人工智能智能模型的最终融合,将机器的“看”“听”“说”等智能识别交互功能融合在一起。
简单来说,从单模态感知到多模态感知,准确率大幅提升,在医院、地铁等开放场景下的语音识别达到可用。
现阶段,在人工智能创新快速发展的时代,以多模态感知为核心的强人工智能技术是大方向,科大讯飞由单点语音技术向多模态感知方向发展,将持续夯实人工智能技术底座。
目前,讯飞开放平台已经完成从1.0到2.0的战略升级,如果说开放平台1.0战略,科大讯飞只是把各项AI能力单方向提供给合作伙伴,那么平台2.0战略是要面向产业数字化去深度挖掘行业的应用价值。
在此次发布会上,科大讯飞展示了开放平台2.0在教育、金融、城市、工业等场景的合作共建。
数据显示,开放平台2.0已在14个行业应用落地,与多家行业龙头达成战略合作,形成良好的生态带动效应,共计超1600家第三方合作伙伴加入共创。
拿教育场景来说,通过科大讯飞联合行业专家以及资源应用厂商推出的精准教学解决方案,使教师备课时长缩短33%,学生低效重复练习减少58%,学习兴趣提升30%。
而在工业领域,在人工智能赋能下开放平台2.0持续升级,讯飞在此基础上推出了羚羊工业互联网平台,目前平台汇聚了近22.3 万用户,7万家企业,服务商1万余家,科研个人2万多位,成果总数3万多条。
实践是检验产品的唯一标准,在AI工业馆中,通过数据打通,羚羊工业互联网平台帮助美亚光电构建了企业级的数据中台,支撑美亚光电内部研产供销服管全要素数字化和外部全产业链数字化。
等等,随着此次1024开发者节展示的众多场景的最新实践,足以说明在人工智能赛道上深耕二十多年来的科大讯飞,在推动人工智能应用落地这条路上,正在通过推进“平台+赛道”战略赋能千行百业。
讯飞的星辰大海,离不开建设美好世界的初心
眼下,作为数字经济时代的重要新型基础设施,人工智能基础设施的发展水平已经成为衡量国家科技创新实力的重要指标之一,相关产业也将成为全球数字化经济发展的核心推动力。
早在2017年国家就对人工智能产业进行过明确的规划,国务院制定并发布的《新一代人工智能发展规划》,将人工智能技术上升到国家战略层面。
而如今的“十四五”规划和2035远景目标提出要以高质量发展为主题,更要求人工智能技术进一步加快作用于国民经济活动,持续提高生产力水平,为高质量经济发展提供技术支撑。
作为人工智能重要赛道,根据艾瑞咨询《2021年中国人工智能产业研究报告》,智能语音技术可通过声音信号的前端处理、语音识别(ASR)、自然语言处理(NLP)、语音合成(TTS)等形成完整的人机语音交互。
此次1024开发者节,我们已经可以在科技、工业、生态、创客、企业、生活、城市、教育、健康九大展馆中看到AI的落地应用。
无论是在教育馆中,AI 技术的因材施教方案,减轻老师和学生负担,切中减负刚需:一方面,通过分析学生的过程化学习数据,减少大水漫灌式的无效的重复的做题,减轻学生的负担。
另一方面,通过精准教学提升课堂教学的质量,通过采集老师课前、课中、课后师生互动的数据,不断地提升老师备课、授课和课后作业布置等环节的工作效能,降低老师的负担。
还是在健康馆,AI为基层医务人员提供病历质控、辅助诊断、合理用药等功能,在为医务人员提供实时电子病历语音转写的同时,可以根据具体内容实时生成机器自主决策的辅助诊断建议供参考。
乃至在城市馆,在城市运营中心展区,科大讯飞展示了数字驾驶舱解决方案及标杆案例,为城市管理者提供数字化、精细化的城市管理工具,实现城市状态一屏统揽、批示指令一键触达、决策指导一手掌握。
等等,在众多落地场景背后,都离不开一个底层逻辑。科大讯飞董事长刘庆峰早已在今年6月9日,科大讯飞的23周岁的生日上强调过:
创业23年,这其中最大体会,是我们始终走着一条弯曲的直线。这主要由三个要素决定:创新和坚守,GBC联动下的根据地业务+系统性创新的战略路线,最重要的核心动力是源于热爱的初心。
讯飞一路走来,从中文合成,后来到语音识别再到语义理解,从中文到英文到多语种,从语音再到图像再到多模感知多维表达。而应用领域不断拓展的核心正是,用人工智能建设美好世界,这是最底层逻辑。
从此次在1024开发者节上发布的新技术与新产品来看,也无不凸显科大讯飞通过人工智能持续满足社会刚需、建设美好生活的追求。以终为始,展望讯飞的星辰大海,一定离不开这份初心。