生成式人工智能取得突破,ChatGPT等生成式AI的快速发展和应用,改变了人工智能技术与应用的发展轨迹,加速了人与AI的互动进程,是人工智能发展史上的新里程碑。
近期,在拉斯维加斯举办的CES展会(国际消费类电子产品展览会)上,AI PC成为最受关注的焦点之一。英特尔和英伟达分别发布相关处理器和显卡,联想和戴尔也发布了AI PC创新终端产品。AI PC市场有望在2024年迎来突破。
中泰证券研报指出,人工智能新一轮十年级的技术和产业革命大幕已经拉开,短期调整并不影响产业的长期投资机会。
根据行业通用研究,人工智能产业链一般分为三个层级:基础层、技术层和应用层。其中,技术层是AI产业的核心,包括计算机视觉、自然语言处理(NLP)、语音识别、知识图谱等。受益于我国发达的互联网产业和大量用户数据的积累,我国在计算机视觉和语音识别领域处于世界领先地位。
目前,海康威视(002415.SZ)、商汤(0020.HK)、云从科技(688327.SH)等在人脸识别、安全监控系统方面具有技术优势,科大讯飞(002230.SZ)、百度(9888.HK)、腾讯(0700.HK)等则在语音识别上表现良好。在自然语言处理领域,科大讯飞(002230.SZ)和拓尔思(300229.SZ)也有所储备。
在前述研报看来,当前海外已经开始进入商业落地阶段,ChatGPT、Midjourney等现象级爆品出现,微软、Adobe、Salesforce、Zoom等软件巨头亦纷纷推出商业化产品,静待数据的持续验证。国内短期看算力最确定,模型训练拉动训练算力需求,未来应用大规模兴起亦会拉动推理算力需求。大模型仍处于群雄逐鹿、快速迭代阶段,未来空间大且格局收敛,应用端长期空间最大,厂商百花齐放。
计算机视觉应用扩宽
随着深度学习技术的不断发展,计算机视觉的应用范围正在不断扩大。
目前,计算机视觉已经在目标检测、图像分类、图像生成、物体跟踪、人脸识别、手势识别等方面取得了显著成果。此外,基于计算机视觉的人工智能系统在自动驾驶、智能安防、智能机器人等领域也有广泛应用。
在资本市场上,有多家公司在计算机视觉领域具有技术实力和业务布局。
其中,欧菲光(002456.SZ)是一家在光学影像领域具有全球领先技术的公司,其产品涵盖了摄像头模组、指纹识别模组和光学镜头等。公司凭借优势的光学技术和生产制造自动化能力,积极布局机器视觉、运动相机等新领域光学光电业务,在计算机视觉领域也有着一定的技术积累。
大华股份(002236.SZ)是一家以视频为核心的智能物联网解决方案提供商,在计算机视觉领域拥有先进的技术和广泛的业务布局。其产品和服务广泛应用于安防监控、智能交通、智慧城市等领域。
海康威视(002415.SZ)是中国领先的安防设备和解决方案提供商,同样在计算机视觉技术方面表现卓越,拥有一系列领先的产品。海康威视的产品和服务广泛应用于政府、企业和个人等领域,提供全方位的安防解决方案。
据Omdia报告,海康威视2022年全球视频监控领域市占率达25.9%,连续多年保持行业第一位置。2021年,公司以安防技术创新为核心,将业务领域重新定位于“智能物联AIoT”,致力于将物联感知、人工智能、大数据技术服务于各行各业,引领智能物联新未来,打开了成长新空间。
随着AI技术的突破和产品功能的持续创新,公司逐步拓展至“泛安防”领域,智能化发展成为行业增长的新引擎。
据中商产业研究院预测,2025年中国智能安防软硬件市场规模有望达到913亿元,2023~2025年CAGR达14.02%。
此外,国联证券研报分析称,“泛安防”领域具有用户分散、项目单价低、非标准化高的“碎片化”特征,公司凭借多年的视频监控数据积累,有望把握行业发展机遇,进一步巩固竞争优势,充分享受行业发展的红利。
据IDC预测,2026年全球物联网(企业级)支出规模有望扩大到1.1万亿美元,2022~2026年复合增长率达10.7%,前景广阔。
语音识别场景多元化
语音识别场景化是实现高质量、高效率和高准确率的语音识别的重要前提,具有重要的应用价值和市场前景。
科大讯飞是A股语音识别领域的头部企业。去年10月24日,公司发布了讯飞星火认知大模型V3.0,七项核心能力持续提升,整体与ChatGPT对标,在中文上实现超越,并在教育、医疗等领域做到业界领先,例如医疗领域已超越GPT-4。据透露,2024年上半年讯飞星火将实现对标GPT-4的目标。
同日,科大讯飞联合行业龙头共同发布了覆盖金融、汽车、运营商、工业、住建、法律等十二个行业的大模型,并且陆续在教育、办公、汽车、金融、工业、医疗等领域推出相应的解决方案,持续向行业深耕推进。
今年1月6日,据国家知识产权局公告,科大讯飞申请了一项名为“语音识别模型的训练方法、语音识别方法、装置和设备”的专利,公开号为CN117351948A,申请日期为2023年11月。
专利摘要显示,本发明提供一种语音识别模型的训练方法、语音识别方法、装置和设备。该训练方法包括:获取电子设备中处理器的目标类型;确定所述目标类型对应的目标初始声学模型,所述目标初始声学模型的模型结构和所述目标类型匹配;基于目标语料对所述目标初始声学模型进行训练,得到声学模型;基于所述声学模型,确定语音识别模型。本发明可以提高语音识别模型的适应性。
科大讯飞近期在投资者互动平台表示,公司在语音、自然语言理解、机器认知推理能力、多语种多模态人机交互等方面的技术和产业化应用已具有业界领先水平。
值得一提的是,1月9日晚间,科大讯飞宣布拟分拆所属子公司讯飞医疗科技股份有限公司(下称“讯飞医疗”)至香港联交所主板上市。
讯飞医疗成立于2016年5月,基于国际领先的医学语义计算、文本理解、知识推理、数据挖掘等核心技术,打造人工智能医疗解决方案体系,主要业务包括智联网医疗平台、智医助理、智慧医院三部分。
据公告介绍,讯飞医疗能够依托算法模块及机器学习模型,服务于医学知识问答、复杂医学语言理解、专业医学文书生成、诊断治疗推荐、多轮交互及多模态交互等方面。
科大讯飞还提到,讯飞医疗正面临医疗人工智能行业的大发展机会,分拆讯飞医疗上市,借助资本市场的力量,有利于进一步提升讯飞医疗的盈利能力及综合竞争能力。
NLP技术加速落地
NLP(自然语言处理)是一项涵盖自然语言学、计算机科学和人工智能的交叉学科科学,其致力于研究人与计算机之间语言的交互,并旨在构建能够处理自然语言的系统。
汉王科技(002362.SZ)是一家以人工智能技术为核心的高科技企业,主要涉及图像识别、文本识别和智能交互等领域。汉王科技在NLP领域也有着一定的技术积累和业务布局。
拓尔思(300229.SZ)是国内最早从事自然语言处理技术研发的企业之一,是A股第一家上市的大数据技术企业,在人工智能、大数据和数据安全领域具有领先的产品和服务。
除了以上几家公司,还有其他的A股上市公司也在NLP领域进行着布局和实践,如海天瑞声、中科信息等。以上公司在技术和应用方面都有着一定的积累和优势,未来有望在NLP领域取得更大的突破和发展。
以拓尔思为例,在技术方面,拓尔思聚焦NLP、知识图谱、图像检索三大核心技术,结合机器人流程自动化技术,面向不同应用场景,形成了一套完整的多模态人工智能产品体系,可为广大用户提供文本、音视频、多模态等全栈AI解决方案。
公司开展拓天行业大模型的构建和训练,并在此基础上实现媒体、金融和政府领域的AIGC应用产业化落地,具有良好的市场前景和经济效益,将进一步提升公司的核心竞争力和服务能力。
此外,在数据要素业务方面,公司表示将积极全面布局数据要素市场。依托拓尔思自建的大数据中心,构建“1+1=N”的数据要素商业模式,建立起符合公司实际的数据要素治理体系。
今年1月1日起,《企业数据资源相关会计处理暂行规定》正式施行。拓尔思表示,公司拥有各行业数据资产总量超2000亿条,2023年6月至今已相继推出媒体、金融、政务、舆情等行业大模型,且正在研发拓天大模型Agent技术,并已同多个省市的大数据交易所建立起合作关系,上架数据服务类Open API。
展望未来,拓尔思指出,将深入发展人工智能、大数据和数据安全领域业务,加大语义智能、AIGC等相关领域技术研发投入力度;开发具有产业化意义的AIGC应用项目,建立人工智能、大数据产品及服务生态体系;充分利用公司积累的数据资产和客户优势,扩大数据要素产品市场空间和变现能力。作者:雷晨。