导语:
医疗,已经成为被大模型改造最热门的行业之一。
一方面,业内期待大模型能真正帮助医疗解决“不可能三角”问题,另一方面,也期待医疗行业在人工智能的加持下,摆脱单纯人力重复劳动的问题,走向电影中的未来——做辅助决策,全智能化。
回到现实世界,自然语言理解在医疗中的应用并不晚。早在2016年,东京大学医学研究院利用Watson,只用了10分钟的时间就成功判断一位女性患有罕见的白血病。医疗领域期待“智能化”良久。
就在一年前,IBM对于Watson Health的出售对行业带来了沉重的打击。短短一年的时间,医疗大模型已经发生了天翻地覆的变化,参数规模庞大的大模型,成功将医疗大语言产品进一步优化。
但对于医疗大模型而言,最关键的还是商业化进程。
周二,百度发布了灵医大模型,这是国内首个“产业级”医疗大模型,也是国内首个面向大健康上下游开放试用和测评的医疗大模型。但最重要的是,这是国内首个已经商业落地应用的大模型。
百度的医疗大模型能为行业带来何种启示?灵医大模型的商业化探索之路,能否为行业带来示范作用?良医财经从三个层面,带来独家深度拆解。
👩🏻⚕️ 主笔/ 布吕
✂️ 文章架构师/ 立立
💊 出品/ 良医财经
01
医疗大模型问题之一:
解决什么问题?
随着通用大模型的走红,药物研发、问诊与诊断等垂直领域大模型正逐渐浮出水面,资本迅速涌入,赛道也极速升温。狂热下,人们不免好奇:为什么需要医疗垂直大模型?AI大模型在医疗场景中究竟应用何种程度?产业落地还有多远?
医疗大模型产品五花八门。一些医疗大模型产品没有充足的算力支持,只是为了迎合风口蹭热度,进行了一些局部指令精调后,就广而告之的宣传产品的落地。其真实效能可想而知。
良医财经看来,当前医疗大模型其中最关键的三个议题是:
1. 从技术层面上看,数据和算力,能否被保障?
尽管大模型展现出通往通用人工智能的潜力,但这条路并不好走。第一个难题就是技术和算力的支撑。大模型之所以称为大模型,是因为其庞大的数据量使其拥有了涌现的能力。
从理论上看,大模型研发的核心技术是由预训练与 Alignment(价值对齐)组成的,第一部分就是预训练,需要用大量的数据使模型收敛速度更快、性能更好。
第二部分则是 Alignment,Alignment通过使用多种方式、策略优化模型输出,让 AI 在和人的交流反馈中学会如何沟通表达,这两部分是提升大模型质量的核心要素。
而上述这两部分的能力,取决于数据、模型参数量和算力。模型参数量越大、投入的训练数据越大,模型泛化能力越强。也就是说,只有拥有以上两种能力的企业,才有可能切入大模型赛道。
2. 从风险层面上看,数据准确和安全性,能否被保障?
不同于通用大模型,医疗大模型表现出更强的专业性。一直以来,医疗赛道都是严肃科学,这一领域的风险相对于其他行业也更大。医疗大模型对于数据准确性和安全性,要求更高。
反馈到大模型上,当模型参数量增长超过一定阈值时,模型能力表现出跃迁式的提升,表现出来语言理解能力、生成能力、逻辑推理能力等能力的显著提升,这也就是我们所说的模型的涌现能力。
当模型的涌现能力更强,对语言的理解能力、逻辑能力随之提高,安全性也就有了保障。
此外,为保证数据的准确性和多样化,灵医智惠与人卫智数、爱思唯尔 (Elsevier)等业内权威医学知识库达成深度战略合作,在智慧医疗相关产品及服务维度深度合作,保证循证AI的基因。
3. 从产业层面上看,能否为医生提效,为医院降本,为患者答疑?
作为垂直于医疗赛道的大模型产品,核心就是服务于产业,赋能产业上下游的受众。
过去,这个医疗三角中存在很多“疑难杂症”,比如,医生资源分布不均、医生的重复劳动、患者难以就医等。要解决这些问题,就要在医生端,帮助提高工作效率;对医院端,降低成本;对患者端,解决线上答疑问题。
在这点上,灵医智惠在模型训练过程中就会兼顾医、患、药三方信息,其内部数据显示,灵医智惠先后投入了自有积累的超1000万优质医疗问答数据、超2000万多语种医学文献资源、超2亿用户每日医疗类搜索数据、超5亿权威健康科普内容……这些海量的医疗训练数据,加上反馈强化学习机制,确保了灵医大模型给出的每一条回答都能有迹可循。
从技术、风险到产业,这才是市场真正需要的医疗大模型产品。
在百度的发布会上,百度大健康事业群AI产业部总经理刘军伟表示,医疗行业大模型有三个必备条件:第一、优质中文通用大模型底座;第二、万卡算力与工具链保障;第三、医疗行业深度积累。
这一观点与良医不谋而合,但更值得一提的是,就在19日,百度发布了医疗大模型产品——灵医大模型。
据了解,灵医大模型定位为产业级医疗大模型,产业二字主要体现在三个方面:
1. 专业赋能,可将灵医大模型当做一个【运营助手】。例如药企以及药店的运营助手,能够基于大模型获得更多的医药信息支持,快速获取关键的药品信息。
2. 效率倍增,可以请灵医大模型完成具体的任务。例如辅助医生生成病历,传统纯人工需要30分钟书写的病历,通过大模型技术,在保证专业、严谨的前提下,只需要秒级就可以生成,全面提高工作效率。
3. 体验提升,大模型能够为患者提供24小时的智能客服服务,随时有一个健康管家在身边,这将大幅提升患者体验。
从专业助手、到效率提高再到体验提升,灵医大模型到底有几分功力?
02
医疗大模型问题之二:
产业+大模型如何结合?
灵医大模型,从名字看,颇有深意。刘军伟介绍,所谓灵医,既寓意着灵性、智能,也谐音“0”和“1”,“作为一家科技驱动的公司,我们希望能用二进制的“0”和“1”创造出普惠百姓的大模型,用最简单的字符让医疗变的人人可及。
事实上,医疗大模型的核心有两个要素:既有大模型能力,又有产业融合。从核心看,百度灵医大模型想要实现产业和大模型的结合,也有几个前提条件:
首先,大模型的技术基础。
技术永远是第一位的。
自从ChatGPT走红后,百度是业内第一个推出大模型产品的大厂。基于文心大模型底座开发,灵医大模型是一款垂直行业大模型,结合多年医疗经验、千亿医疗知识和高质量文本语料,具备文档理解、病历生成和医疗问答等多方面AI原生能力,成功服务多个医疗产业客户。
那么,效果如何?
为验证效果,灵医大模型组织了严格的评测。
首先,定义评测指标,定义设计了安全性、正确性、逻辑性、理解力和完整性等五个维度的【测评指标】,来评价大模型的优劣;其次,构建评测数据集,结合【互联网线上高频健康咨询问题】、【药品问答】、【医考知识】和【诊疗建议】等方面,构建了【覆盖全部学科】的典型【评测数据集】;随后,组织评测实施,由灵医大模型同国内外大模型,分别作答。先后邀请了百余名、10年资历以上的三甲医生,对大模型的作答结果进行了盲评。
根据测评结果,灵医大模型测评的结果【多维度领先同类】,尤其是在安全性、逻辑性和理解力方面,取得了大幅领先,也表现出优异的准确性和稳定性。
其次,医疗领域的基础。
从根源看,目前业务整体包括互联网健康、智慧医疗、药企服务等业务板块,拥有百度健康、灵医智惠、GBI三大品牌。
百度健康是百度自身孵化和打造的健康管理平台,日均服务医疗健康用户群体超1亿,满足超过日均2亿次精准医疗健康相关搜索,业务覆盖健康科普服务、在线问诊服务、健康商城服务、互联网医院服务以及数字专病联盟等五大场景。
这一产业背景,使得灵医大模型拥有更多产业的数据内容做支撑。但这还不够。
为了确保医疗产业的深入,灵医大模型打造了三个方法论——重循证、多层次、全链条。
1. 重循证:
灵医大模型打造了300万+例多模态影像数据,5亿+条健康科普内容,70万+临床试验研究信息,保证有理有据,不胡乱生成信息。通过数据+技术的结合,最终保障生成内容准确可靠,有理有据。
2. 多层次:
目前,灵医大模型打造了三层服务架构,【模型层、能力层和应用层】,满足客户和伙伴多样化的需要。
比如在模型层:推出了千亿级参数、以公有云方式服务的【旗舰版】,面向医院客户或者对私有数据较为重视的客户提供的模型服务,以私有化方式部署的【Lite版】,针对自有高质量数据客户的【定制版】。
在能力层:主要以【API或AI插件】的方式提供服务。
在应用层:主要为患者、医院、企业等【终端用户】提供AI原生应用,打造了灵医Bot产品,目前聚焦在智能健康管家、智能医生助手、智能企业服务三大方向。
3. 全链条:
作为一个产业级的大模型,服务场景必须要覆盖整个大健康产业链,而不只是单一的场景,既要包括公立医院、科研机构,也包括药械企业、互联网医院平台等全产业链。
目前,灵医大模型为已建立合作的客户提供更为优质的内容服务,这些客户包括800+医院、4000+基层医疗机构、30万名医生、数亿患者、以及超过2000家的药企。
通过大批量数据的训练,不断地产品迭代,基于百度健康产业背景,百度灵医大模型得以发布。
再次,数据和行业服务能力相结合。
大模型产品要跑通,需要不断进行外部训练,将数据和行业服务能力融合。
良医财经获悉,灵医智惠基于百度AI技术全栈赋能,孵化医疗AI中台、医疗知识中台和医疗数据中台,秉承“循证AI赋能大健康产业”的愿景,先后推出CDSS、IMR等行业领先型智慧化产品及解决方案,覆盖智慧临床、智慧管理,智慧服务三大场景。
可以说,从技术到能力,再到产业融合,灵医大模型的能力是毋庸置疑的,下一个问题是,如何落地?
03
医疗大模型问题之三:
商业化进展?
随着各类医疗大模型的加速迭代与演化,医疗大模型商业化前景有望进一步打开。例如,谷歌的Med-PaLM2、微软子公司Nuance的DAXExpress等医疗大模型已经在医疗领域得到应用,并取得了一定的商业化成果。
百度集团资深副总裁、百度大健康事业群总裁何明科在会上提到,灵医大模型其实很早就已经落地,今天仅仅是“补个官宣”。
这句话至关重要,国内的大模型产品很多,但是能落地的凤毛麟角。百度灵医大模型的发布,不仅官宣了产品,更带来了和固生堂等合作的案例。
早在今年7月,灵医大模型就已经和固生堂展开了合作。固生堂与灵医大模型的合作,核心就是从固生堂业务场景为出发,在中医病历生成、智能分导诊、预问诊、知识问答等多细分场景落地。
具体到患者端,为固生堂患者提供病情咨询、快速找医生、智能导科室、用药指导、智能客服等多种服务,7*24小时为患者解答就诊全流程中遇到的问题,提升医患沟通效率和患者体验感,增强患者粘性。
在医生端,大模型集辅助问诊、辅助诊断、智能开方、文献搜索、中医病案信息化管理等功能于一体,为医生提供临床诊疗和学术研究数字化赋能服务。
在临床诊疗上,固生堂与百度智慧医疗计划推出辅助诊疗设备,将传统中医诊疗服务中的“望、闻、问、切”与人工智能、大数据等技术相结合,把患者的脉搏跳动力度、舌苔情况等变成图形化、数据化,推动中医诊断标准化,提升看诊效率。
在学术研究上,固生堂中医大模型集成了大量国医大师的临床电子病历、病案信息以及名医知识图谱,医生可以在平台上进行文献检索、病案分析学习,基于真实世界临床数据研究和循证医学的临床路径研发,不断精进医术,提升科研学术能力,帮助医生实现职称晋升。
活动现场,固生堂分享了和灵医大模型的合作情况,据了解,固生堂利用灵医大模型提供的底层技术能力,重构了线上诊疗业务,并推出了面向患者的智能健康助手,24小时在线为患者提供精准的分导诊和智能客服服务,支持开放式的医患问答。根据最新调研数据,合作以来患者挂号体验满意度提升了12%,客服人员工作效率提升76%。
除了固生堂之外,灵医大模型还与零假设等达成合作,并已定向向公立医院、药械企业、互联网医院平台、连锁药房等200多家医疗机构开放体验。
通过落地实践,百度灵医大模型已经成功突破了三大“首个”:
1. 首个产业级医疗大模型。
2. 首个商业化落地医疗大模型。
3. 首个面向大健康上下游开放试用和测评的医疗大模型。
04
良医财经的思考:
大模型是用来用的,接受市场的检验
业内,曾有专业人士直言,“大模型好不好,不要吵,先看能不能落地。”
百度灵医大模型作为目前首个完成商业落地的医疗大模型产品,底子有了。而大模型产品归根究底,好不好用,还是基于技术支撑、数据辅助。背靠百度的技术能力和医疗赛道多年的深耕,面子也有了。
有底子,有面子,百度灵医大模型成型。
当然,这对于医疗行业而言,还仅仅是个起点。中国医疗大模型还有很长的路要走。
医疗行业的严肃性、实时性、数据敏感性、优质数据稀缺性、可解释性、复杂性等特质,让生成式人工智能在医疗场景的应用仍要跨越一堵高墙。
OpenAI创始人山姆·奥特曼曾警示道“短期内围绕AI的狂热太多了,这是短期过度炒作,但长期炒作不足。”
这也说明,大模型之路,不仅要坚持走,更要长期坚持走。多一点点务实,少一点点务虚。一步一个脚印,在实践实战中,不断打磨优化,最终让消费者用起来,让商业正循环起来。