以下是从数据、算力、模型三个方面对医药行业的研究: 数据数据整合与共享:医药行业数据来源广泛,包括临床诊疗数据、多组学数据、化合物数据等。例如,南京江北新区生物医药公共服务平台依托国家健康医疗大数据(东部)中心,实现了覆盖江苏省全省的公卫临床诊疗和20PB多组学数据的汇聚与应用。同时,联邦学习技术的应用也在打破数据孤岛,谷歌推出的联邦学习技术受到广泛关注,它可以在保护本地数据隐私的前提下,实现跨设备、跨孤岛的数据学习。数据质量与安全:医药数据的质量和安全至关重要。南京江北新区生物医药公共服务平台通过建立数据安全共享管理规范和先行先试转化应用流程,采用安全认证、权限控制、数据加密/匿名化等方式,保障数据存储与应用安全。数据驱动研发创新:数据在药物研发中发挥着关键作用,英国“OpenBind”联盟利用突破性实验技术,生成全球最大的药物与蛋白质相互作用数据集合,将为药物研发提供更丰富的数据支持。 算力算力的重要性:算力是AI应用运行的前提,在医药行业中,基因测序、药物筛选和临床试验数据分析等都需要强大的算力支持。例如,一个人的全基因组测序数据高达300GB,借助IDC的高性能计算集群,完成一个人的全基因组测序时间从过去的3个月缩短至1天,成本也降至1000美元以内。算力的提供与提升:全球科技巨头如亚马逊、谷歌、微软、阿里等有充足的云端算力可供药企选择。2025年8月22日,英伟达推出NVIDIA Spectrum - X GS以太网,可将分布式数据中心组合成统一的千兆级AI超级工厂,进一步提升全球算力量级。算力在医药行业的应用案例:“悟空智算”算力中心已建成6500P人工智能算力规模,辅助开发在研药物10余个,推动质量控制与生产效率提升30%以上,为药企提供从药物试验设计到数据分析预测的全流程支撑。 模型模型的关键作用:在算力与数据问题得到逐步解决后,模型成为制胜关键。生成式AI药企需要构建随时间增长的领先模型壁垒,与大药企合作AI研发过程中的数据与模型构建正反馈飞轮,将成为领先企业的护城河。医药行业中的模型应用:华为云盘古药物分子大模型与中科院上海药物所合作,将先导药研发周期从数年缩短至1个月,研发成本降低70%。清华BioMedGPT系列模型是全球首个开源可商用多模态生物医药模型,30分钟可完成全基因组关联分析,蛋白质3D结构预测误差<1.2Å,虚拟筛选化合物库效率提升100倍。模型的发展趋势:随着技术的不断进步,模型将不断优化和创新,更加注重可解释性和可靠性。例如,欧盟《人工智能法案》将使那些依赖黑箱模型、缺乏可解释性的AI药物发现系统出局,这就促使模型开发者更加注重模型的可解释性研发。
|
|