在2025年I/O开发者大会上,谷歌发布了开源模型MedGemma,专注于多模态医疗文本与图像理解。该模型基于Gemma 3架构,提供两种配置:4B参数的多模态模型擅长医疗图像分类和诊断报告生成,而27B参数的纯文本模型则专注于临床文本分析与决策辅助。
MedGemma 4B采用SigLIP图像编码器,覆盖胸部X光、皮肤病学等医疗图像数据;27B版本则针对临床推理和文本深度解析优化。开发者可通过本地实验或Google Cloud的Vertex AI部署模型,并利用Colab笔记本等工具进行微调。谷歌还提供了提示工程、LoRA等优化方法,支持开发者适配具体场景。