谷歌推出 MedGemma AI 模型:医疗图像与文本分析的革命性工具
在刚刚结束的2025年 I/O 开发者大会上,谷歌宣布开源全新医疗 AI 模型 ——MedGemma。这款基于 Gemma3架构的模型专为医疗领域设计,具备强大的多模态图像和文本理解能力,旨在提升医疗诊断与治疗效率。
MedGemma 提供两种配置选项,分别为4B 和27B 参数模型。4B 参数模型主要用于医疗图像的分类和解读,能够生成详细的诊断报告或回答与图像相关的问题;而27B 参数模型则专注于处理临床文本,特别适合于患者分诊和决策辅助。这意味着,医生可以更快地获得有关患者病情的有价值信息,从而更有效地制定治疗方案。
其中,4B 模型的图像编码器采用了 SigLIP 技术,预训练数据涵盖了胸部 X 光、皮肤病学、眼科及组织病理学等多个领域的图像,使得其在处理复杂医疗图像时表现出色。相比之下,27B 模型则以270亿参数为基础,专注于深度理解医疗文本,为临床推理提供支持,帮助医务人员更快速地进行决策。
更为灵活的是,开发者可以选择在本地运行这些模型进行实验,或者通过谷歌云的 Vertex AI 平台将其部署为 HTTPS 端点,方便进行大规模应用。谷歌还提供了 Colab 笔记本等丰富的资源,帮助开发者进行模型的微调和集成。
此外,谷歌鼓励开发者针对特定的使用场景对模型进行验证和微调,并提供了相关指导和工具,支持开发者在适配过程中使用提示工程、上下文学习及 LoRA 等方法进行高效的参数微调。这使得 MedGemma 不仅是一款先进的 AI 工具,更是开发者和医务人员在日常工作中提升效率的重要助手。
MedGemma 的推出标志着医疗 AI 领域的又一重大进展,为未来的医疗实践带来了无限可能。
相关文章
苹果公司近日宣布,将向第三方开发者开放其人工智能模型,旨在激发新应用的创造力,并提升其设备的吸引力。知情人士透露,这一计划将在6月9日的全球开发者大会(WWDC)上正式发布...
2025-05-21 357 A I 资讯
近期,谷歌 DeepMind 团队与约翰・开普勒林茨大学 LIT AI 实验室合作,开展了一项关于人工智能语言模型的新研究。他们采用了强化学习微调(RLFT)技术,旨在提升语言模型的决策能力...
2025-05-20 938 A I 资讯
谷歌旗下研究工具NotebookLM迎来重大更新,计划推出名为“Sparks”(火花)的1-3分钟视频概览功能,其中10%内容由AI生成。这一创新将进一步整合Gemini2.5 chatbot和Deep Research报告功能...
2025-05-19 323 A I 资讯
根据最新数据显示,OpenAI 的人工智能(AI)工具在过去两个月内的网络流量激增,显示出其在市场上的强大优势。数据显示,OpenAI 的 ChatGPT 及其他 API 网站的日均访问量从三月底的1.5亿上升至5月9日的1.9...
2025-05-16 229 A I 资讯
最近,谷歌官方确认将在 Windows10和 Windows11平台的 Chrome 浏览器中引入新功能 ——Gemini AI 助手。这一消息源自于一份在谷歌反垄断审判中曝光的幻灯片,证实了早前的传言...
2025-05-15 845 A I 资讯