您的位置: 首页> 新闻资讯> 苹果 FastVLM 模型开放试用：Mac 用户秒享“闪电级”视频字幕，生成速度较同类 AI 快 85 倍

苹果 FastVLM 模型开放试用：Mac 用户秒享“闪电级”视频字幕，生成速度较同类 AI 快 85 倍

时间：2025-09-02 11:36:01 来源：互联网

alixixi 9 月 2 日消息，科技媒体 9to5Mac 昨日（9 月 1 日）发布博文，报道称苹果公司在 Hugging Face 平台上，推出了 FastVLM 视觉语言模型的浏览器试用版。

alixixi注：FastVLM 以其“闪电般”的视频字幕生成速度著称，只要用户拥有搭载 Apple Silicon 芯片的 Mac 设备，即可轻松上手体验这一前沿技术。

FastVLM 模型的核心优势在于其卓越的速度和效率。该模型利用苹果自研的开源机器学习框架 MLX 进行优化，专为 Apple Silicon 芯片设计。与同类模型相比，FastVLM 模型体积仅为三分之一左右，不过在视频字幕生成速度上却能提升 85 倍。

苹果此次发布的 FastVLM-0.5B 轻量版，可在浏览器内直接加载运行。根据该媒体实测，在 16GB M2 Pro MacBook Pro 上，首次加载模型需数分钟，不过在启动后，便能精准描述画面中的人物、环境、表情及各种物体。

值得一提的是，该模型支持本地运行，所有数据均在设备端处理，无需上传至云端，从而保障了用户的数据隐私。

FastVLM 的本地运行能力及其低延迟特性，让其在可穿戴设备和辅助技术领域展现出巨大潜力。例如，在虚拟摄像头应用中，该工具能即时详细描述多场景内容，FastVLM 未来有望成为这些设备的核心技术，为用户提供更智能、更便捷的交互体验。

相关阅读：

《苹果发布 FastVLM 视觉语言模型，为新型智能眼镜等穿戴设备铺路》

参考

Hugging Face

上一篇：小米张国全：多功能音量调节、堆叠后台等开始评估设计方案，有些功能复杂排期时间稍长下一篇：苹果 AirPods Pro 3 耳机前瞻：首次引入体温监测，延后上线实时翻译

相关文章

相关应用

最近更新