HuggingFace推出iOS应用 无需联网即可使用本地视觉模型描述用户周围的内容
人工智能初创公司 HuggingFace 日前在 Apple App Store 推出名为 HuggingSnap 的新应用,该应用的主要功能是调用 iPhone 摄像头查看周围的事物,用户可以进行任意提问例如识别物体、解释场景、阅读文本等。

该应用最大的特点就是不需要将数据发送到云端,HuggingSnap 应用使用 HuggingFace 内部的视觉模型 smolvlm2 来实时分析手机看到的内容。
用人工智能配合摄像头进行实时物理识别并不是新鲜事,ChatGPT 等应用已经提供类似功能,但 HuggingSnap 的特点在于完全基于本地 AI 模型进行计算。
HuggingFace 表示:HuggingSnap 可以离线工作、节省电量并在手机上处理所有数据,该应用在购物、旅行、学习或只是探索周围环境时非常有用,HuggingSnap 为您的 iPhone 带来智能视觉 AI。
实际上该应用的用途非常广泛,例如帮助儿童了解周围的物体、帮助爱好者了解花草树木、帮助视觉障碍者播报和描述周围的物体等等。
只是 smolvlm2 模型在本地运行那么必然对算力有要求,HuggingFace 并未提到机型限制,或许是这个模型经过优化已经可以在 iPhone 上运行。
另外该应用不仅支持在 iOS 18 + 系统上运行,还支持在 macOS 15.0 + 系统上运行,但仅限于搭载 Apple M 芯片的 Mac,不支持搭载英特尔 CPU 的 Mac,最后还支持 visionOS 2.0+。
-
解决AI智能体可能会记住或泄露用户密码:1Password新机制要求填充密码时人工确认
目前各大 AI 工具都在开发基于浏览器的智能体操作,这些 AI 代理 / 智能体可以直接浏览网页、预定门票甚至创建音乐播放列表,潜在的风险则是 AI 代理可能会记住用户提供的账号密码因此会在造成潜在的
-
沉浸式翻译拟禁止用户使用未认证第三方API引起众怒 现已火速删除公告
沉浸式翻译最初是个开源的双语对照翻译扩展程序,在 2023 年 11 月被收购后转向闭源不再开放源代码,原本的开源项目也被归档停止更新。从用户体验上说沉浸式翻译确实非常优秀,尤其是用户可以使用自定义
-
微软在Windows 11右键菜单中新增询问Copilot按钮可以调用AI查内容
微软日前通过发布新版 Copilot AI 应用在 Windows 11 右键菜单 (上下文菜单) 中增加新选项:询问 Copilot。这个新选项让本来就已经比较臃肿的右键菜单更加臃肿,或许还会增加右
关注公众号:拾黑(shiheibook)了解更多
赞助链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
关注网络尖刀微信公众号随时掌握互联网精彩
- 某网络安全公司的扩展程序被黑客攻击然后对用户投毒
- TouchSocket:一个功能强大且易于使用的 .NET 网络通信框架
- Spark远程控制与监控工具
- 加币兑换人民币汇率2023年8月19日
- ChatGPT会取代人类的工作吗?对这个问题,我们整理了20位大咖的看法
- 中国联通和中国电信深耕共建共享:为全球运营商分享中国方案
- 国产小芯片实现量产,并正式出货
- 编程中有没有遇到被自己蠢哭的 BUG;想学 go,有未来吗;如何保持持续学习的热情 |极客观点
- 一个不会画画的人,用 AI 生成的画作拿下了大赛第一,还不违规......
- 徐州疫情最新消息今天
- 混合办公接轨元宇宙?开启你对未来世界的新认知!
- 从中国制造到中国创造,这些企业做对了什么?



微信扫码关注公众号