HuggingFace推出iOS应用 无需联网即可使用本地视觉模型描述用户周围的内容
人工智能初创公司 HuggingFace 日前在 Apple App Store 推出名为 HuggingSnap 的新应用,该应用的主要功能是调用 iPhone 摄像头查看周围的事物,用户可以进行任意提问例如识别物体、解释场景、阅读文本等。
该应用最大的特点就是不需要将数据发送到云端,HuggingSnap 应用使用 HuggingFace 内部的视觉模型 smolvlm2 来实时分析手机看到的内容。
用人工智能配合摄像头进行实时物理识别并不是新鲜事,ChatGPT 等应用已经提供类似功能,但 HuggingSnap 的特点在于完全基于本地 AI 模型进行计算。
HuggingFace 表示:HuggingSnap 可以离线工作、节省电量并在手机上处理所有数据,该应用在购物、旅行、学习或只是探索周围环境时非常有用,HuggingSnap 为您的 iPhone 带来智能视觉 AI。
实际上该应用的用途非常广泛,例如帮助儿童了解周围的物体、帮助爱好者了解花草树木、帮助视觉障碍者播报和描述周围的物体等等。
只是 smolvlm2 模型在本地运行那么必然对算力有要求,HuggingFace 并未提到机型限制,或许是这个模型经过优化已经可以在 iPhone 上运行。
另外该应用不仅支持在 iOS 18 + 系统上运行,还支持在 macOS 15.0 + 系统上运行,但仅限于搭载 Apple M 芯片的 Mac,不支持搭载英特尔 CPU 的 Mac,最后还支持 visionOS 2.0+。
-
Visual Studio Code市场出现10个恶意扩展 冒充AI帮助开发者编写代码实则挖矿
Visual Studio Code 是微软推出的开源免费代码编辑器,该代码编辑器还包含市场用来提供各种各样的扩展程序,这些扩展程序大部分是第三方开发者提供的因此也难免存在恶意扩展。Extension
-
黑客自称已窃取200万个OpenAI账户密码 尽管真实性较低但OpenAI已开始调查
在 BreachForums (转世版) 黑客论坛中,有使用俄语的黑客自称已窃取高达 200 万个 OpenAI 账户的访问凭证,这名黑客还按行业规矩向潜在买家提供包含电子邮件地址和密码的样本数据。不
-
谷歌相册使用SynthID技术为照片添加盲水印 标记用户使用AI生成或修改的照片
谷歌相册应用 (Google Photos) 很早就提供名为魔术修图的功能,该功能基于 AI 技术构建帮助用户删除图片中的某些元素然后生成新副本保存。现在魔术修图中的 Reimagine 工具可以更好
关注公众号:拾黑(shiheibook)了解更多
赞助链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

随时掌握互联网精彩
- Edge浏览器睡眠标签页立功:一年节省7万亿MB流量
- TextSeek – 跨平台电脑桌面全局文件搜索工具「Mac/Win」
- 卢布汇率人民币2023年7月13日
- 马斯克炮轰ChatGPT:创立使命是造福人类,但眼下目标改成先赚钱
- 工信部:制造业知识产权能力建设迈上新台阶,将制定“十四五”制造业知识产权行动计划
- 亿欧智库发布《2021年中国医药营销数字化研究报告》
- 欧盟修订《人工智能协调计划》
- 欧洲议会批准300亿欧元“连接欧洲设施”计划
- 高峰对话 | 主动破圈 or 倒逼破圈?产学研如何"跨界共创"?
- 高额报名费、高价锁位……“天价考位”引反思
- 【杂谈快报】工信部:不得误导、强迫用户办理或升级5G套餐
- Q4全球手机市场出货量排名巨变:苹果重返榜首,华为跌落第五