Ollama 本地运行 Llama 2、Mistral、Gemma 和其他大型语言模型
Ollama 是一个开源的大型语言模型服务,提供了类似 OpenAI 的 API 接口和聊天界面,可以非常方便地部署最新版本的 GPT 模型并通过接口使用。支持热加载模型文件,无需重新启动即可切换不同的模型。
快速开始
进入 容器 列表,找到 Ollama 容器,点击进入终端运行并与 Llama 2 聊天:
ollama run llama2
模型库
Ollama 支持 ollama.com/library 上提供的一系列模型
以下是一些可以下载的示例模型:
Model | Parameters | Size | Download |
---|---|---|---|
Llama 2 | 7B | 3.8GB | ollama run llama2 |
Mistral | 7B | 4.1GB | ollama run mistral |
Dolphin Phi | 2.7B | 1.6GB | ollama run dolphin-phi |
Phi-2 | 2.7B | 1.7GB | ollama run phi |
Neural Chat | 7B | 4.1GB | ollama run neural-chat |
Starling | 7B | 4.1GB | ollama run starling-lm |
Code Llama | 7B | 3.8GB | ollama run codellama |
Llama 2 Uncensored | 7B | 3.8GB | ollama run llama2-uncensored |
Llama 2 13B | 13B | 7.3GB | ollama run llama2:13b |
Llama 2 70B | 70B | 39GB | ollama run llama2:70b |
Orca Mini | 3B | 1.9GB | ollama run orca-mini |
Vicuna | 7B | 3.8GB | ollama run vicuna |
LLaVA | 7B | 4.5GB | ollama run llava |
Gemma | 2B | 1.4GB | ollama run gemma:2b |
Gemma | 7B | 4.8GB | ollama run gemma:7b |
注意:您应该至少有 8 GB 可用 RAM 来运行 7B 型号,16 GB 来运行 13B 型号,32 GB 来运行 33B 型号。
-
Lobe Chat免费自部署的AI聊天平台
Lobe Chat是一个开源的、可完全自托管的AI聊天平台,它完全打通了各种模型接入的壁垒,让你能用上市面上几乎所有主流大模型。包括Claude、ChatGPT、Gemini等等,甚至还能接入本地模型
-
DeepSeek服务器“裸奔”互联网现漏洞 专家提醒:立即修改配置
连日来,伴随DeepSeek大模型在各领域的迅速流行,越来越多的公司和个人选择将该开源大模型私有化部署或本地部署。值得一提的是,进行此类部署的主流方式之一是使用开源大型语言模型服务工具“Ollama”
-
国产大模型deepseek-R1本地部署手册
近期deepseek多次冲上热搜,又是多模态支持,又是开源发布R1模型,最近还受到了网络攻击。这篇文章介绍下如何快速部署deepseek-R1,本地访问,因为目前提供了最低7B数据集的模型。部署方案
关注公众号:拾黑(shiheibook)了解更多
赞助链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

随时掌握互联网精彩
- 日元对人民币汇率2025年2月5日
- SelectDB基于Apache Doris开发的新一代实时数据仓库
- paint-board:趣味性艺术画板
- OpenAI 开发者大会放大招,AI 时代的 App Store 来了!
- 应该重估名创优品吗?|热点关注
- 中小企业发展:要想高质量,必先数字化
- 首页瞬间清爽简洁,支付宝关闭活动推荐
- 藏在啤酒里的故事?点击获取你的专属能量瓶
- 【本周小结】中国广电启动5G核心网集采;运营商10月成绩单;美国商务部将12家中国企业列入实体名单
- 任天堂推出OLED升级版Switch;中国游泳队公布东京奥运名单;京东战投三年来第三次更换负责人|Do早报
- 又一零售巨头瞄准“移动支付”!
- 美国大西洋理事会发布《跨大西洋国家的中国战略重点》报告