ai - ollama 的基本使用方法

访问量: 39

refer to:
https://ollama.com/

1. 安装:
https://ollama.com/download

curl -fsSL https://ollama.com/install.sh | sh

2. 安装qvq 32b:
https://ollama.com/library/qwq

128G 32CORE的话,大概 2-3汉字/秒

3. ollama基本用法,跟docker一样。

ollama -h 查看帮助

ollama ps 查看运行的model

ollama list 查看保存的东西

ollama run qwq:latest    启动某个模型

ollama stop qwq:latest    停止某个模型

4. 会话相关

4.1 进入某个会话:  ollama run qwq

4.2 退出当前会话: /bye

4.3 保存当前会话: /save my_test

4.4 使用curl 触发会话:

curl http://localhost:11434/api/generate -d '{
"model": "qwq",
"prompt": "今天天气不错,挺风和日丽的。下一句是什么?",
"stream": false
}'

10. 硬件相关。

纯CPU环境,128G, 32C下,大概 6汉字/s

订阅/RSS Feed

Subscribe