
我做了一个 Ollama JSONL 批量推理工具,除了 Ollama 还支持 Deepseek 等 OpenAI Style 兼容 API mili100 • 8 天前 • 最后回复来自 mili100 | 2 |
有个大模型相关的副业想法,大家帮忙看看有没有需求 buwenhe • 9 天前 • 最后回复来自 coefuqin | 5 |
![]() |
个人电脑,适合跑哪个本地大模型? laijh • 9 天前 • 最后回复来自 mili100 | 21 |
![]() |
huggingface-cli hf_xet 插件经常报 dns error 是咋回事 guoguobaba • 16 天前 • 最后回复来自 coefuqin | 1 |
多卡部署 QWQ Q8 是否可行 PalWorld • 16 天前 • 最后回复来自 coefuqin | 3 |
![]() |
intel 显卡跑 Qwen3-14B-GGUF:Q8_0 abc0123xyz • 22 天前 • 最后回复来自 coefuqin | 6 |
![]() |
目前性价比最高的跑本地大模型显卡是? lemonTreeTop • 21 天前 • 最后回复来自 CoffeeY | 17 |
![]() |
学习大模型的显卡怎么选型 cuteshell • 29 天前 • 最后回复来自 coefuqin | 30 |
![]() |
求本地部署的 AI 推荐~ WessonC • 31 天前 • 最后回复来自 happybabys | 11 |
![]() |
本地部署视觉大模型,用于 OCR 中文文献+翻译,最好的模型是什么?
villivateur PRO |
21 |
![]() |
mac studio 跑大模型也就那样啊 guoguobaba • 44 天前 • 最后回复来自 fredweili | 26 |
本地 vllm 部署 Qwen2.5-7B-Instruct 在 stream 模式下 tool_calls 参数 JSON 字符串未正常闭合 BenchWidth • 47 天前 • 最后回复来自 BenchWidth | 2 |
![]() |
有没有能 mac 上直接跑的多语言翻译 LLM? idblife • 32 天前 • 最后回复来自 mili100 | 4 |
英语文本音频按句自动对齐的有推荐的吗? afkool • 55 天前 • 最后回复来自 barnetime | 8 |
![]() |
llama.cpp/ollama 对于类似 vllm tensor parallel 功能的支持。 coefuqin • 72 天前 • 最后回复来自 coefuqin | 4 |
本地 llm client kid1412621 • 75 天前 • 最后回复来自 kid1412621 | 5 |
![]() |
公司要搭建本地大模型,推荐配置。 Woolaman • 75 天前 • 最后回复来自 coefuqin | 10 |
![]() |
有在生产上跑私有化 DeepSeek 70B 大模型的吗?什么配置的机器支持?并发多少呢? yiyiniu • 75 天前 • 最后回复来自 coefuqin | 2 |
![]() |
跑 AI 大模型,到底是用 4090 魔改版好还是 Mac studio 好? kisshere • 78 天前 • 最后回复来自 egen | 9 |