【VLLM】open-webui部署模型全流程

admin•2025-09-17 03:27:06•网站建设•阅读19

目录前言一、租用服务器到服务器连接VScode全流程（可选）二、下载模型到本地服务器 2.1 进入魔塔社区官网 2.2 选择下载模型 2.3 执行下载三、部署VLLM 3.1 参考vllm官网文档 3.2 查看

前言

一、租用服务器到服务器连接VScode全流程（可选）

二、下载模型到本地服务器

2.1 进入魔塔社区官网

2.2 选择下载模型

2.3 执行下载

三、部署VLLM

3.1 参考vllm官网文档

3.2 查看硬件要求

3.3 安装vLLM框架

3.4 启动模型服务

方法1：直接启动下载的本地模型

方法2：启动微调后的模型

3.5 调用模型进行对话（可选）

四、安装open-webui流程

4.1 创建虚拟环境

4.2 安装并运行open-webui

4.3 启动后效果

五、总结

前言

本章主要讲述的是VLLM的部署在open-webui上部署模型的全流程，效果如下：

一、租用服务器到服务器连接VScode全流程（可选）

AutoDL连接VSCode运行深度学习项目的全流程教程：
【云端深度学习训练与部署平台】AutoDL连接VSCode运行深度学习项目的全流程-CSDN博客

AutoDL官网地址：AutoDL算力云 | 弹性、好用、省钱。租GPU就上AutoDL

这里介绍了 AutoDL 平台的使用方法，从平台简介、服务器租用、VSCode远程连接，到高级GPU监控工具的安装，适合中文开发者快速上手深度学习任务。

▲如果说电脑硬件配置太低（如：显存低于24GB），请根据【AutoDL连接VSCode运行深度学习项目的全流程教程】，通过云服务器来进行部署运行；

▲如果说电脑硬件配置足够高（如：显存24GB及以上），或者说有自己的服务器，可以直接跳过这一步；

二、下载模型到本地服务器

说明：如果本地已经下载了模型，可以直接到【三、部署VLLM】

2.1 进入魔塔社区官网

魔塔社区官网地址：ModelScope 魔搭社区

2.2 选择下载模型

这里根据业务场景选择合适的模型类型和模型参数大小即可。

这里用SDK的下载方式下载模型：将代码复制到服务器中

2.3 执行下载

▲在服务器的数据盘中（autodl-tmp下 ）创建一个.py文件（如download_model.py）;

▲将复制的SDK下载代码复制到【download_model.py】 ;

▲修改存放路径为数据盘：cache_dir="/root/autodl-tmp"；

#模型下载
from modelscope import snapshot_download
model_dir = snapshot_download('Qwen/Qwen3-0.6B',cache_dir="/root/autodl-tmp")

cache_dir="/root/autodl-tmp"表示存放的路径，/root/autodl-tmp为数据盘路径；

#出发路径：服务器根目录

#查看当前位置
ls

#进入到数据盘路径
cd autodl-tmp/

#运行下载脚本download.py
python download.py

【注意】

▲下载完后，提示成功的信息可能会夹在进度条的中间，按下【回车】即可继续操作

▲验证模型文件是否下载完整？

这种情况主要出现在下载大参数模型时（如7B及以上参数模型），下载中途可能会因为网络问题导致文件下载失败从而终止。这种情况只需再次执行下载命令（如:python download.py）,即可继续下载，中断反复执行即可，直到出现下载成功的提示信息即可。

▲模型资源重复

在下载模型时，有的模型文件可能会出现2个模型资源文件夹，不过这都不影响，不管用哪一份都可以；

三、部署VLLM

3.1 参考vllm官网文档

VllM文档参考地址：vLLM - vLLM 文档

因为VLLM的更新快，所以在部署过程中以官方文档为准

3.2 查看硬件要求

确保自己电脑硬件要求是否符合

发布者：admin，转转请注明出处：http://www.yc00.com/web/1754774871a5200421.html

模型流程 vllm Open WebUI

admin

网站建设
Kubernetes 网络模型架构详解：组件通信、网络入口与出口
个人名片🎓作者简介：java领域优质创作者 🌐个人主页：码农阿豪 📞工作室：新空间代码工作室&am
admin
1月前
210
网站建设
小程序授权登录流程及操作
小程序授权登录流程的简单分享前言一、判断有没有授权二、授权页面进行授权三、登录流程图总结前言做小程序最必不可少也比较复杂的就是授权登录啥的了。不同的项目会有不同的写法，这里把我之前的一种写法分享一下&#xf
admin
1月前
210
网站建设
短剧推广秘籍大公开：从0到1的全流程指南
一、平台授权方式推文和短剧推广的第一步是要获得要推广小说及短剧的授权，授权方式一般有第三方平台授权和官方平台授权两种方式，网络上有些人会给一些获取推广授权的小程序，这些一般
admin
1月前
160
网站建设
【人工智能】【好物推荐】大模型统一接入路由器OpenRouter，为开发者提供了一个便捷的平台，通过统一接口快速接入多种大模型，降低了开发成本和难度。
一、OpenRouter简介 OpenRouter是一个大模型API路由器，旨在将各种AI模型和服务集成到一个统一的接口中，简化模型的集成和部署过程。OpenRouter为开发者提供了一个便捷的平台，通过统一接口快速接入多种大模型，降低了
admin
1月前
210
网站建设
告别繁琐搭建！Docsify轻松实现文档网站快速上线与远程访问实战流程
文章目录前言1. 本地部署Docsify2. 使用Docsify搭建个人博客3. 安装Cpolar内网穿透工具4. 配置公网地址5. 配置固定公网地址前言在数字化时代，内容创作变得愈发重要，但
admin
1月前
180
网站建设
linux查看磁盘对应槽位,一种linux系统硬盘槽位识别方法与流程
技术领域本发明涉及计算机技术领域，尤具体地说是一种实用性强、linux系统硬盘槽位识别方法。背景技术：近年来，随着技术的迅速发展，linux系统的
admin
1月前
150
网站建设
大模型初学者指南：笔记本电脑上用 ollama 运行大模型！
之前国外有一初学者小哥在Google Colab（A100 40G）利用DPO微调Mistral 7B，微调后的模型在基准测试中取得不错的成绩，从那时起
admin
1月前
210
网站建设
大模型瓶颈之——大模型长文本处理问题以及解决方案
“大模型长文本处理，是大模型性能评价标准之一” 正如大家所知道的那样，大模型上下文窗口是有限制的，而上下文窗口大小是大模型的评价标准之一，越强大的大模
admin
1月前
150
网站建设
20.5 2025大模型显卡选型终极指南：天梯榜+闭坑攻略，这样选省50%预算！
2025大模型显卡选型终极指南：天梯榜+闭坑攻略，这样选省50%预算！大模型核心硬件选型指南：显卡性能天梯榜关键词：大模型训练显卡选型、Tensor Core性能、显存带宽、FP16算力、性价比分析显卡选型三维评估体系大模型训
admin
1月前
170
网站建设
2025⼤模型训练与推理硬件采购及配置指南
深度学习&⼤模型训练与推理——硬件配置指南 content Part 1.读懂GPU性能：GPU性能核⼼参数介绍Part 2.现阶段主流显卡（从2080到H100）性能分析Part 3.各类⼤模型推理、微调、预训练所需显存
admin
1月前
210
网站建设
51c大模型~合集106
我自己的原文哦~ https:blog.51ctowhaosoft13115290 #GPT-5、 Opus 3.5为何迟迟不发新猜想：已诞生，被蒸馏成小模型来卖「从现在开始&a
admin
1月前
210
网站建设
LLMs：《BLOOM: A 176B-Parameter Open-Access Multilingual Language Model》翻译与解读
LLMs：《BLOOM: A 176B-Parameter Open-Access Multilingual Language Model》翻译与解读导读：BLOOM(BigScience La
admin
1月前
240
网站建设
文生图中从扩散模型到流匹配的演变：从SDXL到Stable Diffusion3(含Flow Matching和Rectified Flow的详解)
前言在此之前，本博客内已经介绍了扩散模型、SD等相关的原理及其对应的详细推导很明显，OpenAI的首个视频生成模型sora极大程度的提高了大家对文生图、文生视频的热情&#xff0c
admin
1月前
170
网站建设
Elasticsearch：使用 Open AI 和 Langchain 的 RAG - Retrieval Augmented Generation （一）
最近看了一个同事的几个视频。他总结的很好。在使用 LangChain 时，根据 LangChain 的官方文档 https:integrations.langchainvectorstores&#xff0
admin
1月前
150
网站建设
liveweb播放器通过播放多路H.265,RTSP实时视频效果及测试流程
liveweb播放器是深圳好游科技开发的一款超低延时(150-200毫秒)、秒启动、无插件web实时视频播放器，可支持H.264H.265的多路视频实时播放，性能稳定、播放流畅。支持协议&a
admin
1月前
200
网站建设
目前比较好用的AI大模型创作工具地址合集及亮点应用
AI背景：2024年，可以说是AI人工智能大模型爆发的元年，各类AI模型应用层出不穷，令人应接不暇。从前年底国外OpenAI公司的ChatGPT大模型推
admin
1月前
270
网站建设
联合15家国内顶尖大模型！360这个AI助手或超越GPT4o？
相关资讯2024.08.01，在ISC.AI2024人工智能峰会上，360创始人周鸿祎现场宣布和国内15家大模型企业达成合作，共同打造通用的AI助手，并
admin
1月前
260
网站建设
11项指标击败GPT-4o！360攒局让16家大模型联手作战，组成最强“六边形战士”
克雷西发自凹非寺量子位 | 公众号 QbitAI终于，国产大模型能在综合能力上也能与GPT-4o一决雌雄了。在12项指标的测试中，这个模型有11项都超过了GPT-4o，综
admin
1月前
190
网站建设
三个大模型组队挑战o1，实测360多模型协作干掉提示词工程
克雷西发自凹非寺量子位 | 公众号 QbitAIOpenAI o1的横空出世，开启了大模型演化的新范式——Inference law（推理定律）。正如英伟达AI科学家Ji
admin
1月前
190
网站建设
2020抖音小店入驻流程
原文链接：https:blogswust15574.html 一、访问入驻后台使用电脑浏览器打开网址https:sso.douyinlogin?servicehttps:fxg.jinritema
admin
1月前
160

发表回复

评论列表（0条）

暂无评论

【VLLM】open-webui部署模型全流程