屠焘 发表于 2025-6-5 10:12:30

DeepSeek 多模态模型 Janus-Pro 本地部署

一、概述

Janus-Pro是DeepSeek最新开源的多模态模型,是一种新颖的自回归框架,统一了多模态理解和生成。通过将视觉编码解耦为独立的路径,同时仍然使用单一的、统一的变压器架构进行处理,该框架解决了先前方法的局限性。这种解耦不仅缓解了视觉编码器在理解和生成中的角色冲突,还增强了框架的灵活性。Janus-Pro 超过了以前的统一模型,并且匹配或超过了特定任务模型的性能。
代码链接:https://github.com/deepseek-ai/Janus
模型链接:https://modelscope.cn/collections/Janus-Pro-0f5e48f6b96047
体验页面:https://modelscope.cn/studios/AI-ModelScope/Janus-Pro-7B
 
二、虚拟环境

环境说明

本文使用WSL2运行的ubuntu系统来进行演示,参考链接:https://www.cnblogs.com/xiao987334176/p/18864140
创建虚拟环境

conda create --name vll-Janus-Pro-7B python=3.12.7 
激活虚拟环境,执行命令:
conda activate vll-Janus-Pro-7B 
查看CUDA版本,执行命令:
# nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2025 NVIDIA Corporation
Built on Wed_Jan_15_19:20:09_PST_2025
Cuda compilation tools, release 12.8, V12.8.61
Build cuda_12.8.r12.8/compiler.35404655_0三、安装Janus-Pro

硬件要求

显存至少8G以上,推荐16G
内存,至少16G以上,推荐32G
CPU,最低4核,推荐8核
硬盘,最好50G,推荐500G
 
以上条件,我已经满足了
显卡,RTX 5080,显存16G
内存,64G,DDR5
cpu,24核32线程
硬盘,2TB固态硬盘
安装

创建项目目录
mkdir vllm
cd vllm 
克隆代码
git clone https://github.com/deepseek-ai/Janus 
安装依赖包,注意:这里要手动安装pytorch,指定版本。
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu128安装其他依赖组件
pip3 install transformers attrdict einops timm 
下载模型
可以用modelscope下载,安装modelscope,命令如下:
pip install modelscope

modelscope download --model deepseek-ai/Janus-Pro-7B效果如下:
# modelscope download --model deepseek-ai/Janus-Pro-7BDownloading Model from https://www.modelscope.cn to directory: /root/.cache/modelscope/hub/models/deepseek-ai/Janus-Pro-7BDownloading : 100%|███████████████████████████████████████████████████| 1.42k/1.42k [00:00
页: [1]
查看完整版本: DeepSeek 多模态模型 Janus-Pro 本地部署