使用MiniGPT-4进行与图片对话

admin•2025-09-17 06:53:55•网站建设•阅读24

环境部署 1.创建相关环境，安装依赖 git clone https:githubVision-CAIRMiniGPT-4.gitcd MiniGPT-4conda env create -f envi

环境部署

1.创建相关环境，安装依赖

git clone https://github/Vision-CAIR/MiniGPT-4.git
cd MiniGPT-4
conda env create -f environment.yml
conda activate minigpt4

2.配置Vicuna权重

参考vicuna权重配置过程，然后修改minigpt4.yaml配置文件,将其修改为vicuna所在的权重文件

minigpt4/configs/models/minigpt4.yaml修改第16行的路径为vicunna所在文件夹

  llama_model: "/path/to/vicuna/weights/"

3.准备Mini-GPT4的相关checkpoint

参考链接https://github/Vision-CAIR/MiniGPT-4/tree/main，然后修改配置文件

进行图片对话

核心代码

1.加载模型

from minigpt4.conversation.conversation import Chat, CONV_VISION
import argparse
from minigpt4.common.config import Config
from minigpt4.common.registry import registry

parser = argparse.ArgumentParser(description="Demo")
parser.add_argument("--cfg-path", default="eval_configs/minigpt4_eval.yaml", help="path to configuration file.")
parser.add_argument("--gpu-id", type=int, default=0, help="specify the gpu to load the model.")
parser.add_argument(
    "--options",
    nargs="+",
    help="override some settings in the used config, the key-value pair "
    "in xxx=yyy format will be merged into config file (deprecate), "
    "change to --cfg-options instead.",
)
args = parser.parse_args([])
print(args)

print('Initializing Chat')

cfg = Config(args)
model_config = cfg.model_cfg
model_config.device_8bit = args.gpu_id
model_cls = registry.get_model_class(model_config.arch)
model = model_cls.from_config(model_config).to('cuda:{}'.format(args.gpu_id))

vis_processor_cfg = cfg.datasets_cfg.cc_sbu_align.vis_processor.train
vis_processor = registry.get_processor_class(vis_processor_cfg.name).from_config(vis_processor_cfg)
chat = Chat(model, vis_processor, device='cuda:{}'.format(args.gpu_id))
print('Initialization Finished')

2.将图片转化为向量

chat_state = CONV_VISION.copy()
img_list = []
llm_message = chat.upload_img("/home/xs/图片/截图/cat.jpeg", chat_state, img_list)

[tensor([[[-7.0020e-01, -2.2832e+00, -2.7754e+00,  ...,  1.5625e+00,
           -1.1436e+00,  8.3496e-01],
          [ 3.0430e+00,  1.1338e+00, -2.1106e-01,  ...,  1.9983e-01,
           -5.9375e+00, -6.4258e-01],
          [ 3.1113e+00, -4.3320e+00, -2.0950e-02,  ..., -1.3037e+00,
           -9.2578e-01, -9.8145e-01],
          ...,
          [-5.4375e+00,  1.7754e+00,  5.2383e+00,  ...,  1.7041e+00,
            9.7266e+00,  6.5088e-01],
          [ 1.7158e+00,  2.9531e+00,  2.4551e+00,  ...,  3.8071e-03,
           -2.0273e+00,  3.0225e-01],
          [ 6.7344e+00, -3.2446e-01, -4.3555e-01,  ...,  2.2285e+00,
            3.5000e+00, -1.6357e+00]]], device='cuda:0', dtype=torch.float16,
        grad_fn=<ViewBackward0>)]

3.输入问题和模型对话

chat.ask("这张图表示了什么内容", chat_state)

chat.answer(conv=chat_state,
img_list=img_list,
num_beams=1,
temperature=0.8,
max_new_tokens=300,
max_length=2000)[0]

'This image shows a black cat with green eyes looking directly at the camera.'

发布者：admin，转转请注明出处：http://www.yc00.com/web/1754605743a5181563.html

图片 MiniGPT

admin

网站建设
荣耀手机无法adb，但设置连接文件可以看到图片
各种硬件软件配置都没用，甚至去下载了华为手机助手其实是要打开电脑上的手机，安装荣耀手机助手…有毒再次碰到这个情况，但没有出现安装荣耀手机助理的安装提示&#xf
admin
6月前
460
网站建设
解决Word文档拼接图片后产生空白页的问题
解决Word文档拼接图片后产生空白页的问题我理解您的问题了。即使修改了分页逻辑，Word文档仍然会产生空白页。这是因为Word在处理图片和分页时有一些特殊行为。下面我将提供一个更完善的解决方案&#xff0c
admin
3月前
320
网站建设
新手使用ComfyUI图片生成遇到的问题及解决办法总结
1、打开界面后，运行按钮如果没有，是浏览器缩放比例问题，最好把运行按钮移动到上边框，它会吸附上去。 2、从huggingface或hf-mirror下
admin
1月前
310
网站建设
关于解决web工程在eclipse内置浏览器能显示图片，在外置浏览器不能显示的问题。
今天下午在学习前端的一些基础，到了把图片导入网页的章节，我发现在eclipse内置的浏览器能够完美的显示，只要你把路径写好了就行。如img alt"显示错误&qu
admin
1月前
190
网站建设
python提取图片特征并保存文件，匹配图片
方案一:采用sift算法提取特征并保存，用最近邻算法匹配最合适的图片1.提取特征值并保存.npy文件, feature.pyimport cv2import numpy as npfrom os import walk
admin
1月前
220
网站建设
Win7 Windows照片查看器无法显示此图片，因为计算机上的可用内存可能不足
近段时间发现桌面某些图片用 Windows照片查看器无法打开，就记录了一下，发现用其他工具就能打开，应该不是系统的问题，有的说是内存占用的问题&
admin
1月前
180
网站建设
chatgpt赋能python：Python图片合成：快速合成图片的最佳选择
Python图片合成：快速合成图片的最佳选择图片合成是数字图像处理领域的一项关键技术。在很多场景下，我们需要把多个图片合成成一个整体，以达到更好的效果。Python是一种强大而灵活的编程语言，因此也成为了许多开发者进行图片合成的首选工具
admin
1月前
170
网站建设
chatgpt赋能python：Python如何生成图片
Python如何生成图片 Python是一种强大的编程语言，不仅可以处理数据和数字计算，还可以生成和处理图像。在本文中，我们将探讨如何使用Python生成图像&
admin
1月前
170
网站建设
如何拿出app中的图片资源-android
我们经常看到一个app的ui设计很漂亮，想要拿到它的图片资源，那么我们该怎么拿呢？实际上非常简单，本文说的是安卓手机的方法，ios
admin
1月前
200
网站建设
重大发现！ChatGPT 4o惊天bug！输入conversation编码居然生成图片？
大家好，最近在调教GPT时突然发现了一个bug，极其逆天众所周知，gpt会保存每一个conversation，其中这个conversation会有一个
admin
1月前
250
网站建设
【大模型】ChatGPT 高效处理图片技巧使用详解
目录一、前言二、ChatGPT 4 图片处理介绍 2.1 ChatGPT 4 图片处理概述 2.1.1 图像识别与分类 2.1.2 图像搜索 2.1.3 图像生成 2.1.4 多模态理解 2.1.5 细粒度图像识别 2.
admin
1月前
130
网站建设
AnimateDiff：一款强大的制作丝滑动画视频插件，轻松让你的图片动起来
得益于StableDiffusion的开源，目前很多开发者推出了基于SD生成动画和视频的应用技术和扩展插件，在众多的技术中，AnimateDiff插件以“效果丝滑、稳定、无闪
admin
1月前
190
网站建设
怎么用图片翻译器日文翻译？小白试试这些翻译软件
你是否还在为看不懂的日语漫画而烦恼？是否还在焦急等待翻译组的更新？别担心，现在市面上有许多翻译软件和工具，只需对准那些看不懂的日语内容拍张照片&
admin
1月前
300
网站建设
图片隐写LSB隐写
PNG图片隐写LSB隐写LSB(英文 least significant bit)即最低有效位。LSB加密是信息隐藏中最基本的方法。由于人们识别声音或图片的能力有限，因此我们稍微改动信息的某一位是不会影响我们识别声音或
admin
1月前
220
网站建设
html中图片下间隙问题的解决方法
图片下间隙产生原因及解决方法：产生原因： 图片默认是文字，而文字默认与基线对齐。解决方法：1.设置父元素字体大小为0 font-size:0;&
admin
1月前
270
网站建设
手机误删图片怎么办？2个照片恢复大师来帮忙，轻松找回
手机照片早已成为我们日常生活中的一部分，记录着欢笑、泪水等各种瞬间。但有时候，因为各种原因，它们会突然消失，让人痛心疾首。照片恢复有哪些方法呢&
admin
1月前
230
网站建设
为什么html中图片显示不出来,网页图片不显示怎么回事？网页图片不显示的解决方法...
在网页上有文字和图片组成一些文章、新闻，如果出现网页图片不显示的情况，就会影响我们的使用感受。可能有些不熟悉电脑的用户不知道怎么处理这种情况，所以今天本文为大家整理的就是网页
admin
1月前
230
网站建设
Photoshop拼接全景图片，720云预览
Photoshop拼接全景图片，720云预览一、拍摄照片二、Photoshop拼接照片 1.导入图片到Photoshop 2.Photoshop对全景图片进行修改及导出三、720云预览点我查看成果一、拍摄照片照片要求：拍摄人站在
admin
1月前
170
网站建设
PhotoShop修改图片颜色的两种方法
PhotoShop修改图片颜色的两种方法—————————————————————————1. 使用“图像——调整——替换颜色”修改。先用取色器吸取要替换的颜色，并调整容差到合适的值。然后选择目标颜色&#x
admin
1月前
210
网站建设
Java itextpdf7将HTML转PDF解决图片或中文不显示（LinuxWindows通用版本）
在springboot项目的resource目录下新建一个文件fonts用于存放字体文件simsun.ttc我的系统是windows10，该字体文件在windows目录下：C:WindowsF
admin
1月前
220

发表回复

评论列表（0条）

暂无评论

使用MiniGPT-4进行与图片对话

环境部署

1.创建相关环境，安装依赖

2.配置Vicuna权重

3.准备Mini-GPT4的相关checkpoint

进行图片对话

核心代码

1.加载模型

2.将图片转化为向量

3.输入问题和模型对话

发表回复

评论列表（0条）

联系我们

400-800-8888

使用MiniGPT-4进行与图片对话

环境部署

1.创建相关环境，安装依赖

2.配置Vicuna权重

3.准备Mini-GPT4的相关checkpoint

进行图片对话

核心代码

1.加载模型

2.将图片转化为向量

3.输入问题和模型对话

相关推荐

发表回复

评论列表（0条）

联系我们

400-800-8888