AI批量图生文
本软件为采用本地部署AI模型,实现图生文无限制使用,采用的模型为qwen2.5VL,目前国内开源视觉模型最强。支持低中高各个等级的电脑使用,CPU或GPU都可运行
应用场景:
电商原图生标题,电商主图生标题
文字识别,手写笔记,账单,收据,发票,电子文字图片等 文字提取
目标检测:识别图片中的目标物体,水印检测,侵权检测
模型参数有3B,7B, 32B 可选,以下是各模型大小的推荐电脑配置
| 模型规格 | BF16/FP16 完整显存 | INT8 量化显存 | INT4 量化显存 | 最低可用单卡 | 推荐单卡 |
|---|---|---|---|---|---|
| Qwen2.5-VL-0.5B | 3.5~4.5GB | 2.2~2.8GB | 1.5~2GB | 6GB(3060) | 8GB 显存卡 |
| Qwen2.5-VL-1.8B | 5.5~7GB | 3.5~4.5GB | 2.3~3GB | 8GB(3070) | 12GB 显存卡 |
| Qwen2.5-VL-3B | 8~10GB | 5~6.5GB | 3~4GB | 10GB(3060Ti) | 12GB(4070) |
| Qwen2.5-VL-7B | 18~22GB | 10~13GB | 7~9GB | 12GB(4070Ti)仅 4bit | 24GB(A10/4090) |
| Qwen2.5-VL-14B | 32~38GB | 18~22GB | 12~15GB | 24GB 双卡 TP | 48GB 单卡 / 2×24GB |
| Qwen2.5-VL-32B | 64~72GB | 34~40GB | 20~24GB | 24GB 双卡 TP (4bit) | 80GB A100/H100 |
| Qwen2.5-VL-72B | 135~150GB | 70~85GB | 38~45GB | 4×24GB 多卡分布式 | 2×80GB A100 |
软件包下载:软件包下载
通用教程
适配慕汐跨境
