Skip to content

Releases: Deep-Spark/DeepSparkInference

DeepSparkInference 25.12 Release

25 Dec 02:53
6b8ebab

Choose a tag to compare

DeepSparkInference 25.12

模型与算法

  • 新增了 15 个推理小模型示例,其中支持 IGIE 推理引擎的 9 个,支持 ixRT 推理引擎的 6 个。
  • 新增了 8 个大语言模型推理示例,其中 7 个使用 vLLM,1 个使用 Diffusers。
ixRT
DeepSort FastReID Transformer
YOLOF YOLOv12 YOLOv13
IGIE
EfficientNet-B7 FreeAnchor RegNet_X_800MF
RegNet_X_8GF PISA YOLOv8-N
YOLOv9 YOLOv10 YOLOv11
LLM
NVLM-D (vLLM) PaliGemma (vLLM) Phi-3 Vision (vLLM)
Pixtral (vLLM) Qwen3Moe (vLLM) Stable Diffusion 3 (Diffusers)
Step3-VL (vLLM) XLM-RoBERTa (vLLM)

修复更新

  • 新增了对模型推理的 batchsize 参数配置的支持,并在 CI 中添加相应测试 (#ID8SDF, #IDBGCP)
  • 新增了 vLLM 推理模型的 benchmark 脚本支持 (#ID8TTL)
  • 优化了 21 个推理小模型的 README 指导文档说明 (#IDBBZV)
  • 更新了 Conformer IGIE 和 BERT Large SQuAD ixRT 模型失效的链接 (#ID8KFK, #ID9RDW)
  • 修复了 CosyVoice2-0.5B 模型推理报错的问题 (#ID5Y84)
  • 修复了 Fuyu-8B 模型推理报错的问题 (#ID5Y8O)
  • 修复了 YOLOv8 ixRT 模型推理日志中的警告打印问题 (#IDC1OI)
  • 修复了 Conformer 模型解读异常问题 (#ID9RDQ)
  • 修复了 EfficientNet-B1 和 YOLOv4 模型 int8 推理精度异常的问题 (#ID912Z)
  • 修复了 ResNetV1d-50 和 RetinaFace ixRT 模型推理报错的问题 (#ID931D, #ID94XO)
  • 修复了 YOLO 系列模型在在 PyTorch 2.7 环境导出 ONNX 时的兼容报错问题 (#ID95LK)
  • 修复了 8 个推理小模型在 CI 上运行报错的问题 (#ID9DH4)
  • 修复了 YOLOv4 ixRT 模型量化 ONNX 报错的问题 (#IDA3BX)
  • 修复了 YOLOv10 ixRT 模型 dynamic shape 的问题(#IDAOW0)

版本关联

DeepSparkInference 25.12 对应天数软件栈 4.3.0 版本。

感谢以下社区贡献者

YoungPeng,anders,fhfang,郭寒冰,qiang.zhang,majorli6,honglyua。

DeepSparkInference 25.09 Release Notes

26 Sep 02:29
cbf1326

Choose a tag to compare

25.09 Release Notes

模型与算法

  • 新增了19个推理小模型示例,其中支持IGIE推理引擎的12个,支持ixRT推理引擎的7个。
  • 新增了11个大语言模型推理示例,涉及FastDeployLMDeployvLLM等框架。
ixRT
ATSS CLIP CSPResNeXt50
EfficientNet-B4 EfficientNet-B5 PAA
RetinaNet
IGIE
EfficientNet-B6 MNASNet1_3 Regnet_x_32gf
Regnet_x_400mf Regnet_y_3_2gf Regnet_y_32gf
RegNet_y_400mf SSD VGG13
VGG13_BN YOLOF YOLOv13
大模型
CosyVoice2-0.5B E5-V (vLLM) ERNIE-4.5-21B-A3B (FastDeploy)
ERNIE-4.5-300B-A47B (FastDeploy) GLM-4V (vLLM) InternLM3 (LMDeploy)
MiniCPM-o-2_6 (vLLM) Qwen-VL (vLLM) Qwen2-VL (vLLM)
Qwen2.5-VL (vLLM) Whisper (vLLM)

修复更新

  • 修复了BERT Large SQuAD模型链接404问题 (#ICSF66)
  • 修复了4.3.0容器环境下部分模型的依赖缺失问题
  • 修复了MViTv2-base模型推理异常的问题
  • 更新了CLIP模型的最新代码
  • 更新了ByteMLPerf工具箱中optimizer的代码出处 (#ICKHTC)
  • 更新了4.3.0适用大/小模型推理的Docker使用说明 (#ICLDBK)

版本关联

DeepSparkInference 25.09对应天数软件栈4.3.0版本。

感谢以下社区贡献者

YoungPeng,fhfang,郭寒冰,qiang.zhang,majorli6,honglyua。

DeepSparkInference 25.06 Release

26 Jun 02:38

Choose a tag to compare

25.06 Release Notes

模型与算法

  • 新增了24个推理小模型示例,其中支持IGIE推理引擎的15个,支持IxRT推理引擎的9个。
  • 新增了6个基于vLLM的大语言模型推理示例,其中3个为多模态模型。
IGIE
ConvNext_Tiny CSPResNeXt50 EfficientNet_B5
GFL MNASNet1_0 Regnet_x_3_2gf
Regnet_y_16gf SqueezeNet1_1 Twins_PCPVT
UNet VAN_B0 VGG19
ViT VGG19_BN YOLOv12
IxRT
ResNeXt101_32x8d ResNeXt101_64x4d ShuffleNetV2_x0_5
ShuffleNetV2_x1_0 ShuffleNetV2_x1_5 ShuffleNetV2_x2_0
YOLOv9 YOLOv10 YOLOv11
大模型
Aria (vLLM) H2OVLChatModel (vLLM) Idefics3-8B-Llama3 (vLLM)
Llama-3.2 (vLLM) MiniCPM-V2 (vLLM) Pixtral-12B-2409 (vLLM)

修复更新

  • 修复了模型代码中的绝对路径的问题。
  • 修复了EfficientNetV2模型依赖timm版本的问题。
  • 修复了GoogleNet和InceptionV3模型(IGIE)的编译报错问题。
  • 更新了stable-diffusion-v1-5模型在huggingface上的链接。
  • 更新了MiniCPM-V2推理模型代码示例。
  • 优化了IxRT和IGIE中视觉分类模型的公共代码避免重复。
  • 增加了DeepSparkInference全部模型的json配置文件。
  • 增加了模型库首页的英文版README文档。

版本关联

DeepSparkInference 25.06对应天数软件栈4.2.0版本。

感谢以下社区贡献者

YoungPeng,majorli6,honglyua,qiang.zhang。

DeepSparkInference 25.03 Release

26 Mar 06:00
fdf68dc

Choose a tag to compare

25.03 Release Notes

模型与算法

  • 新增了25个推理小模型示例,其中支持IGIE推理引擎的15个,支持IxRT推理引擎的10个。
  • 新增了11个大模型推理示例,其中6个为DeepSeek-R1蒸馏模型。
IGIE
CSPResNet50 ConvNeXt_S EfficientNet_b4
HRNetPose MNASNet0_75 Mixer_B
Regnet_x_16gf ResNeXt101_32x8d SABL
ShuffleNetv2_x2_0 SqueezeNet1_0 SVT_base
VGG11 Wide_ResNet101 YOLOv11
IxRT
ConvNeXt-Base DeiT-tiny DenseNet201
EfficientNet-B3 EfficientNetv2_rw_t EfficientNetv2_s
FoveaBox FSAF HRNet
RetinaFace
大模型
DeepSeek-R1-Distill-Llama-8B DeepSeek-R1-Distill-Llama-70B DeepSeek-R1-Distill-Qwen-1.5B
DeepSeek-R1-Distill-Qwen-7B DeepSeek-R1-Distill-Qwen-14B DeepSeek-R1-Distill-Qwen-32B
Chameleon-7B Fuyu-8B InternVL2-4B
LLaVA LLaVA-Next-Video-7B

问题修复

  • 新增了IxRT的NLP推理模型的自动化测试运行脚本。
  • 优化了IGIE推理模型自动化测试的运行脚本。
  • 修复了onnxruntime 1.17.1导致的quantize fail问题。
  • 修复了BERT模型在INT8精度下的问题。
  • 修复了YOLOv6 IGIE模型运行推理脚本报错的问题。
  • 修复了mmpretraino 0.24.0与mmcv 2.1.0版本不兼容问题。
  • 修复了ChatGLM3-6B-32k模型中的中文乱码问题。
  • 修复了vLLM模型中SamplingParams的初始化问题。
  • 更新了所有模型README文档格式,补充了模型所支持的IXUCA SDK版本。

版本关联

DeepSparkInference 25.03对应天数软件栈4.2.0版本。

感谢以下社区贡献者

YoungPeng,majorli6,xinchi.tian,xiaomei.wang,honglyua,qiang.zhang。

DeepSparkInference 24.12 Release

23 Dec 06:25

Choose a tag to compare

24.12 Release Notes

模型与算法

● 新增了24个推理小模型示例,其中支持IGIE推理引擎的15个,支持IxRT推理引擎的9个。
● 新增了9个大语言模型的推理示例,其中支持vLLM的8个,支持ixFormer的1个。

IGIE
ConvNeXt-Base DenseNet201 EfficientNet-B3
EfficientNetV2-S MNASNet0_5 MViTv2_base
Regnet_y_1_6gf ResNetV1_D50 ResNeXt101_64x4d
ShuffleNetV2_x1_5 Kie_layoutXLM Rec_SVTR
YOLOv9 YOLOv10 PAA
IxRT
CenterNet OpenPose RTMPose
CSPDarkNet53 DensNet161 DensNet169
EfficientNetB2 ResNeXt50_32x4d ConvNeXt-Small
大模型推理
CLIP (IxFormer) ChatGLM3-6B-32K (vLLM) Llama2-7B (vLLM)
MiniCPM-V-2 (vLLM) Qwen-7B (vLLM) Qwen1.5-32B-Chat (vLLM)
Qwen2-72B-Instruct (vLLM) Qwen2-7B-Instruct (vLLM) StableLM2-1.6B (vLLM)

问题修复

● 新增了IGIE推理模型自动化测试的运行脚本。
● 修复了YOLOv8 IxRT模型运行推理脚本报错的问题。
● 更新了YOLOv9和YOLOv10的IGIE模型的配置文件。
● 完善了IxRT模型BERT,Mask RCNN,MobileNetV2和YOLOX的end2end推理时间打印。

版本关联

DeepSparkInference 24.12对应天数软件栈4.1.2版本。

感谢以下社区贡献者

YoungPeng,majorli6,xinchi.tian,xiaomei.wang,honglyua,qiang.zhang。

DeepSparkInference 24.09 Release

23 Sep 02:40
5604aa6

Choose a tag to compare

24.09 Release Notes

模型与算法

  • 新增了29个推理小模型示例,其中支持IGIE推理引擎的15个,支持IxRT推理引擎的14个。
IGIE
ATSS ConvNeXt-Small CSPDarkNet50 DeiT-tiny
DenseNet169 EfficientNet-B2 EfficientNetV2-M FCOS
FSAF RepVGG RetinaFace RTMDet
RTMPose SEResNet50 ShuffleNet_V2_X1_0
IxRT
ALBERT Conformer DeBERTa FaceNet
RoBERTa RoFormer Swin Transformer Large Transformer ASR
VideoBERT Wide_ResNet50 Wide&Deep YOLOv4
YOLOv6 YOLOv8
  • 新增了5个大语言模型的推理示例。
    • Llama3-70B (TensorRT-LLM)
    • Qwen1.5-7B (Text Generation Inference)
    • Qwen1.5-7B (vLLM)
    • Qwen1.5-14B (vLLM)
    • Qwen1.5-72B (vLLM)

问题修复

  • 修复了BERT Base SQUAD模型在NV环境上int8精度异常的问题。
  • 修复了Mask RCNN模型在NV 24.04环境上运行编译报错的问题。
  • 修复了CLIP IGIE模型对transformers版本有依赖的问题。
  • 完善了IxRT部分模型的end2end推理时间打印。

版本关联

DeepSparkInference 24.09对应天数软件栈4.1.2版本。

感谢以下社区贡献者

YoungPeng,majorli,xinchi.tian,xiaomei.wang,wenfeng.zhang,haoyanlong,qiang.zhang。

DeepSparkInference 24.06 Release

28 Jun 03:54
7ae262a

Choose a tag to compare

24.06 Release Notes

模型与算法

  • 新增了31个推理小模型示例,其中支持IGIE推理引擎的16个,支持IxRT推理引擎的15个。
IGIE
CenterNet DenseNet161 EfficientNet_b1 EfficientNet_rw_t
FoveaBox HRNet MobileNetv3_Large MobileNetv3_Small
Regnet_x_1_6gf RepNet Res2Net50 ResNeSt50
ResNet101 ResNet152 ShuffleNetv2_x0_5 Wide_ResNet50
IxRT
BERT Base SQuAD DenseNet DETR EfficientNet_V2_t
FCOS HRNet Inception_ResNet_V2 InceptionV3
ResNet_V1_D50 SoloV1 SqueezeNet_v1.1 YOLOv3
YOLOv5m YOLOv5s YOLOv7
  • 新增了4个大语言模型的推理示例。
    • Baichuan2-7B (vLLM)
    • ChatGLM-3-6B (vLLM)
    • Llama2-7B (TensorRT-LLM)
    • Qwen-7B (Text Generation Inference)

问题修复

  • 修复了YOLOX IxRT 插件编译会报错的问题。
  • 完善了libGL依赖在Ubuntu上安装的帮助说明。

版本关联

DeepSparkInference 24.06对应天数软件栈4.0.0版本。

感谢以下社区贡献者

YoungPeng,majorli,xinchi.tian,tianxi-yi,may,xiaomei.wang,cheneychen2023,qiang.zhang。

DeepSparkInference 24.03 Release

26 Mar 03:12

Choose a tag to compare

24.03 Release Notes

模型与算法

  • 新增了48个推理模型示例,其中支持IGIE推理引擎的28个,支持IxRT推理引擎的20个。
IGIE
AlexNet BERT Base NER BERT Base SQuAD BERT Large SQuAD
CLIP Conformer Conformer-B DeepSort
DenseNet121 EfficientNet-B0 FastReID GoogLeNet
HRNet-W18 InceptionV3 MobileNetV2 ResNet18
ResNet50 ResNeXt50_32x4d RetinaNet Swin Transformer
VGG16 YOLOv3 YOLOv4 YOLOv5
YOLOv6 YOLOv7 YOLOv8 YOLOX
IxRT
AlexNet BERT Base SQuAD BERTLarge SQuAD CSPResNet50
EfficientNet-B0 EfficientNet-B1 GoogLeNet Mask R-CNN
MobileNetV2 MobileNetV3 RepVGG Res2Net50
ResNet101 ResNet18 ResNet34 ResNet50
ShufflenetV1 SqueezeNet 1.0 VGG16 YOLOX

版本关联

DeepSparkInference 24.03对应天数软件栈4.0.0版本。