AI模型库:服务器预载,极速下载​

在服务器上安装 Git 工具后,执行 git clone <仓库URL> 命令即可下载。

纯文本系列

Deepseek-R1-0528 http://10.10.210.88/deepseek-ai/deepseek-r1-0528.git

优点:当前性能最强的纯⽂本⼤模型

缺点:

i. 训练以及部署的成本较⾼,⾮量化的deepseek⼤约需要3个8卡80G显存的节点才能部署

ii. 模型幻觉⾼

MiniMax-M1系列 http://10.10.210.88/minimaxai/minimax-m1-80k.git

优点:

i. 超⻓上下⽂⻓度,是deepseek等主流模型的8倍

ii. 在超⻓⽂本的场景下推理速度快

iii. 针对agent场景做过微调,较为适合需要⼯具调⽤的场景

缺点:

i. 模型为456b,部署成本较⾼,⼤约需要2个节点

ii. 在超⼤尺⼨规模下没有被社区⼴泛使⽤验证

多模态系列

Qwen2.5-VL系列 http://10.10.210.88/qwen/qwen2.5-vl-7b-instruct.git

优点:

i. 尺⼨较多,涵盖从端侧的3b到云服务的72b

ii. ⽀持图⽚和视频的理解

iii. 具有⼀定的agent能⼒

iv. 当前最强开源视觉理解⼤模型

缺点:

i. 没有推理能⼒

Qwen2-Audio http://10.10.210.88/qwen/qwen2-audio-7b.git http://10.10.210.88/qwen/qwen2-audio-7b-instruct.git

优点:

i. 经典且经过⼴泛验证的⾳频理解⼤模型

缺点:

i. 模型较⽼,性能上限具有局限性

ii. 只有7b规模的⼩尺⼨

生成模型系列

Kyutai-TTS文生音频 http://10.10.210.88/kyutai/tts-1.6b-en_fr.git

Wan2.1文生视频 http://10.10.210.88/wan-ai/wan2.1-t2v-14b-diffusers.git

Document