AI模型库:服务器预载,极速下载
在服务器上安装 Git 工具后,执行 git clone <仓库URL>
命令即可下载。
纯文本系列
Deepseek-R1-0528 http://10.10.210.88/deepseek-ai/deepseek-r1-0528.git
优点:当前性能最强的纯⽂本⼤模型
缺点:
i. 训练以及部署的成本较⾼,⾮量化的deepseek⼤约需要3个8卡80G显存的节点才能部署
ii. 模型幻觉⾼
MiniMax-M1系列 http://10.10.210.88/minimaxai/minimax-m1-80k.git
优点:
i. 超⻓上下⽂⻓度,是deepseek等主流模型的8倍
ii. 在超⻓⽂本的场景下推理速度快
iii. 针对agent场景做过微调,较为适合需要⼯具调⽤的场景
缺点:
i. 模型为456b,部署成本较⾼,⼤约需要2个节点
ii. 在超⼤尺⼨规模下没有被社区⼴泛使⽤验证
多模态系列
Qwen2.5-VL系列 http://10.10.210.88/qwen/qwen2.5-vl-7b-instruct.git
优点:
i. 尺⼨较多,涵盖从端侧的3b到云服务的72b
ii. ⽀持图⽚和视频的理解
iii. 具有⼀定的agent能⼒
iv. 当前最强开源视觉理解⼤模型
缺点:
i. 没有推理能⼒
Qwen2-Audio http://10.10.210.88/qwen/qwen2-audio-7b.git http://10.10.210.88/qwen/qwen2-audio-7b-instruct.git
优点:
i. 经典且经过⼴泛验证的⾳频理解⼤模型
缺点:
i. 模型较⽼,性能上限具有局限性
ii. 只有7b规模的⼩尺⼨
生成模型系列
Kyutai-TTS文生音频 http://10.10.210.88/kyutai/tts-1.6b-en_fr.git
Wan2.1文生视频 http://10.10.210.88/wan-ai/wan2.1-t2v-14b-diffusers.git