智星云文档智星云文档
返回官网
返回官网
  • 新手入门

    • 算力租用流程
    • 常见问题
    • 如何选择GPU
  • 技术相关

    • 智星云修改HOST解决跨网域名解析问题
    • turbovnc安装配置
    • 智星云huggingface加速节点使用教程
    • AI模型库:服务器预载,极速下载
    • linux安装cuda和pytorch方法
    • 测试服务器带宽的方法
    • windows常见问题
    • GPU测速
    • Linux实用基础
    • jupyter notebook连接linux
    • VSCode连接到云主机
    • macOS系统连接到云主机
    • 拓展磁盘
    • 端口映射
    • GPU无法调用
    • ssh链接保持
    • ssh在云主机后台运行
    • 基于SSH的链接异常
    • VSCode远程连接失败
    • centos7-epel加速
    • conda使用源
    • docker镜像压缩
    • dynslam安装
    • huggingface下载
    • ubuntu安装显卡驱动
    • 编译tensorflow
    • linux上传文件&数据上传Windows
    • 更新git到最新
    • 回环设备
    • nvidia-smi输出解析
    • Topaz 视频处理教程

在服务器上安装git 和 git-lfs工具 命令: sudo apt install git git-lfs

纯文本系列

Deepseek-R1-0528 http://10.10.210.88/deepseek-ai/deepseek-r1-0528.git

优点:当前性能最强的纯⽂本⼤模型

缺点:

i. 训练以及部署的成本较⾼,⾮量化的deepseek⼤约需要3个8卡80G显存的节点才能部署

ii. 模型幻觉⾼

MiniMax-M1系列 http://10.10.210.88/minimaxai/minimax-m1-80k.git

优点:

i. 超⻓上下⽂⻓度,是deepseek等主流模型的8倍

ii. 在超⻓⽂本的场景下推理速度快

iii. 针对agent场景做过微调,较为适合需要⼯具调⽤的场景

缺点:

i. 模型为456b,部署成本较⾼,⼤约需要2个节点

ii. 在超⼤尺⼨规模下没有被社区⼴泛使⽤验证

多模态系列

Qwen2.5-VL系列 http://10.10.210.88/qwen/qwen2.5-vl-7b-instruct.git

优点:

i. 尺⼨较多,涵盖从端侧的3b到云服务的72b

ii. ⽀持图⽚和视频的理解

iii. 具有⼀定的agent能⼒

iv. 当前最强开源视觉理解⼤模型

缺点:

i. 没有推理能⼒

Qwen2-Audio http://10.10.210.88/qwen/qwen2-audio-7b.git http://10.10.210.88/qwen/qwen2-audio-7b-instruct.git

优点:

i. 经典且经过⼴泛验证的⾳频理解⼤模型

缺点:

i. 模型较⽼,性能上限具有局限性

ii. 只有7b规模的⼩尺⼨

生成模型系列

Kyutai-TTS文生音频 http://10.10.210.88/kyutai/tts-1.6b-en_fr.git

Wan2.1文生视频 http://10.10.210.88/wan-ai/wan2.1-t2v-14b-diffusers.git

Prev
智星云huggingface加速节点使用教程
Next
linux安装cuda和pytorch方法