8月21日消息,深度求索官方今日正式对外发布DeepSeek-V3.1,官方提到DeepSeek-V3.1使用了UE8M0FP8Scale的参数精度。
在DeepSeek官方公众号文章页面,DeepSeek进一步解释称,UE8M0FP8是针对即将发布的下一代国产芯片设计。
注:FP英文全称为FloatingPoint,是IEEE定义的标准浮点数类型。UE8M0FP8在AI模型领域代表一种模型精度。
DeepSeekV3.1的Base模型在V3的基础上重新做了外扩训练,一共增加训练了840Btokens。Base模型与后训练模型均已在Huggingface与魔搭开源。附开源地址:
Base模型:
HuggingFace:
https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
魔搭:
https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Base
后训练模型:
HuggingFace:
https://huggingface.co/deepseek-ai/DeepSeek-V3.1
魔搭:
https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1
下一篇: 最后一页
2025-07-04
2025-07-09
DeepSeek硬控智能家居!四大电视巨头抢跑,AR眼镜、智能音箱都上桌了
2025-06-26
AI零食真能吃吗?我们买了无印良品AI薯条尝了尝,结果很意外
2025-07-01
对话商业大咖,解构“正确的事”:WISE2024 商业之王大会来了!
2025-07-07
2025-07-12
解构Manus AI:这是通用Agent革命,还是精巧缝合怪?
2025-06-23
2025-06-29
ChatGPT终于也推出Projects功能,却故意露出一个“AGI”的项目
2025-07-04
桌面版ChatGPT升级,支持编程App交互,离AI接管电脑又近一步
2025-07-09