据媒体报道,小红书hi lab(人文智能实验室)团队近期在Github、Hugging Face等平台发布首款开源文本大模型dots.llm1。
小红书hi lab团队开源了所有模型和必要的训练信息,包括微调Instruct(dots.llm1.inst)模型、长文base(dots.llm1.base)模型、退火阶段前后的多个base模型、超参数以及每1万亿个token的中间训练checkpoint等内容。目前来看,dots.llm1大部分性能与阿里Qwen 2.5模型,部分性能与阿里Qwen 3模型相当。
dots.llm1是一个1420亿参数的混合专家模型(MoE),在推理过程中仅激活140亿参数,能保持高性能的同时大幅度降低训练和推理成本。
此外,dots.llm1.ins在预训练阶段使用了11.2万亿的非合成数据,最终性能与阿里Qwen3-32b相比,在中英文、数学、对齐任务上表现接近。
既可爱又性感的样子 偶遇福利姬账号的囧图
2026首款皮肤!《王者荣耀》孙悟空-无相CG公开!
确实是误封!玩家13岁玩到22的9年老帐号现已解封
500男vs500女!MC生存竞赛遭质疑 男装作女疯狂屠杀?
仙剑4RE实机太惊艳!帧帧都能当壁纸
人间尤物级别的女主 想当女队教练的晚间囧图