您的位置首页财经

DeepSeek在下一代人工智能模型中首次引入“稀疏注意力”机制

wczz1314 2025年9月30日 8:43 阅读(18) 评论(0)

　　DeepSeek周一更新了一个实验性的人工智能模型，并称之为迈向新一代架构的中间步骤。

DeepSeek周一更新了一个实验性的人工智能模型，并称之为迈向新一代架构的中间步骤。

DeekSeek在Hugging Face上发布帖子，概述了DeepSeek-V3.1-Exp平台，并解释说该平台引入一种名为DeepSeek Sparse Attention的“稀疏注意力机制”，该公司还暗示正在与芯片制造商合作开发该模型。

今年早些时候，DeepSeek的R1模型以其精妙的算法震惊硅谷，如今该公司正致力于开发新产品。最新版本在V3.1的基础上，引入旨在探索和优化人工智能训练和运行的机制。该公司表示，此举的目的是对长文本的训练和推理效率进行探索性的优化和验证。

与其他AI初创公司一样，DeepSeek也试图通过降价来吸引用户。该公司称，将把开发者调用DeepSeek API的成本降低50%以上。

责任编辑：李桐

本文来自网络，不代表天牛新闻网立场，转载请注明出处：http://m.swlnl.cn/26813.html

2赞