「DeepSeek」公眾號(hào)發(fā)布消息稱,今日(8月21日),DeepSeek-V3.1正式發(fā)布。
據(jù)介紹,本次升級(jí)包含以下主要變化。
混合推理架構(gòu):一個(gè)模型同時(shí)支持思考模式與非思考模式;更高的思考效率:相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短時(shí)間內(nèi)給出答案;更強(qiáng)的Agent能力:通過(guò)Post-Training優(yōu)化,新模型在工具使用與智能體任務(wù)中的表現(xiàn)有較大提升。官方App與網(wǎng)頁(yè)端模型已同步升級(jí)為DeepSeek-V3.1。用戶可以通過(guò)「深度思考」按鈕,實(shí)現(xiàn)思考模式與非思考模式的自由切換。
DeepSeekAPI也已同步升級(jí),deepseek-chat 對(duì)應(yīng)非思考模式,deepseek-reasoner對(duì)應(yīng)思考模式,且上下文均已擴(kuò)展為128K。同時(shí),APIBeta接口支持了 strict 模式的FunctionCalling,以確保輸出的Function滿足schema定義。
另外,新版本增加了對(duì)AnthropicAPI格式的支持,讓大家可以輕鬆將DeepSeek-V3.1的能力接入ClaudeCode框架。
據(jù)介紹,測(cè)試結(jié)果顯示,經(jīng)過(guò)思維鏈壓縮訓(xùn)練後,V3.1-Think在輸出token數(shù)減少20%-50%的情況下,各項(xiàng)任務(wù)的平均表現(xiàn)與R1-0528持平。

在各項(xiàng)評(píng)測(cè)指標(biāo)得分基本持平的情況下(AIME2025:87.5/88.4,GPQA:81/80.1,liveCodeBench:73.3/74.8),R1-0528與V3.1-Think的token消耗量對(duì)比圖
同時(shí),V3.1在非思考模式下的輸出長(zhǎng)度也得到了有效控制,相比於DeepSeek-V3-0324,能夠在輸出長(zhǎng)度明顯減少的情況下保持相同的模型性能。
價(jià)格調(diào)整
據(jù)介紹,將於北京時(shí)間2025年9月6日凌晨起,對(duì)DeepSeek開(kāi)放平臺(tái) API 接口調(diào)用價(jià)格將進(jìn)行如下調(diào)整:
(1)執(zhí)行新版價(jià)格表(如下圖所示,詳見(jiàn)定價(jià)頁(yè)面);

?。?)取消夜間時(shí)段優(yōu)惠。
在9月6日前,所有API服務(wù)仍按原價(jià)格政策計(jì)費(fèi)。