中国在线黄色电影,99精品无码一区二区A片软件 ,成人免费在线狠狠干成人免费伦理

DeepSeek發(fā)布新版本模型：優(yōu)化推理效率，API降價(jià)超50%

來(lái)源：澎湃新聞

2025-09-29 21:29:00

澎湃新聞?dòng)浾?范佳來(lái)

DeepSeek發(fā)布新版本模型，調(diào)用API成本降低超50%。

9月29日，DeepSeek正式發(fā)布DeepSeek-V3.2-Exp模型，這是一個(gè)實(shí)驗(yàn)性（Experimental）的版本。

值得注意的是，此前有不少科技博主發(fā)現(xiàn)，DeepSeek-V3.2新模型已上傳至其HuggingFace官方頁(yè)面，隨后被刪除，此后DeepSeek正式公告新版本的推出。

據(jù)DeepSeek介紹，作為邁向新一代架構(gòu)的中間步驟，V3.2-Exp在V3.1-Terminus的基礎(chǔ)上引入DeepSeek Sparse Attention（一種稀疏注意力機(jī)制），針對(duì)長(zhǎng)文本的訓(xùn)練和推理效率進(jìn)行探索性優(yōu)化和驗(yàn)證。目前，官方App、網(wǎng)頁(yè)端、小程序均已同步更新為DeepSeek-V3.2-Exp，同時(shí)API大幅度降價(jià)。

據(jù)了解，DeepSeek Sparse Attention（DSA）首次實(shí)現(xiàn)細(xì)粒度稀疏注意力機(jī)制，在幾乎不影響模型輸出效果的前提下，實(shí)現(xiàn)長(zhǎng)文本訓(xùn)練和推理效率的大幅提升。為嚴(yán)謹(jǐn)評(píng)估引入稀疏注意力帶來(lái)的影響，把DeepSeek-V3.2-Exp的訓(xùn)練設(shè)置與V3.1-Terminus進(jìn)行嚴(yán)格的對(duì)齊。在各領(lǐng)域的公開(kāi)評(píng)測(cè)集上，DeepSeek-V3.2-Exp的表現(xiàn)與V3.1-Terminus基本持平。

在新模型的研究過(guò)程中，需要設(shè)計(jì)和實(shí)現(xiàn)很多新的GPU算子，使用高級(jí)語(yǔ)言TileLang進(jìn)行快速原型開(kāi)發(fā)，以支持更深入的探索。在最后階段，以TileLang作為精度基線，逐步使用底層語(yǔ)言實(shí)現(xiàn)更高效的版本。此次開(kāi)源的主要算子包含TileLang與 CUDA兩種版本。

DeepSeek表示，得益于新模型服務(wù)成本的大幅降低，官方API價(jià)格也相應(yīng)下調(diào)，開(kāi)發(fā)者調(diào)用DeepSeek API的成本將降低50%以上。從價(jià)格來(lái)看，輸入緩存命中從0.5元降至0.2元/百萬(wàn)tokens，緩存未命中從4元降至2元/百萬(wàn)tokens，輸出由12元降至3元/百萬(wàn)tokens。

除了DeepSeek，國(guó)內(nèi)另一大模型廠商智譜的新一代旗艦?zāi)Ｐ虶LM-4.6也即將發(fā)布，目前，在Z.ai官網(wǎng)可以看到，GLM-4.5標(biāo)識(shí)為上一代旗艦?zāi)Ｐ汀?/p>

此前9月18日，梁文鋒帶著DeepSeek-R1的研究，登上最新一期國(guó)際頂級(jí)期刊《自然》（Nature）封面。

今年1月份，國(guó)產(chǎn)大模型公司深度求索（DeepSeek）在預(yù)印本平臺(tái)arxiv公布論文《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》，創(chuàng)始人梁文鋒位于署名之列。

《自然》雜志指出，如此總結(jié)DeepSeek-R1帶來(lái)的進(jìn)步：如果訓(xùn)練出的大模型能夠規(guī)劃解決問(wèn)題所需的步驟，那么它們往往能夠更好地解決問(wèn)題。這種“推理”與人類處理更復(fù)雜問(wèn)題的方式類似，但這對(duì)人工智能有極大挑戰(zhàn)，需要人工干預(yù)來(lái)添加標(biāo)簽和注釋。

DeepSeek的研究人員揭示了他們?nèi)绾文軌蛟跇O少的人工輸入下訓(xùn)練一個(gè)模型，并使其進(jìn)行推理。DeepSeek-R1模型采用強(qiáng)化學(xué)習(xí)進(jìn)行訓(xùn)練。在這種學(xué)習(xí)中，模型正確解答數(shù)學(xué)問(wèn)題時(shí)會(huì)獲得高分獎(jiǎng)勵(lì)，答錯(cuò)則會(huì)受到懲罰。