1月20日,在特朗普宣布啟動(dòng)總投資5000億美元的“星際之門(mén)” (Stargate)AI基礎(chǔ)設(shè)施計(jì)劃前一天,杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司——一家此前名不見(jiàn)經(jīng)傳的中國(guó)企業(yè),將其開(kāi)發(fā)的大語(yǔ)言推理模型DeepSeek-R1以開(kāi)源形式上線。憑借高性能、低成本優(yōu)勢(shì),這個(gè)初出茅廬的大模型立刻成為科技圈、投資圈和媒體圈乃至全網(wǎng)關(guān)注的焦點(diǎn)。
《中國(guó)化工報(bào)》記者注意到,春節(jié)假期后第一周,多家上市企業(yè)宣布接入DeepSeek,帶動(dòng)上證科創(chuàng)板50成份指數(shù)和創(chuàng)業(yè)板指數(shù)均漲超5%。但這場(chǎng)帶著全網(wǎng)起飛的“龍卷風(fēng)”,吹到石油和化工行業(yè)時(shí)卻好像減了速——迄今為止,鮮少有石油和化工企業(yè)加入這場(chǎng)狂歡。
對(duì)此,工業(yè)智能化、AI等研究領(lǐng)域的多位專(zhuān)家近日接受記者采訪時(shí)表示,DeepSeek橫空出世令人鼓舞,但要解決AI大模型在流程工業(yè)垂直應(yīng)用的諸多難題并非易事,能否帶飛石油和化工行業(yè),仍需時(shí)間檢驗(yàn)。
DeepSeek能在網(wǎng)絡(luò)上掀起巨浪,甚至引發(fā)美國(guó)股市中英偉達(dá)等科技股出現(xiàn)“歷史性”大跌的核心“殺手锏”,在于其顛覆性的低成本與高效率。
根據(jù)深度求索公司官方放出的數(shù)據(jù),DeepSeek僅用2048塊英偉達(dá) H800圖形處理器(GPU)和557.6萬(wàn)美元的投入,就訓(xùn)練出了規(guī)模達(dá)6710億參數(shù)的DeepSeek-V3。Open AI創(chuàng)始成員之一Andrej Karpathy表示,按照以往經(jīng)驗(yàn),行業(yè)內(nèi)類(lèi)似能力級(jí)別的大模型大多使用約10萬(wàn)張GPU。例如,Llama 3 405B模型消耗了3080萬(wàn)GPU小時(shí),而DeepSeek-V3則用了280萬(wàn)GPU小時(shí),計(jì)算需求僅為前者的十一分之一。
此前,市場(chǎng)上也普遍認(rèn)為同等參數(shù)規(guī)模的GPT-4訓(xùn)練花費(fèi)高達(dá)10億美元。而DeepSeek推出的DeepSeek-R1模型,推理成本僅為OpenAI最新模型(o1)的三十分之一。許多后續(xù)研究團(tuán)隊(duì)更是用較低的成本成功復(fù)現(xiàn)了DeepSeek的模型樣本。
從用戶(hù)端來(lái)看,這樣的數(shù)據(jù)似乎意味著企業(yè)部署AI大模型的花費(fèi)從“腳脖子打折”,個(gè)人用戶(hù)部署一個(gè)自有大模型好像也不再是夢(mèng)想。但這真的意味著誰(shuí)都“用得起”大模型的時(shí)代到來(lái)了嗎?
“部署和訓(xùn)練成本并不等同于應(yīng)用成本?!币晃籌CT從業(yè)人士表示,DeepSeek成本的降低,主要是靠算法創(chuàng)新對(duì)訓(xùn)練成本進(jìn)行了壓縮。根據(jù)官方數(shù)據(jù),研究團(tuán)隊(duì)在訓(xùn)練模型時(shí)同時(shí)使用了8浮點(diǎn)混合精度訓(xùn)練技術(shù)(FP8)、混合專(zhuān)家模型(MoE)以及自主研發(fā)的多頭潛在注意力(MLA)機(jī)制,解決了傳統(tǒng)Transformer模型在處理長(zhǎng)輸入序列時(shí)的內(nèi)存瓶頸問(wèn)題,可將顯存占用降至傳統(tǒng)模型的5%~13%。
而應(yīng)用成本則包括計(jì)算設(shè)施、傳輸設(shè)施的建設(shè)成本,數(shù)據(jù)收集與存儲(chǔ)成本等。以煉廠為例,一套催化裂化裝置每秒產(chǎn)生的數(shù)據(jù)點(diǎn)可能就多達(dá)上千個(gè),其中既包括每秒或幾分鐘就要采集一次的溫度和壓力數(shù)據(jù),也包括需要長(zhǎng)期連續(xù)測(cè)定的催化劑活性數(shù)據(jù),還有一些動(dòng)設(shè)備如泵的噪音、振動(dòng)幅度等其他數(shù)據(jù),一家大型煉廠每年產(chǎn)生的數(shù)據(jù)量可能在千億級(jí)字節(jié)。即使DeepSeek依靠算法降低了對(duì)GPU服務(wù)器集群等計(jì)算設(shè)施的需求,其數(shù)據(jù)存儲(chǔ)與傳輸設(shè)施的剛性投入也難以降低,中小企業(yè)搭建自有大模型仍然存在困難。
圖靈獎(jiǎng)得主、Meta AI科學(xué)家楊立昆(Yann LeCun)也公開(kāi)發(fā)聲強(qiáng)調(diào),許多投資者對(duì)AI基礎(chǔ)設(shè)施投資存在“重大誤解”?!澳切?shù)十億美元的資金中,很大一部分都投入到了推理基礎(chǔ)設(shè)施中,而不是訓(xùn)練。數(shù)十億人運(yùn)行 AI助手服務(wù)需要大量的計(jì)算,一旦你將視頻理解、推理、大規(guī)模內(nèi)存和其他功能納入AI系統(tǒng),推理成本就會(huì)增加?!睏盍⒗フf(shuō)。
此前,DeepSeek憑借一句“打動(dòng)你的是人類(lèi)集體智慧的回聲”在網(wǎng)絡(luò)上引起無(wú)數(shù)轉(zhuǎn)發(fā)和討論。出于好奇,記者也嘗試讓它進(jìn)行了多種風(fēng)格的寫(xiě)作,在情感及純文學(xué)寫(xiě)作中表現(xiàn)出色的DeepSeek,在涉及專(zhuān)業(yè)數(shù)據(jù)時(shí)卻有些“不知所云”,它給出了歐洲某家煉油廠應(yīng)用AI優(yōu)化運(yùn)維的案例,但記者按其給出的數(shù)據(jù)無(wú)法查證該煉油廠是否真實(shí)存在,“追問(wèn)” DeepSeek也無(wú)法得到該煉油廠更具體的信息。
“這就是大語(yǔ)言模型(LLM)目前應(yīng)用的一個(gè)大問(wèn)題——模型幻覺(jué)?!敝谢畔⒓夹g(shù)有限公司專(zhuān)家委員會(huì)副主任、華東理工大學(xué)講席教授馮恩波告訴記者,目前LLM僅能勝任知識(shí)或數(shù)據(jù)管理方面的工作,但如果讓它產(chǎn)生專(zhuān)業(yè)程度較強(qiáng)的新知識(shí)、新內(nèi)容,就需要十分小心,因?yàn)椤澳P突糜X(jué)”目前在AI深度學(xué)習(xí)領(lǐng)域中,仍是難以根除的問(wèn)題。
其中,一部分幻覺(jué)數(shù)據(jù)可以通過(guò)核對(duì)輸入內(nèi)容和生成內(nèi)容發(fā)現(xiàn),并通過(guò)調(diào)整輸入關(guān)鍵詞來(lái)修正。例如,向AI詢(xún)問(wèn)“中國(guó)第一家化工企業(yè)的名字是什么?”,AI可能會(huì)由于抓取關(guān)鍵詞的不同,給出“1880年成立的上海江蘇藥水廠是中國(guó)第一家化工廠”或“始建于1954年的吉林化學(xué)工業(yè)公司(中國(guó)石油吉林石化分公司前身),是我國(guó)第一家化工企業(yè)”的答案,用戶(hù)可以通過(guò)添加例如“新中國(guó)成立前/后”等關(guān)鍵詞再進(jìn)行篩選。
另一部分的幻覺(jué)則更加“危險(xiǎn)”?!坝锌赡蹵I會(huì)給你一個(gè)語(yǔ)言華麗、數(shù)據(jù)漂亮的成果報(bào)告,但其中‘融化’了大量不確定性高,甚至在專(zhuān)業(yè)人士看來(lái)是謬論的數(shù)據(jù)。”馮恩波強(qiáng)調(diào),尤其要謹(jǐn)防AI講話“真假參半”,將虛假的數(shù)據(jù)掩藏在大量專(zhuān)業(yè)詞匯和華麗的語(yǔ)言之后,因?yàn)榧词故菍?duì)相關(guān)從業(yè)者來(lái)說(shuō),一一核對(duì)與辨別這些案例和數(shù)據(jù)的不合理之處,也是非常困難的事情。如果這些摻雜“幻覺(jué)”的數(shù)據(jù)和知識(shí)進(jìn)入數(shù)據(jù)庫(kù),被用在流程行業(yè)實(shí)際生產(chǎn)系統(tǒng)的實(shí)時(shí)優(yōu)化、實(shí)時(shí)控制等方面,可能造成嚴(yán)重后果。
對(duì)此,他建議,行業(yè)可以先利用大數(shù)據(jù),建立較為準(zhǔn)確的反應(yīng)機(jī)理模型作為“司令員”,在此基礎(chǔ)上應(yīng)用大語(yǔ)言推理模型作為“參謀長(zhǎng)”進(jìn)行輔助判斷,再由有經(jīng)驗(yàn)的操作員最終驗(yàn)證和確定反應(yīng)流程的實(shí)時(shí)優(yōu)化與控制該如何進(jìn)行,從而提高模型應(yīng)用的準(zhǔn)確性與可靠性。
“目前,DeepSeek這樣的大模型也會(huì)造成很多‘幻覺(jué)’,但企業(yè)需要大模型在決策過(guò)程中能保證百分之百的準(zhǔn)確性?!北本┲嘘P(guān)村科金技術(shù)有限公司總裁喻友平說(shuō):“大模型在面向企業(yè)端(To B)的應(yīng)用離理想狀態(tài)還有很大距離,這比面對(duì)終端消費(fèi)者(To C)場(chǎng)景的挑戰(zhàn)要大得多?!?/p>
近年來(lái),能源化工行業(yè)AI大模型應(yīng)用已經(jīng)取得了初步成績(jī),例如中國(guó)石油700億參數(shù)昆侖大模型、中控石化化工大模型、中國(guó)海油“海能”人工智能模型,但要實(shí)現(xiàn)更加廣泛的應(yīng)用,仍在可用性與易用性方面面臨挑戰(zhàn)。多位業(yè)內(nèi)專(zhuān)家表示,大語(yǔ)言推理模型在流程行業(yè)的應(yīng)用仍然需要夯實(shí)數(shù)據(jù)和機(jī)理的“地基”,以保障其安全性與可靠性。
中國(guó)工程院院士、中國(guó)石油勘探開(kāi)發(fā)研究院正高級(jí)工程師劉合此前表示,數(shù)據(jù)治理是油氣行業(yè)AI大模型應(yīng)用的關(guān)鍵,如何在保證數(shù)據(jù)安全和保密的前提下,充分整合分散的數(shù)據(jù)并訓(xùn)練行業(yè)模型,是行業(yè)一直在探索的一個(gè)“大問(wèn)題”。
但對(duì)于石化行業(yè)來(lái)說(shuō),推動(dòng)數(shù)據(jù)治理,打牢大語(yǔ)言模型應(yīng)用的“地基”并不容易。一方面,石化行業(yè)的數(shù)據(jù)環(huán)境極為復(fù)雜、數(shù)據(jù)來(lái)源廣,且受外部環(huán)境影響噪聲高,容易出現(xiàn)數(shù)據(jù)不完整的情況;另一方面,主流深度學(xué)習(xí)的模型通常在靜態(tài)數(shù)據(jù)集上進(jìn)行訓(xùn)練,而實(shí)際生產(chǎn)是“牽一發(fā)而動(dòng)全身”,催化劑中毒、不同批次原料成分的細(xì)微改變,都會(huì)使設(shè)備狀態(tài)及工藝參數(shù)發(fā)生漂移,導(dǎo)致數(shù)據(jù)集逐漸“過(guò)期”,優(yōu)化模型也不再有效。劉合在其署名文章《油氣大模型破局需從三方面發(fā)力》中也提出,油氣企業(yè)必須強(qiáng)化數(shù)據(jù)全生命周期管理,從數(shù)據(jù)源頭、數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)融合和匹配、數(shù)據(jù)完整性增強(qiáng)、數(shù)據(jù)標(biāo)注等環(huán)節(jié)嚴(yán)格規(guī)范,建立高質(zhì)量的訓(xùn)練樣本庫(kù),提升數(shù)據(jù)治理能力,從而為行業(yè)大模型提供堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ)。
“除了挖掘數(shù)據(jù)與場(chǎng)景價(jià)值點(diǎn)外,石化企業(yè)應(yīng)用大模型的另一個(gè)重點(diǎn)是安全性和保密性問(wèn)題。”浙江新和成股份有限公司運(yùn)營(yíng)首席專(zhuān)家鄭根土認(rèn)為,數(shù)據(jù)安全治理也是企業(yè)所擔(dān)憂的問(wèn)題,目前國(guó)家已經(jīng)出臺(tái)了數(shù)據(jù)流通安全治理的相關(guān)法案,但數(shù)據(jù)流通安全治理體系仍然有待構(gòu)建,相關(guān)機(jī)制也并不完善,需要企業(yè)、行業(yè)與相關(guān)部門(mén)多方協(xié)同,提高行業(yè)數(shù)據(jù)流通與應(yīng)用的監(jiān)管效能。
喻友平表示:“展望未來(lái),AI在To B領(lǐng)域的應(yīng)用將面臨轉(zhuǎn)型與創(chuàng)新的雙重挑戰(zhàn)。企業(yè)需要逐步建立基于大模型的智能決策系統(tǒng),同時(shí)考慮如何增強(qiáng)系統(tǒng)的透明性,確保AI生成內(nèi)容的可追溯性與可靠性。此外,還應(yīng)密切關(guān)注相關(guān)法規(guī)政策,以預(yù)防不當(dāng)使用AI技術(shù)可能帶來(lái)的法律和倫理問(wèn)題。”
業(yè)內(nèi)人士眼中的DeepSeek
大模型行業(yè)的“黑馬”DeepSeek到底有哪些“本領(lǐng)”,將給石油和化工行業(yè)發(fā)展帶來(lái)哪些影響?《中國(guó)化工報(bào)》記者就此采訪了多名業(yè)內(nèi)人士。
廣州石化信息化專(zhuān)家張洪灝:DeepSeek最大的優(yōu)勢(shì)在于算法的改進(jìn)和優(yōu)化,這極大節(jié)省了算力和數(shù)據(jù)量,使得訓(xùn)練成本大幅降低。同時(shí),其低訓(xùn)練成本也會(huì)降低硬件的投入門(mén)檻,從而解決美國(guó)限制出口高端GPU“卡脖子”問(wèn)題。
DeepSeek-R1大模型在解決復(fù)雜數(shù)學(xué)問(wèn)題時(shí)擁有極強(qiáng)的“拆解能力”,能夠?qū)?fù)雜任務(wù)分解為更小的步驟并逐一執(zhí)行,從而提高其準(zhǔn)確性。打個(gè)比方,ChatGPT像“文科生”,擅長(zhǎng)編段子、寫(xiě)文章,而DeepSeek更像理科生,擅長(zhǎng)推理和深度思考。DeepSeek基于思維鏈,模型推理能力和深度思考能力極為強(qiáng)大。其通過(guò)建立智能化知識(shí)庫(kù),可改變知識(shí)的獲取模式,借助語(yǔ)言大模型整合各類(lèi)專(zhuān)業(yè)知識(shí),更加高效精準(zhǔn)地反饋給員工。
未來(lái),科學(xué)智能將是更高層次的人工智能大模型,將在新材料科學(xué)探索方面,解決科研人員面臨的缺乏數(shù)據(jù)和有效的數(shù)據(jù)分析方法、很多研究依靠經(jīng)驗(yàn)和試錯(cuò)方法、理論研究難以用來(lái)解決實(shí)際問(wèn)題等痛點(diǎn),使實(shí)驗(yàn)與模擬能力大幅提升,加速化工新材料、煉油化工催化劑的研發(fā)進(jìn)程。
北京化工大學(xué)教授、博士生導(dǎo)師辛春林:在推動(dòng)石油和化工行業(yè)轉(zhuǎn)型發(fā)展方面,DeepSeek將提升企業(yè)的數(shù)據(jù)分析與決策能力,助力研發(fā)與可持續(xù)創(chuàng)新,同時(shí)優(yōu)化生產(chǎn)運(yùn)營(yíng)與成本控制。
DeepSeek擁有強(qiáng)大的深度學(xué)習(xí)與自然語(yǔ)言處理能力,可以快速處理和分析海量行業(yè)數(shù)據(jù),包括生產(chǎn)數(shù)據(jù)、市場(chǎng)數(shù)據(jù)、供應(yīng)鏈數(shù)據(jù)等,幫助企業(yè)更準(zhǔn)確地預(yù)測(cè)市場(chǎng)需求、優(yōu)化生產(chǎn)計(jì)劃、調(diào)整供應(yīng)鏈策略,從而提高運(yùn)營(yíng)效率和經(jīng)濟(jì)效益。
DeepSeek通過(guò)分析原油價(jià)格波動(dòng)、成品油市場(chǎng)需求變化等數(shù)據(jù),能為企業(yè)提供決策支持,幫助制定更合理的采購(gòu)和銷(xiāo)售策略。
DeepSeek開(kāi)源模型的社區(qū)協(xié)作機(jī)制還加速了技術(shù)的迭代和創(chuàng)新。具體到新材料研發(fā)領(lǐng)域,DeepSeek可以通過(guò)高效文獻(xiàn)檢索與知識(shí)整合,快速獲取最新的研究成果和技術(shù)信息,幫助研究人員了解行業(yè)前沿動(dòng)態(tài),啟發(fā)創(chuàng)新思路。同時(shí),DeepSeek還可以協(xié)助進(jìn)行實(shí)驗(yàn)方案優(yōu)化與預(yù)測(cè),為研究人員提供優(yōu)化的實(shí)驗(yàn)方案和預(yù)測(cè)結(jié)果,提高研發(fā)效率和成功率。
另外,在生產(chǎn)運(yùn)營(yíng)與成本控制方面,DeepSeek可對(duì)石化生產(chǎn)過(guò)程中的各種數(shù)據(jù)進(jìn)行實(shí)時(shí)監(jiān)測(cè)和分析,及時(shí)發(fā)現(xiàn)生產(chǎn)過(guò)程中的異常情況和潛在問(wèn)題,幫助企業(yè)采取有效的措施進(jìn)行調(diào)整和優(yōu)化,提高生產(chǎn)效率和產(chǎn)品質(zhì)量。同時(shí),它還能幫助企業(yè)更準(zhǔn)確地掌握原材料采購(gòu)成本、能源消耗成本等信息,制定合理的成本控制策略,降低生產(chǎn)成本和碳排放。
江蘇華昌化工股份有限公司有關(guān)負(fù)責(zé)人:DeepSeek等深度分析模型在化工行業(yè)應(yīng)用前景廣闊,有望推動(dòng)全產(chǎn)業(yè)鏈智能化升級(jí)。在生產(chǎn)環(huán)節(jié),DeepSeek類(lèi)模型可通過(guò)對(duì)反應(yīng)參數(shù)、設(shè)備狀態(tài)等海量數(shù)據(jù)的實(shí)時(shí)分析,優(yōu)化工藝條件,提升原料轉(zhuǎn)化率,降低能耗;在質(zhì)量控制方面,結(jié)合計(jì)算機(jī)視覺(jué)技術(shù),可實(shí)現(xiàn)對(duì)產(chǎn)品微觀結(jié)構(gòu)的智能檢測(cè),提升缺陷識(shí)別準(zhǔn)確率;在預(yù)測(cè)性維護(hù)領(lǐng)域,通過(guò)建立設(shè)備數(shù)字孿生模型,提前預(yù)警關(guān)鍵機(jī)組故障,降低非計(jì)劃停機(jī)損失;在安全管控層面,可整合DCS、視頻監(jiān)控等多源數(shù)據(jù),實(shí)現(xiàn)動(dòng)態(tài)風(fēng)險(xiǎn)預(yù)警,減少人為誤判風(fēng)險(xiǎn)。隨著化工行業(yè)數(shù)字化轉(zhuǎn)型深化,深度分析技術(shù)將成為實(shí)現(xiàn)智能制造、綠色生產(chǎn)的關(guān)鍵驅(qū)動(dòng)力。
西南化工研究設(shè)計(jì)院變壓吸附所副總工程師梁軍:如果DeepSeek能夠提供接口,接入石化行業(yè)現(xiàn)有的服務(wù)程序中,將會(huì)更加適應(yīng)行業(yè)特點(diǎn),為行業(yè)提供更加精準(zhǔn)的規(guī)劃、資訊等方面的幫助。
捷誠(chéng)能源首席分析師閆建濤:DeepSeek強(qiáng)大的邏輯推理和預(yù)測(cè)功能,能為我們這些做能源深度研究的人提供更加有益的建議。在企業(yè)發(fā)展戰(zhàn)略層面,DeepSeek能夠提供更充分的數(shù)據(jù)支撐、更多的情景分析,市場(chǎng)分析和營(yíng)銷(xiāo)預(yù)測(cè)也會(huì)更精準(zhǔn);在生產(chǎn)經(jīng)營(yíng)層面,能夠引導(dǎo)企業(yè)管理更規(guī)范,風(fēng)險(xiǎn)控制更及時(shí),從而降低全產(chǎn)業(yè)鏈成本。
清華大學(xué)新聞學(xué)院教授沈少陽(yáng):如果說(shuō)傳統(tǒng)的生成式大模型是“兼職助理”,那么推理大模型就是“正式員工”,并且是一位對(duì)工作可以“兜底”的員工,包括理解需求、推理使用場(chǎng)景、尋找生產(chǎn)資料,并輸出完整的結(jié)構(gòu)化內(nèi)容。強(qiáng)大的推理大模型是“善解人意”的好助手,但它會(huì)因?yàn)椤疤斆鳌倍宰髦鲝?,出現(xiàn)對(duì)提示語(yǔ)“視而不見(jiàn)”的情況。因此現(xiàn)階段還需保持耐心,隨時(shí)接受推理大模型“罷工”,因?yàn)橥评泶竽P鸵残枰罢{(diào)教”。