新范式：AIGC推動(dòng)的數(shù)據(jù)要素產(chǎn)業(yè)價(jià)值促進(jìn)創(chuàng)新

來(lái)源: 百林哲 2024-08-08 17:42:36 瀏覽數(shù) (2299)

反饋

引言

大模型的發(fā)展與數(shù)據(jù)要素的價(jià)值創(chuàng)造互為因果，LLM正推動(dòng)著數(shù)據(jù)要素以“激發(fā)AGI”的全新范式創(chuàng)造價(jià)值。如何有效地整合規(guī)?；?、高質(zhì)量的數(shù)據(jù)以用于大型模型的訓(xùn)練，不僅是推進(jìn)大模型發(fā)展的窗口，也將成為進(jìn)一步發(fā)掘數(shù)據(jù)要素潛在價(jià)值的關(guān)鍵動(dòng)力。遵循技術(shù)發(fā)展的規(guī)律和市場(chǎng)的原則，將有助于各企業(yè)篩選并確定發(fā)展通用大模型與行業(yè)特定大模型的獨(dú)特路徑。

01 從人工智能發(fā)展歷程，看數(shù)據(jù)要素價(jià)值創(chuàng)造

自2022年末至2024年初，GPT以其卓越的表現(xiàn)引起了廣泛關(guān)注。隨著Sora的誕生，短時(shí)間內(nèi)智能的極限被不斷突破。我們目睹了數(shù)據(jù)價(jià)值的極大增強(qiáng)：大型模型通過(guò)吸收海量數(shù)據(jù)，掌握了人類的語(yǔ)言模式、邏輯推理，在諸如文本創(chuàng)作、多語(yǔ)種翻譯、情緒識(shí)別、復(fù)雜問(wèn)題解構(gòu)與執(zhí)行等眾多領(lǐng)域取得了翻天覆地的成就，甚至能夠在視頻制作中模擬物理動(dòng)作，因此，被譽(yù)為“世界模擬器”。數(shù)據(jù)不單是構(gòu)建這些復(fù)雜模型的根基，更是推進(jìn)它們持續(xù)進(jìn)化的源泉。

在美國(guó)20世紀(jì)70年代的一場(chǎng)語(yǔ)音識(shí)別競(jìng)賽中，展現(xiàn)了兩種截然不同的設(shè)計(jì)：一種是借助于人類豐富的知識(shí)，深入挖掘?qū)θ祟愓Z(yǔ)言的理解，通過(guò)手工編寫(xiě)的規(guī)則來(lái)描述語(yǔ)音與語(yǔ)言的結(jié)構(gòu)，例如將音節(jié)組合成單詞，或根據(jù)上下文確定單詞的發(fā)音。另一種是依賴于海量的數(shù)據(jù)，采用統(tǒng)計(jì)從大量語(yǔ)音中提取特征，基于數(shù)據(jù)的新方法展現(xiàn)出其優(yōu)越性，特別是在處理龐大、復(fù)雜和多變的語(yǔ)音數(shù)據(jù)時(shí)，新方法能夠更好地適應(yīng)不同的口音、方言和噪音環(huán)境。這場(chǎng)比賽的結(jié)果直接引發(fā)了自然語(yǔ)言處理技術(shù)路徑的重大轉(zhuǎn)變，統(tǒng)計(jì)學(xué)與計(jì)算能力逐漸崛起為該領(lǐng)域的主導(dǎo)。

2004年，DARPA挑戰(zhàn)賽。第一年的比賽宛如一場(chǎng)慘烈的車(chē)禍現(xiàn)場(chǎng)，被人們戲稱為“沙漠潰敗”。然而，僅僅一年半后，第二次賽事便再度啟動(dòng)，展現(xiàn)出兩種截然不同的技術(shù)路線：一種是依托于人類豐富的經(jīng)驗(yàn)和總結(jié)，例如預(yù)先探查沙漠路徑，為車(chē)輛設(shè)計(jì)特殊程序以突破路途中的障礙物；另一種則是依賴于龐大的數(shù)據(jù)，通過(guò)機(jī)器學(xué)習(xí)來(lái)學(xué)習(xí)道路特征進(jìn)行導(dǎo)航和脫障，同時(shí)加強(qiáng)對(duì)道路數(shù)據(jù)的實(shí)時(shí)采集，使無(wú)人車(chē)能夠“隨機(jī)應(yīng)變”。這一次，依舊是依賴數(shù)據(jù)的第二條技術(shù)路線取得了勝利。從沙漠賽道到城市街道，從基本導(dǎo)航到復(fù)雜的交通規(guī)則遵守，這些挑戰(zhàn)賽成為無(wú)人駕駛技術(shù)發(fā)展的重要里程碑。

2016年，AlphaGo憑借數(shù)百萬(wàn)局人類棋手的對(duì)局?jǐn)?shù)據(jù)進(jìn)行訓(xùn)練，掌握了高水平的棋局策略和模式。然而，第二個(gè)版本AlphaGo Zero卻完全依賴于自我對(duì)弈生成的數(shù)據(jù)進(jìn)行迭代訓(xùn)練，從而獲得了超越人類棋手的知識(shí)和經(jīng)驗(yàn)，達(dá)到了前所未有的圍棋境界。這每一次不同類型的比賽，都是算法從統(tǒng)計(jì)、機(jī)器學(xué)習(xí)發(fā)展到深度學(xué)習(xí)的過(guò)程，也是算力從單片機(jī)發(fā)展到GPU的過(guò)程，更是人類經(jīng)驗(yàn)逐步讓渡于海量數(shù)據(jù)的過(guò)程，同時(shí)也是人類帶著數(shù)據(jù)沖擊機(jī)器智能新上限的過(guò)程。

我們目睹了數(shù)據(jù)要素在各行各業(yè)中通過(guò)投入替代、價(jià)值倍增以及資源優(yōu)化三種方式創(chuàng)造價(jià)值，發(fā)揮著至關(guān)重要的作用?；仡櫲斯ぶ悄艿陌l(fā)展歷程，我們可以看到算法從統(tǒng)計(jì)學(xué)習(xí)、機(jī)器學(xué)習(xí)逐步演化為深度學(xué)習(xí)，計(jì)算能力也從單片機(jī)發(fā)展至GPU，這一系列變革反映了人類經(jīng)驗(yàn)向海量數(shù)據(jù)的過(guò)渡，同時(shí)也是人類攜帶數(shù)據(jù)挑戰(zhàn)機(jī)器智能極限的歷程。從依賴經(jīng)驗(yàn)到主要從數(shù)據(jù)中挖掘規(guī)律，從專注于解決單一問(wèn)題到促進(jìn)AGI的發(fā)展，這些轉(zhuǎn)變不僅體現(xiàn)了數(shù)字要素的價(jià)值，更要求我們以全新視角重新評(píng)估其重要性。

在近日，蘿卜快跑引起了廣泛關(guān)注，其在一些城市的實(shí)踐雖顯示出些許遲鈍于道路路況的反應(yīng)，但總體表現(xiàn)證明了其實(shí)施的可行性。隨之，將有越來(lái)越多的網(wǎng)約車(chē)司機(jī)面臨由無(wú)人駕駛技術(shù)所替代的局面，這仿佛重現(xiàn)了農(nóng)業(yè)機(jī)械取代農(nóng)民的傳統(tǒng)耕作，移動(dòng)支付淘汰傳統(tǒng)支付方式的歷史場(chǎng)景。

展望未來(lái)20年，車(chē)路網(wǎng)云的新時(shí)代將為近地空中飛行打開(kāi)無(wú)盡的發(fā)展空間與可能性。在未來(lái)的世界里，或許我們將見(jiàn)證如同電影中描繪的場(chǎng)景：地面行駛著無(wú)人駕駛汽車(chē)，而低空則被各型飛行器占據(jù)。諸如空中出租車(chē)和無(wú)人配送等新型服務(wù)模式的涌現(xiàn)，預(yù)示著未來(lái)城市交通將向三維空間延伸。

隨著車(chē)路網(wǎng)云技術(shù)的不斷進(jìn)步，那些掌握著最新一代城市交通技術(shù)、人工智能技術(shù)、云計(jì)算技術(shù)的國(guó)家，其發(fā)展效率必將提升至新的高度。技術(shù)的升級(jí)正推動(dòng)整個(gè)社會(huì)效率的持續(xù)提升，這一趨勢(shì)勢(shì)不可擋。同時(shí)，這也見(jiàn)證了數(shù)據(jù)要素通過(guò)投入替代、價(jià)值倍增和資源優(yōu)化等方式，發(fā)揮了巨大的作用。這也是中國(guó)在過(guò)去二十年里邁向數(shù)字化生活和生產(chǎn)方式的根本動(dòng)力。

02 算力和數(shù)據(jù)是基礎(chǔ)設(shè)施層的關(guān)鍵，中國(guó)正加速挖掘數(shù)據(jù)價(jià)值

圖：智算中心的基礎(chǔ)架構(gòu)

在數(shù)字化的新時(shí)代，數(shù)據(jù)已化身為重要的生產(chǎn)資料，而算力則成為處理這些數(shù)據(jù)的強(qiáng)勁引擎。伴隨著人工智能、大數(shù)據(jù)、云計(jì)算等前沿技術(shù)的飛速進(jìn)步，算力與數(shù)據(jù)的關(guān)鍵作用愈發(fā)顯著，它們共同構(gòu)筑了當(dāng)代信息社會(huì)的基礎(chǔ)設(shè)施層。在這樣的大背景下，中國(guó)正致力于深化數(shù)據(jù)價(jià)值的挖掘，推動(dòng)經(jīng)濟(jì)與社會(huì)向數(shù)字化方向的全面轉(zhuǎn)型。

圖：中國(guó)通用算力規(guī)模與預(yù)測(cè)

算力、存儲(chǔ)、網(wǎng)絡(luò)構(gòu)建智算中心作為基礎(chǔ)，智算中心的基于最新AI理論和領(lǐng)先的AI計(jì)算架構(gòu)，算力技術(shù)與算法模型是其中的核心關(guān)鍵，算力技術(shù)以AI芯片、AI服務(wù)器、AI集群為載體，而當(dāng)前算法模型的發(fā)展趨勢(shì)以AI大模型為代表。

智能算力規(guī)模正在快速增長(zhǎng)，復(fù)雜的模型和大規(guī)模的訓(xùn)練需要大規(guī)模的高算力支持，這不僅需要消耗大量計(jì)算資源，而且對(duì)算力的速度、精度、性能也提出更高要求。

AI生態(tài)加速收斂，大模型技術(shù)逐步收斂，生態(tài)走向聚合，模型更收斂、框架更歸一。為了開(kāi)發(fā)更高性能的 AI大模型需要更強(qiáng)的算力平臺(tái)，算力底座技術(shù)門(mén)檻將提高，未來(lái)訓(xùn)練核心依賴集群系統(tǒng)能力。

圖：算力底座技術(shù)門(mén)檻提高

算力，作為數(shù)據(jù)處理的核心能力，其發(fā)展水平直接關(guān)系到一個(gè)國(guó)家的科技創(chuàng)新能力和產(chǎn)業(yè)競(jìng)爭(zhēng)力。中國(guó)在算力建設(shè)方面投入巨大，不僅在超級(jí)計(jì)算機(jī)領(lǐng)域取得了顯著成就，連續(xù)多年位居全球超算TOP500的數(shù)量首位，而且在云計(jì)算、邊緣計(jì)算等領(lǐng)域也展現(xiàn)出強(qiáng)勁的發(fā)展勢(shì)頭。通過(guò)構(gòu)建高性能的算力平臺(tái)，中國(guó)為各行各業(yè)提供了強(qiáng)大的數(shù)據(jù)處理能力，支撐起復(fù)雜的數(shù)據(jù)分析和模型訓(xùn)練需求。

數(shù)據(jù)的價(jià)值在于其能夠被有效利用，政府高度重視數(shù)據(jù)資源的整合與開(kāi)放，推動(dòng)公共數(shù)據(jù)資源的開(kāi)發(fā)利用，鼓勵(lì)企業(yè)間的數(shù)據(jù)共享與合作。通過(guò)建立數(shù)據(jù)交易市場(chǎng)、完善數(shù)據(jù)治理體系，國(guó)內(nèi)逐步釋放數(shù)據(jù)的潛在價(jià)值，促進(jìn)數(shù)據(jù)資產(chǎn)化、服務(wù)化。同時(shí)，也在積極探索數(shù)據(jù)隱私保護(hù)和安全使用的法律法規(guī)，確保數(shù)據(jù)價(jià)值的挖掘在合法合規(guī)的框架內(nèi)進(jìn)行。

在應(yīng)用層面，中國(guó)將算力和數(shù)據(jù)的優(yōu)勢(shì)轉(zhuǎn)化為實(shí)際的生產(chǎn)力。無(wú)論是在智能制造、智慧城市建設(shè)，還是在金融科技、醫(yī)療健康等領(lǐng)域，數(shù)據(jù)驅(qū)動(dòng)的決策和智能化的服務(wù)逐漸成為常態(tài)。例如，通過(guò)大數(shù)據(jù)分析，金融機(jī)構(gòu)能夠更準(zhǔn)確地評(píng)估風(fēng)險(xiǎn)，提供個(gè)性化的金融產(chǎn)品；而智能制造則通過(guò)實(shí)時(shí)數(shù)據(jù)監(jiān)控和分析，優(yōu)化生產(chǎn)流程，提高產(chǎn)品質(zhì)量和生產(chǎn)效率。

未來(lái)，隨著5G網(wǎng)絡(luò)的普及和IOT技術(shù)的發(fā)展，數(shù)據(jù)的產(chǎn)生和應(yīng)用將更加廣泛。中國(guó)將繼續(xù)加大對(duì)算力和數(shù)據(jù)基礎(chǔ)設(shè)施的投入，推動(dòng)技術(shù)創(chuàng)新和產(chǎn)業(yè)升級(jí)，構(gòu)建更加完善的數(shù)據(jù)生態(tài)系統(tǒng)?？傊懔蛿?shù)據(jù)是現(xiàn)代社會(huì)不可或缺的基礎(chǔ)設(shè)施，加速挖掘數(shù)據(jù)價(jià)值，它們是推動(dòng)經(jīng)濟(jì)增長(zhǎng)和社會(huì)進(jìn)步的關(guān)鍵資源。

03 AGI的發(fā)展遵循擴(kuò)展定律

AGI?的發(fā)展不僅體現(xiàn)在技術(shù)的進(jìn)步上，?還涉及到算力的持續(xù)提升和模型規(guī)模的演進(jìn)升級(jí)。?隨著AI變得越來(lái)越流行和易于獲取，?研究想法的增長(zhǎng)無(wú)疑加速了技術(shù)的發(fā)展。尤其是在算力層面，即便面對(duì)著摩爾定律的放緩趨勢(shì)，片內(nèi)互聯(lián)技術(shù)的突破仍為單個(gè)芯片設(shè)計(jì)的規(guī)模拓展與能效提升開(kāi)辟了新的工程成就之路。?這些技術(shù)進(jìn)步為AGI的發(fā)展提供了強(qiáng)大的基礎(chǔ)。

擴(kuò)展定律，作為人工智能產(chǎn)業(yè)內(nèi)部破解困局的共識(shí)：通過(guò)運(yùn)用更龐大的模型架構(gòu)，配備更強(qiáng)大的計(jì)算能力，從更廣泛的數(shù)據(jù)集中挖掘更深層次的隱含知識(shí)與普遍適用的能力。從GPT 1演進(jìn)至GPT 3的過(guò)程中不斷探索實(shí)驗(yàn)，當(dāng)參數(shù)規(guī)模增加至百倍之多，訓(xùn)練數(shù)據(jù)集增至五十倍之際，GPT 3.5展現(xiàn)了能力的“涌現(xiàn)”：全球逾億用戶蜂擁而至，驗(yàn)證了該模型能夠以近乎類人的方式理解上下文和進(jìn)行對(duì)話交流；同時(shí)，此模型還展現(xiàn)出了更高級(jí)的泛化能力和思維鏈能力，能夠?qū)τ谖粗榫匙龀龊侠淼耐茢啵?fù)雜問(wèn)題分解為簡(jiǎn)易任務(wù)，逐步解決。由此塑造出的AGI（人工通用智能）初步形態(tài)：一個(gè)基礎(chǔ)且通用的大型模型能夠進(jìn)行內(nèi)容創(chuàng)作，能夠革新程序編碼、文檔編輯等多樣化工具軟件的使用體驗(yàn)，能夠“轉(zhuǎn)生為”機(jī)器人，借助具身智能加快機(jī)器人研發(fā)的步伐，并且改變了科學(xué)研究的傳統(tǒng)范式，促成了生物醫(yī)學(xué)、材料科學(xué)、工業(yè)仿真等多個(gè)領(lǐng)域的新突破。

中國(guó)的LLM型路線見(jiàn)證著數(shù)據(jù)要素的作用，比如阿里巴巴通義千問(wèn)，自2023年8月以來(lái)，其連續(xù)發(fā)布了7B、14B、72B及200B參數(shù)版本，隨著參數(shù)規(guī)模的壯大，模型的能力亦顯著提高。AI研究了幾十年，唯一有效的東西便是scaling law（尺度定律），就是不斷放大數(shù)據(jù)、算力和算法這幾樣生產(chǎn)要素。

AGI正逐漸成為推動(dòng)社會(huì)進(jìn)步和產(chǎn)業(yè)革新的關(guān)鍵力量，技術(shù)不斷進(jìn)步，從最初的專家系統(tǒng)到機(jī)器學(xué)習(xí)，再到深度學(xué)習(xí)的興起，AI技術(shù)已經(jīng)取得了顯著的成就。隨著計(jì)算能力的增強(qiáng)、大數(shù)據(jù)的積累和算法的創(chuàng)新，AGI成為了科技發(fā)展的下一個(gè)里程碑。AGI的發(fā)展背景是復(fù)雜多元的，涉及技術(shù)進(jìn)步的內(nèi)在邏輯、經(jīng)濟(jì)社會(huì)的外在需求、倫理法律的約束條件以及國(guó)際競(jìng)爭(zhēng)合作的大環(huán)境。未來(lái)，AGI的發(fā)展將在這些因素的共同作用下不斷推進(jìn)，同時(shí)也需要全社會(huì)的智慧和努力來(lái)確保其健康、有序和有益的發(fā)展。

此外，AI規(guī)模法則的提出預(yù)示著計(jì)算資源的可持續(xù)增長(zhǎng)與成本的持續(xù)降低，從而為AGI的發(fā)展奠定了物理上的可能性。OpenAI首席執(zhí)行官山姆·奧特曼所提出的AI時(shí)代摩爾定律——宇宙中的智能數(shù)量每18個(gè)月翻一番，進(jìn)一步凸顯了AI技術(shù)發(fā)展的速率與規(guī)模。

在模型方面，隨著算力的不斷強(qiáng)化，基于大模型的AGI智能能力已遠(yuǎn)超傳統(tǒng)適用于特定場(chǎng)合的中小型AI模型。一旦完備的通用AI得以實(shí)現(xiàn)，其將在AI+各種場(chǎng)景下展現(xiàn)廣泛的應(yīng)用潛力，同時(shí)算法的逐步確立也為AI技術(shù)的持續(xù)優(yōu)化開(kāi)辟了新的可能性。這種相互作用的關(guān)系促進(jìn)了AGI技術(shù)的不斷前進(jìn)與發(fā)展。AGI的進(jìn)步無(wú)疑遵循著擴(kuò)展的原則，通過(guò)算力的系統(tǒng)提升與模型規(guī)模的逐步升級(jí)，推動(dòng)著AGI技術(shù)的迅猛前行。

04 AGI領(lǐng)域應(yīng)用層創(chuàng)新發(fā)展

OpenAI的聯(lián)合創(chuàng)始人伊爾亞·蘇茨克維，在一次深入的訪談中，曾以一句精辟而抽象的話語(yǔ)概括了人工智能模型的本質(zhì)：“The models just want to learn！”此言并非賦予了模型以生命般的學(xué)習(xí)欲望，而是揭示了模型被設(shè)計(jì)的初衷——從浩如瀚海的數(shù)據(jù)中自動(dòng)汲取隱含的規(guī)則與經(jīng)驗(yàn)，借助算法的巧思與算力的增強(qiáng)，不斷優(yōu)化學(xué)習(xí)的效率，拓寬學(xué)習(xí)的邊界。

AGI市場(chǎng)，猶如一座宏偉的大廈，其結(jié)構(gòu)復(fù)雜而有序，主要分為基礎(chǔ)設(shè)施層、模型層、中間層以及應(yīng)用層。大模型在應(yīng)用層的探索與創(chuàng)新，如同點(diǎn)亮了這座大廈的璀璨燈塔，為AI領(lǐng)域帶來(lái)了前所未見(jiàn)的機(jī)遇。隨著計(jì)算能力的飛躍提升，數(shù)據(jù)量的激增，以及算法的持續(xù)優(yōu)化，大模型已悄然嶄露頭角，在自然語(yǔ)言處理（NLP）、計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別等多個(gè)領(lǐng)域展現(xiàn)出了強(qiáng)大的能力。這些顯著的進(jìn)步，使得大模型在追尋人工通用智能（AGI）的道路上，愈發(fā)展現(xiàn)出全球領(lǐng)先的潛力。

AGI，這片神奇的土地，以其無(wú)限的可能性與挑戰(zhàn)，吸引著無(wú)數(shù)探索者。它要求模型不僅能在某一領(lǐng)域內(nèi)專精，更要具備跨領(lǐng)域的知識(shí)表示與推理能力，如同一位博學(xué)多才的智者，能自如地穿梭于不同的領(lǐng)域，應(yīng)對(duì)各種挑戰(zhàn)。同時(shí)，AGI還需具備自適應(yīng)學(xué)習(xí)的能力，猶如生命體一般，能根據(jù)不同的任務(wù)與環(huán)境，靈活地調(diào)整學(xué)習(xí)的策略與參數(shù)。

然而，真正的智能不僅僅是邏輯的推理與知識(shí)的積累，更是情感的理解與社交的互動(dòng)。因此，大模型在追求AGI的道路上，還需賦予其情感與社交智能，使其能夠更加深刻地理解人類的情感，適應(yīng)人類社會(huì)的需求。

在智能的征途上，倫理與道德的指引不可或缺。大模型在實(shí)現(xiàn)AGI的旅途中，必須植入倫理與道德的判斷能力，確保其在決策的每一步都能遵循人類的價(jià)值觀與道德規(guī)范，成為維護(hù)人類福祉的守護(hù)者。人機(jī)協(xié)作與交互，是AGI融入人類社會(huì)的重要橋梁。大模型應(yīng)具備與人類協(xié)作與交互的能力，能在人類的生產(chǎn)、生活中提供智能化的服務(wù)與支持，成為人類智慧的延伸，生活的益友。

因此，大模型在應(yīng)用層的探索與創(chuàng)新，為AGI的實(shí)現(xiàn)注入了蓬勃的生機(jī)。通過(guò)算法的不斷優(yōu)化、應(yīng)用領(lǐng)域的持續(xù)拓展、智能水平的日益提升，大模型正穩(wěn)步邁向AGI的高峰，為社會(huì)帶來(lái)更為廣泛、更為深入的智能化服務(wù)，開(kāi)啟一個(gè)嶄新的智能時(shí)代。

圖：AGI市場(chǎng)的四層結(jié)構(gòu)示意圖

應(yīng)用行業(yè)現(xiàn)狀

· 營(yíng)銷和零售：?AGI應(yīng)用顛覆營(yíng)銷領(lǐng)域，?推動(dòng)營(yíng)銷效率提升和體驗(yàn)優(yōu)化。?

· 金融：?金融行業(yè)整體處于AGI應(yīng)用探索期，?逐漸向產(chǎn)品測(cè)試期邁進(jìn)。?

· 企業(yè)應(yīng)用：?AGI應(yīng)用覆蓋企業(yè)全流程，?注重效率、?知識(shí)管理和流程優(yōu)化。?

· 教育：?集中在應(yīng)用探索和產(chǎn)品測(cè)試階段，?學(xué)生側(cè)應(yīng)用速度快、?探索程度深。

05 通用大模型與行業(yè)大模型并駕齊驅(qū)，小模型市場(chǎng)需求更大

在大模型的演進(jìn)之路上，每一次通用大模型的力量提升，皆如潮水般席卷，對(duì)散落的應(yīng)用與解決方案形成無(wú)可匹敵之勢(shì)；大模型所蘊(yùn)含的通用智能之價(jià)值，勢(shì)必超越那些零散場(chǎng)景應(yīng)用的總和。然而，在AI的廣袤天地中，通用大模型與行業(yè)大模型各承其妙，各有千秋。通用大模型，猶如璀璨星辰，于眾多領(lǐng)域與任務(wù)中展現(xiàn)卓越性能；行業(yè)大模型，則如精密的鐘表，針對(duì)特定行業(yè)或領(lǐng)域精準(zhǔn)調(diào)校，專業(yè)定制。盡管通用大模型在諸多領(lǐng)域捷報(bào)頻傳，但行業(yè)大模型仍不可或缺，當(dāng)應(yīng)用場(chǎng)景對(duì)反應(yīng)速度有極高要求時(shí)，我們或許更需依賴一個(gè)更為小型的模型。這類模型雖不具備大模型的普適智能，卻在特定垂直場(chǎng)景中展現(xiàn)出無(wú)可比擬的優(yōu)勢(shì)。此時(shí)，對(duì)模型進(jìn)行精細(xì)調(diào)整，滿足定制化需求，追求實(shí)時(shí)性與高效率，將行業(yè)數(shù)據(jù)注入其中，打造出規(guī)模更小、垂直更深的行業(yè)模型，方能滿足市場(chǎng)那更為龐大的需求。

在通用大模型的雄厚基礎(chǔ)之上，行業(yè)大模型得以筑建。這些通用模型，蘊(yùn)含著深邃的知識(shí)儲(chǔ)備與卓越的泛化能力，不僅為行業(yè)大模型奠定了堅(jiān)實(shí)的知識(shí)根基，并極大地提升了互動(dòng)體驗(yàn)的豐富度；同時(shí)，它們還大幅降低了從零起步訓(xùn)練模型所需的海量數(shù)據(jù)和計(jì)算資源，顯著提高了行業(yè)大模型開(kāi)發(fā)及其應(yīng)用的效率和成效。經(jīng)由對(duì)通用大模型實(shí)施提示工程、檢索增強(qiáng)生成、精調(diào)、持續(xù)預(yù)訓(xùn)練/后訓(xùn)練等手段，模型能夠更精準(zhǔn)地適應(yīng)特定數(shù)據(jù)集或任務(wù)需求，進(jìn)而衍生出行業(yè)大模型的特定版本（即模型有變），或賦予其行業(yè)大模型所具備的功能（即模型不變）。。如今，市場(chǎng)上涌現(xiàn)的眾多行業(yè)大模型，如金融、法律、教育、傳媒、文旅等領(lǐng)域，大多基于Llama、SD、GLM、Baichuan等國(guó)內(nèi)外廣為人知的開(kāi)源大模型而構(gòu)建。

在專業(yè)領(lǐng)域內(nèi)，大型模型往往需根據(jù)特定數(shù)據(jù)集與任務(wù)進(jìn)行精細(xì)調(diào)整或定制開(kāi)發(fā)。針對(duì)B端客戶群體，每一家企業(yè)均有其獨(dú)樹(shù)一幟的商業(yè)運(yùn)作、數(shù)據(jù)資產(chǎn)及業(yè)務(wù)流程，對(duì)于大型模型所寄望解決的關(guān)鍵問(wèn)題亦各具特色，個(gè)性化需求普遍可見(jiàn)。因此，供應(yīng)商所提供的行業(yè)大型模型不單是產(chǎn)品與工具的集合，更包含必要的定制化服務(wù)與支援，甚至于需要客戶的積極參與和共同建設(shè)。可以這般理解：行業(yè)大型模型中的產(chǎn)品宛如“待裝修之房屋”，客戶必須依據(jù)各自用途進(jìn)行“內(nèi)部裝潢”方能真正滿足其需求。例如，借助TI平臺(tái)之力，構(gòu)建了行業(yè)大模型的精選商鋪，推出了MaaS服務(wù)，為客戶提供了一系列周全的行業(yè)大模型解決方案，覆蓋模型預(yù)訓(xùn)練、精細(xì)調(diào)整及智能應(yīng)用開(kāi)發(fā)等多個(gè)方面。

行業(yè)大模型需

重視全生命周期的安全保障機(jī)制

在大型模型的數(shù)據(jù)處理流程中，相較于傳統(tǒng)模型，其復(fù)雜度更高，諸多不可控的因素孕育著不容輕視的安全隱患，涉獵數(shù)據(jù)隱私保護(hù)、推理過(guò)程安全、內(nèi)容審查安全、版權(quán)防護(hù)等諸多方面。這便迫切需求一套系統(tǒng)化的安全防御機(jī)制，對(duì)于行業(yè)大型模型而言，此需求尤為顯著。安全廠商倡導(dǎo)的大型模型安全框架，針對(duì)模型全生命周期內(nèi)的各類安全風(fēng)險(xiǎn)，提供了原則與方法上的指導(dǎo)，覆蓋內(nèi)生安全及應(yīng)用安全兩個(gè)維度，助力體系解決大型模型在生產(chǎn)研發(fā)過(guò)程中遇到的基礎(chǔ)設(shè)施、數(shù)據(jù)、模型、算法等各層面的安全風(fēng)險(xiǎn)，以及不合理應(yīng)用可能觸發(fā)的決策失控風(fēng)險(xiǎn)等。在此之中，針對(duì)大型模型生產(chǎn)研發(fā)過(guò)程中內(nèi)在的安全問(wèn)題，應(yīng)由大型模型研發(fā)團(tuán)隊(duì)與安全團(tuán)隊(duì)共同聚焦，通過(guò)安全評(píng)估等機(jī)制確保大型模型的應(yīng)用能夠達(dá)成安全目標(biāo)?？偠灾?，將安全舉措具體實(shí)施于研發(fā)、訓(xùn)練、測(cè)試、部署發(fā)布等每一個(gè)環(huán)節(jié)，同時(shí)，也是業(yè)界共識(shí)，旨在提升大型模型的安全水平，其中可采納的措施包括prompt安全評(píng)估、紅藍(lán)對(duì)抗演練、源代碼的安全防護(hù)、基礎(chǔ)設(shè)施漏洞的安全防護(hù)等多種方式。

2024CSDI 9月20-22日

共話科技應(yīng)用元年

正值LLM時(shí)代，智能軟件研發(fā)的技術(shù)、范式和工具都發(fā)生了巨大的變化。無(wú)論是依賴于深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)和大數(shù)據(jù)技術(shù)。還是軟件研發(fā)的范式從傳統(tǒng)的規(guī)則驅(qū)動(dòng)和專家系統(tǒng)轉(zhuǎn)變?yōu)閿?shù)據(jù)驅(qū)動(dòng)和模型驅(qū)動(dòng)。大量的智能軟件研發(fā)工具和框架應(yīng)運(yùn)而生。數(shù)據(jù)成為了智能軟件研發(fā)的核心。智算資源的需求與訓(xùn)練部署復(fù)雜的模型，開(kāi)發(fā)者需要利用高性能的硬件（如GPU、TPU等）和分布式計(jì)算技術(shù)（如云計(jì)算、集群計(jì)算、數(shù)據(jù)庫(kù)等）。這些技術(shù)應(yīng)用便是IT企業(yè)探尋與研究的必選題。

2024CSDI峰會(huì)將以數(shù)智+躍遷為主旨，于9月20-22日深圳召開(kāi)，攜國(guó)內(nèi)眾多頂尖優(yōu)秀企業(yè)，面向技術(shù)管理者和一線技術(shù)帶頭人。抽絲剝繭：以業(yè)務(wù)與新興技術(shù)應(yīng)用為導(dǎo)向的：大數(shù)據(jù)開(kāi)放架構(gòu)、AIGC產(chǎn)品創(chuàng)新、智能化開(kāi)發(fā)、LLM智能終端創(chuàng)新、LLM數(shù)據(jù)智能、多模態(tài)LLM、大模型規(guī)?；瘧?yīng)用、云架構(gòu)生態(tài)、質(zhì)量工程效能、組織戰(zhàn)略、智能化開(kāi)發(fā)、安全LLM等先進(jìn)數(shù)字技術(shù)進(jìn)行全面解析，幫組企業(yè)構(gòu)建和借鑒適合自身的技術(shù)應(yīng)用與業(yè)務(wù)實(shí)踐。

微信圖片_20240808153746_compressed

總結(jié)

科技浩瀚星海中，數(shù)據(jù)要素的創(chuàng)新如同璀璨星辰，與科技發(fā)展交織成一張推動(dòng)技術(shù)進(jìn)步的巨網(wǎng)。智能研發(fā)與應(yīng)用創(chuàng)新之舟，正乘著這股浪潮，破浪前行，其航向呈現(xiàn)出多元化的航跡、跨界融合的風(fēng)帆以及可持續(xù)發(fā)展的舵盤(pán)。在技術(shù)與市場(chǎng)這對(duì)孿生潮汐的影響下，企業(yè)們?nèi)缤腔鄣暮胶＜?，將不同領(lǐng)域的技術(shù)與知識(shí)匯于一爐，鍛造出更具競(jìng)爭(zhēng)力的產(chǎn)品與應(yīng)用之錨。

AI的洪流、大數(shù)據(jù)的海洋，云計(jì)算的蒼穹下，先進(jìn)數(shù)字化技術(shù)如星辰般璀璨，AI Agent作為自主決策和任務(wù)執(zhí)行的智能體，在金融，醫(yī)療，制造業(yè)，展現(xiàn)出卓越的效能。它運(yùn)用大型語(yǔ)言模型（LLM）作為羅盤(pán)，理解復(fù)雜的語(yǔ)言指令，生成自然流暢的語(yǔ)言回應(yīng)，極大地提升了人機(jī)交互的航速與平穩(wěn)。

物聯(lián)網(wǎng)（IOT）應(yīng)用則如精細(xì)的藍(lán)圖，通過(guò)捕捉精準(zhǔn)的產(chǎn)品數(shù)據(jù)，為研發(fā)的精準(zhǔn)優(yōu)化。

數(shù)字員工在AGI應(yīng)用市場(chǎng)將形成人才匯聚效應(yīng)，不僅高效完成自動(dòng)化和智能化任務(wù)，更將深度參與企業(yè)決策，提供精準(zhǔn)數(shù)據(jù)支持和智能建議，助力企業(yè)提升競(jìng)爭(zhēng)力。

微軟、阿里巴巴、小米、騰訊、華為、360、平安集團(tuán)、渣打銀行、工商銀行、招商銀行、隨行付、易方達(dá)、長(zhǎng)亮科技、南方電網(wǎng)、廣州銀聯(lián)、穆迪信息、拍拍貸、宇信集團(tuán)、投哪兒金融、天維信息、薩摩耶、華泰證券、招商證券、國(guó)信證券、陸金所、廣發(fā)基金、中國(guó)銀聯(lián)、恒天軟件、天陽(yáng)宏業(yè)、中數(shù)通、電信規(guī)劃設(shè)計(jì)院、oppo、步步高、vivo、愛(ài)立信、百富計(jì)算機(jī)、廈門(mén)航空、福建聯(lián)迪、網(wǎng)易、星網(wǎng)視易、升騰科技、視睿電子、飛利浦、金山軟件、金山游戲、歐特克、順豐、深信服、歡聚時(shí)代、虎牙、珠海健康云、優(yōu)視科技（UC）、52TT、天翼云、凱米網(wǎng)絡(luò)、電信設(shè)計(jì)院、ADmaster、博思軟件、網(wǎng)宿科技、珍愛(ài)網(wǎng)、金蝶、唯品會(huì)、中國(guó)聯(lián)通、中國(guó)移動(dòng)、傳動(dòng)數(shù)碼、無(wú)限極、中電、珠海網(wǎng)博、中軟、同盾科技、杭州順網(wǎng)、藍(lán)凌軟件、長(zhǎng)園深瑞、中南民航、遠(yuǎn)光軟件、廣聯(lián)達(dá)、中國(guó)電信、傳音、利通、物理研究所等。

人工智能 ChatGPT 文心一言

0 人點(diǎn)贊