展開
湖北國聯(lián)計算機科技有限公司
  • 首頁HOME
  • 公司簡介INTRODUCTION
  • 安全防御DEFENSE
  • 軟件開發(fā)SOFTWARE
  • 物聯(lián)網(wǎng)IOT
  • 運行維護SRE
  • 成功案例CASE
  • 聯(lián)系我們CONTACT
  • IndustryEvents |業(yè)界動態(tài)

    從Infra到Agent,AI創(chuàng)新的無盡前沿
    來源:湖北國菱計算機科技有限公司-湖北國聯(lián)計算機科技有限公司-荊州網(wǎng)站建設-荊州軟件開發(fā)-政府網(wǎng)站建設公司 時間:2025-03-10

    2024年回顧

    2024年:計算機暫未走出獨立行情

    2025年展望:以AI為核心的科技創(chuàng)新

    大模型降本趨勢顯著,為應用爆發(fā)奠定基礎。 2024年7月,OpenAI 發(fā)布高性價比模型 GPT-4o mini,性能逼近原版 GPT-4,成 本相比 GPT-3.5 Turbo 便宜 60%以上。Sam Altman表示,兩年前OpenAI最好的模型還是 GPT-3 的 text-davinci003 版本,與 GPT-4o mini相比性能差得多,但卻貴 100 倍,即大模型成本在兩年內(nèi)下降了 99%。按照這個趨勢,我們預計大模型的成本有望 繼續(xù)快速下降,每百萬 tokens的推理成本或?qū)⒃趦赡陜?nèi)下降2個數(shù)量級至美分量級。 生成式AI領域?qū)⒉粩嘤楷F(xiàn)新的技術成果,為應用生態(tài)建設注入活力。更強大的基礎模型如OpenAI的Orion、Anthropic的Claude 3.5 Opus等有望發(fā)布。Agent生態(tài)有望逐步繁榮。硅谷投資風向標YC的AI初創(chuàng)數(shù)量越來越多,大模型創(chuàng)新不止,在今年S24共255 個項目中,其中有170個與AI相關,占比達到67%。11月,在接受YC總裁Garry Tan采訪時,針對最后一個問題“2025年什么會讓 你期待與興奮”,Sam Altman回答“AGI”。

    生成式AI模型性能不斷提升,或處于更大規(guī)模放量前夕,推理需求有望高速增長。推理算力未來有望超過訓練算力,最終訓練芯片與推理 芯片數(shù)量之比或達到2:8。目前生成式AI模型仍處于快速迭代,各廠商相互追趕的階段,隨著模型性能的逐步穩(wěn)定和應用的陸續(xù)落地,算 力的推理需求有望超過訓練需求。而推理需求與訓練需求在計算量、精度要求以及部署位置上存在差異。一方面,訓練需求的精度要求較 推理需求更高,因此訓練芯片也就要求有更高的精度范圍,在高精度場景下同樣需要具備較強的性能。另一方面,訓練芯片主要部署在數(shù) 據(jù)中心(云側(cè)),推理芯片則會兼顧云側(cè)與邊緣側(cè)的算力需求。根據(jù)施耐德電氣的測算,到2028年人工智能的推理負載有望占比達到85%。 我們認為,隨著AI應用發(fā)展,算力芯片在推理側(cè)會呈現(xiàn)更多的產(chǎn)業(yè)機遇,高速推理將成為AI芯片發(fā)展的新坐標。1)高速推理使得開發(fā)者可 以在極短時間內(nèi)完成大模型應用的測試和調(diào)優(yōu)循環(huán),不僅能加速開發(fā)過程,還有助于更深入全面的模型評估和應用優(yōu)化;2)高速推理還意 味著現(xiàn)有大模型交互效率的飛躍,將大大縮小人機交互的時間差,為更自然、更流暢的交互體驗鋪平了道路。 軟件層面,通過架構(gòu)迭代、 流式輸入、量化等方式,GPT-4o延時相對GPT-4已下降一個數(shù)量級;硬件層面,高速推理探索不斷,AI芯片推理速度有望更上一層樓。

    2025年展望:國產(chǎn)化的本土產(chǎn)業(yè)鏈重要性愈發(fā)凸顯

    美國對華制裁不斷升級,意在抑制中國AI產(chǎn)業(yè)鏈發(fā)展以及本土半導體生態(tài)系統(tǒng)建設,我國產(chǎn)業(yè)鏈自主可控迫在眉睫。11月,集微 網(wǎng)消息稱,臺積電已經(jīng)向目前所有中國大陸AI芯片客戶發(fā)送正式電子郵件,宣布自11月11日起,暫停向中國大陸AI/GPU客戶供應 所有7納米(nm)及更先進工藝的芯片。12月,美國商務部工業(yè)和安全局(BIS)修訂了新的《出口管理條例》(EAR),將136 個中國相關實體添加到“實體清單”,清單包括了半導體產(chǎn)業(yè)鏈上的多個環(huán)節(jié),如涵蓋了涂膠顯影、刻蝕、薄膜沉積、清洗、去 膠、離子注入、CMP、封裝測試等半導體設備的大部分領域,還有半導體材料公司、EDA公司、芯片公司等。此外,這次制裁對 HBM實施新控制。 近年來國內(nèi)芯片設計、晶圓制造與國際先進水平差距不斷縮小,封裝測試技術逐步接近國際先進水平,整體技術水平不斷提升。 操作系統(tǒng)方面,華為發(fā)布HarmonyOS NEXT,完全基于華為自己的技術棧和設計理念構(gòu)建的操作系統(tǒng),不依賴或兼容其他操作系 統(tǒng)的架構(gòu),是真正獨立于安卓、iOS的操作系統(tǒng),未來有望在信創(chuàng)中扮演重要角色。此外,其它基礎軟硬件也由可用逐步變?yōu)楹?用,信創(chuàng)生態(tài)走向繁榮。

    2025年字節(jié)現(xiàn)有的AI硬件產(chǎn)品: AI玩偶

    字節(jié)“顯眼包”是一款基于大模型開發(fā)的情感陪伴玩偶,集合了火山引擎的多項人工智能技術,如豆包大模型、扣子專業(yè)版、語音識別、語音合成 等?!帮@眼包”并非字節(jié)對外直接售賣的產(chǎn)品,而是今年中秋節(jié)作為字節(jié)公司內(nèi)部的伴手禮。這個藍白配色形似小山的毛絨玩具,內(nèi)嵌了FoloToy 的大模型AI機芯Magicbox(其中搭載了樂鑫科技的產(chǎn)品esptool),而Magicbox可以搭載并呈現(xiàn)豆包大模型和扣子專業(yè)版的能力。玩具配置比較簡 單,能一問一答進行互動,但不支持一次性的多輪對話,也不支持自動喚醒。盡管功能相對單一,但“顯眼包”依舊在市場上得到了眾多關注。可 以預期,如若未來疊加視覺能力,AI玩偶將會帶來更強的交互沉浸感,進而給予用戶更大的情感價值,也將具備更大的市場潛力。

    2025年看好方向:端側(cè)AI

    基于成本、能耗、可靠性和時延、隱私和安全、個性化服務等考慮,端云融合的AI才是AI的未來,高通認為終端側(cè)AI能力是賦 能混合AI并讓生成式AI實現(xiàn)全球規(guī)?;瘮U展的關鍵。高通曾發(fā)布白皮書稱混合AI 是AI的未來。只有云和終端都能承擔AI處理的 任務,才能實現(xiàn)AI的規(guī)?;瘮U展并發(fā)揮其最大潛能。我們認為,未來AI處理將以終端為中心,必要時向云端分求助;而在以云為 中心的場景下,終端將根據(jù)自身能力,在可能的情況下從云端分擔部分AI 工作負載。 蘋果發(fā)布Apple Intelligence,基于“端側(cè)模型+私有云計算+第三方大模型”三層架構(gòu),有望驅(qū)動手機銷量進一步增長。AFM 代表 Apple Foundation Model,端側(cè)模型AFM-on-device參數(shù)量約 30 億;更大的基于服務器的模型為 AFM-server,可以高效、準確和負責 地執(zhí)行專門的任務。此外,Apple Intelligence會根據(jù)不同地區(qū)的需求接入不同的外部第三方模型, 用戶可以選擇是否共享信息。

    2025年看好方向:智能終端——AI眼鏡

    多模態(tài)大模型有望重塑智能硬件,端側(cè)AI賦能下AI眼鏡有望成為比肩手機的下一代終端產(chǎn)品,我們看好AI眼鏡起量。我們認為,AI眼鏡搭 載交互型多模態(tài)大模型后,一方面,交互模式由“硬件服務用戶”轉(zhuǎn)變?yōu)椤按竽P头沼脩簟边M而簡化產(chǎn)品設計:多模態(tài)大模型能夠融合 和處理來自不同傳感器的數(shù)據(jù),使設備在更少的硬件組件下實現(xiàn)更多的功能。另一方面,大模型將幫助眼鏡產(chǎn)品實現(xiàn)更高效簡潔的人機交 互進而提升用戶接受度:多模態(tài)大模型可以理解語音、圖像等多種輸入方式,用戶僅需通過語音、眼動、開啟攝像頭等方式即可實現(xiàn)人機 交互。因此,在后續(xù)產(chǎn)品功能升級迭代的過程中,模型訓練升級將承擔用戶對新功能的學習成本,進而提升用戶接受度。 科技巨頭積極布局,2025年有望成為AI眼鏡爆發(fā)元年。根據(jù)VR陀螺數(shù)據(jù),截至11月20日行業(yè)內(nèi)已公開、被披露入局AI眼鏡的廠商高達36家 (含海外),涉及產(chǎn)品數(shù)量預計超過50+。展望2025年,更多科技巨頭將涌入眼鏡賽道。根據(jù)wellsenn XR預測,從2025年開始,AI智能眼 鏡將在傳統(tǒng)眼鏡銷量保持穩(wěn)定增長的大背景下快速向傳統(tǒng)眼鏡滲透;2029年,AI智能眼鏡年銷售量有望達到5500萬副。

    2025年看好方向:智能終端——智能汽車

    自動駕駛Scaling Law逐步驗證,端到端融合為大勢所趨。傳統(tǒng)自動駕駛基于規(guī)則及高精度地圖,但有限的規(guī)則難以應對無限的道路場景, 尤其國內(nèi)路況極為復雜且車輛眾多,如果自動駕駛車輛行駛到高精地圖之外的區(qū)域、遇到規(guī)則之外的道路障礙物,可能就會束手無策,陷 入困境。從2021年開始,特斯拉開始重構(gòu)底層系統(tǒng)代碼,將Transformer架構(gòu)引入了感知領域,將攝像頭的2D圖像轉(zhuǎn)化為3D圖景,也稱鳥 瞰圖BEV。隨后,特斯拉持續(xù)用AI神經(jīng)網(wǎng)絡重塑規(guī)劃控制模塊,端到端模型方案雛形漸成。特斯拉于2023年發(fā)布端到端自動駕駛系統(tǒng)FSD v12,并于2024年初在一定范圍內(nèi)推送FSD v12。今年9月,特斯拉宣布,F(xiàn)SD 將于 2025 年Q1在中國和歐洲推出。 從目前國內(nèi)車企的發(fā)力重點來看,端到端也已成為主流自動駕駛技術路線。華為、小鵬、小馬智行、Momenta、極佳科技、地平線等都在 積極跟進,紛紛推出了面向量產(chǎn)的端到端自動駕駛解決方案和車型。

    大模型賦能座艙場景升級,人機交互界面迭代升級進行時,智能座艙進階4.0時代。相較于智能座艙3.0時代的生態(tài)構(gòu)成,4.0時代不僅是 芯片算力的比拼,還新增了數(shù)據(jù)、算法等新元素的比拼;中間層除了操作系統(tǒng)的比拼外,也誕生了大模型、AI Agents以及模型服務等新 的元素的比拼。2023年12月,理想汽車開始批量推送OTA5.0,多模態(tài)認知大模型Mind GPT首次上車,賦能理想同學擁有類似于 ChatGPT、 Midjourney 等生成式 AI 的能力,拉開了智能座艙的AI競爭序幕。2024年4月,蔚來自研的AI大模型NOMI GPT正式上線,可以實現(xiàn)視覺 (圖像)、聽覺(聲音)、觸覺(車身傳感器信息)等維度的感知能力,具備包括語音、視覺和文本等多種形式的交互能力。5月,小鵬 汽車首發(fā)全域大語言模型,將AI大語言模型的推理能力融合到用車的全場景中,實現(xiàn)了自研 XPGT 大模型、阿里通義大模型以及智譜 AI 大模型的融合。

    荊州地區(qū)政府網(wǎng)站建設 解決方案 專業(yè)團隊 騰訊第三方平臺 地址:湖北省荊州市沙市區(qū)荊沙大道楚天都市佳園一期C區(qū)29棟112       地址:湖北省松滋市新江口街道才知文化廣場1幢1146-1151室     郵編:434200 聯(lián)系電話:0716-6666211     網(wǎng)站編輯部郵箱:business@gl-ns.com 鄂公網(wǎng)安備 42100202000212號 備案號:鄂ICP備2021015094號-1     企業(yè)名稱:湖北國菱計算機科技有限公司