2025-07-27 14:59:56
7月26日,WAIC 2025在上海開(kāi)幕,后摩智能展出了其M50系列產(chǎn)品,該芯片專(zhuān)為AI大模型推理設(shè)計(jì),面向AI PC、智能終端等場(chǎng)景。后摩智能CEO吳強(qiáng)表示,未來(lái)大模型將向推理和端邊智能遷移,后摩智能通過(guò)存算一體技術(shù),推動(dòng)AI大模型在端邊側(cè)實(shí)現(xiàn)離線(xiàn)可用、數(shù)據(jù)保密。吳強(qiáng)還透露,公司已啟動(dòng)下一代DRAM-PIM技術(shù)研發(fā),旨在提升AI算力普及。
每經(jīng)記者|陳婷 每經(jīng)實(shí)習(xí)編輯|余婷婷
7月26日,“2025世界人工智能大會(huì)暨人工智能全球治理高級(jí)別會(huì)議”(WAIC 2025)在上海開(kāi)幕,國(guó)產(chǎn)算力的進(jìn)展是各方關(guān)注的核心議題之一。
在后摩智能展臺(tái),《每日經(jīng)濟(jì)新聞》記者看到,后摩智能M50系列產(chǎn)品首次亮相,后摩智能M50芯片與力謀?BX50計(jì)算盒子、力擎LQ50 Duo M.2卡等旗下核心產(chǎn)品一同位于展臺(tái)的核心位置。
作為主打端邊大模型和存算一體的芯片企業(yè),后摩智能這次帶來(lái)的M50芯片專(zhuān)為大模型推理設(shè)計(jì),主要面向AI PC(人工智能個(gè)人電腦)、智能終端等場(chǎng)景。
“未來(lái)大模型有兩個(gè)重要發(fā)展趨勢(shì):一是大模型的重心逐漸從訓(xùn)練向推理遷移。二是從云端智能逐漸向邊端或者端邊智能遷移。”7月25日,后摩智能CEO(首席執(zhí)行官)吳強(qiáng)對(duì)包括《每日經(jīng)濟(jì)新聞》記者在內(nèi)的媒體表示。他認(rèn)為,未來(lái)的計(jì)算格局有可能是端(終端設(shè)備)、邊(邊緣計(jì)算)、云(云計(jì)算)的混合體,90%的數(shù)據(jù)處理可能會(huì)在端和邊。
WAIC 2025 后摩智能展臺(tái) 圖片來(lái)源:每經(jīng)記者 陳婷 攝
公開(kāi)資料顯示,后摩智能創(chuàng)立于2020年,創(chuàng)立早期定位為基于存算一體技術(shù)的大算力AI(人工智能)芯片研發(fā)企業(yè)。創(chuàng)始人吳強(qiáng)擁有美國(guó)普林斯頓大學(xué)博士學(xué)位,曾任地平線(xiàn)CTO(首席技術(shù)官),早年曾任職于AMD、Facebook。
近年來(lái),國(guó)內(nèi)涌現(xiàn)了不少“存算一體”企業(yè),作為該方向的早期探索者,后摩智能建立起護(hù)城河了嗎?又是什么促使其在兩年前轉(zhuǎn)向?qū)W⒍诉叴竽P虯I芯片?
“不應(yīng)該拼價(jià)格,拼的是性?xún)r(jià)比”
吳強(qiáng)將M50芯片視為后摩智能過(guò)去兩年交出的一份答卷。
據(jù)介紹,M50芯片實(shí)現(xiàn)了160TOPS INT8、100TFLOPS bFP16的物理算力,搭配最大48GB內(nèi)存與153.6 GB/s的超高帶寬,典型功耗僅10W,相當(dāng)于手機(jī)快充的功率,能讓PC、智能語(yǔ)音設(shè)備、機(jī)器人等智能移動(dòng)終端高效運(yùn)行1.5B到70B參數(shù)的本地大模型,實(shí)現(xiàn)了“高算力、低功耗、即插即用”。
除了M50芯片,后摩智能此次發(fā)布的產(chǎn)品矩陣形成了覆蓋端側(cè)到邊緣的多元算力方案。力擎LQ50 Duo M.2卡以口香糖大小的標(biāo)準(zhǔn)M.2規(guī)格,為AI PC、陪伴機(jī)器人等移動(dòng)終端提供“即插即用”的端側(cè)AI能力。
在吳強(qiáng)看來(lái),存算一體技術(shù)是后摩智能的立身之本。
根據(jù)光大證券的相關(guān)研報(bào),存算一體技術(shù)是指將計(jì)算邏輯直接嵌入到存儲(chǔ)單元中,使數(shù)據(jù)在存儲(chǔ)器內(nèi)完成部分或全部計(jì)算任務(wù),從而減少數(shù)據(jù)在存儲(chǔ)器與處理器之間的傳輸。這種技術(shù)可以顯著降低數(shù)據(jù)傳輸延遲和功耗,提高系統(tǒng)的整體性能。
2023年初,吳強(qiáng)在接受采訪(fǎng)時(shí)曾表示,國(guó)產(chǎn)替代的企業(yè)可以對(duì)標(biāo)海外的某類(lèi)產(chǎn)品,但絕不能用同樣的技術(shù)路徑進(jìn)行照搬,如英偉達(dá)、AMD等國(guó)際巨頭的研發(fā)、工程、供應(yīng)鏈能力遠(yuǎn)超過(guò)初創(chuàng)企業(yè),硬碰硬難以取得成功,創(chuàng)業(yè)公司需要另辟蹊徑,以一種差異化的技術(shù)路線(xiàn)來(lái)應(yīng)對(duì)和巨頭們之間的競(jìng)爭(zhēng)。
據(jù)了解,當(dāng)前,后摩智能通過(guò)存算一體技術(shù)與大模型的深度融合,推動(dòng)AI大模型在端邊側(cè)實(shí)現(xiàn)“離線(xiàn)可用、數(shù)據(jù)留痕不外露”。
作為存算一體方向的早期奔跑者,后摩智能已經(jīng)明確了當(dāng)下的發(fā)展路徑。
吳強(qiáng)稱(chēng),M50芯片的發(fā)布是后摩智能現(xiàn)階段邁出的重要的一步,后面會(huì)推出更多的芯片去解決端邊大模型的算力和功耗問(wèn)題以及帶寬問(wèn)題。
“長(zhǎng)期來(lái)說(shuō),后摩希望定位在端邊AI計(jì)算。”吳強(qiáng)表示,后摩智能希望做出能效比更好的端邊芯片,用更好的能效比,解決客戶(hù)的一些問(wèn)題。
在他看來(lái),M50的發(fā)布只是一個(gè)開(kāi)始,“我們的目標(biāo)是讓大模型算力像電力一樣隨處可得、隨取隨用。”
有觀點(diǎn)認(rèn)為,2025年或是端側(cè)AI的爆發(fā)元年。在這一賽道,后摩智能的市場(chǎng)競(jìng)爭(zhēng)力是什么?
“我的觀點(diǎn)是不應(yīng)該拼價(jià)格,我們拼的是性?xún)r(jià)比。”吳強(qiáng)表示,功耗敏感、成本敏感,是端邊的特色。他提到,在端邊,只要對(duì)客戶(hù)創(chuàng)造價(jià)值,就有人愿意買(mǎi)單。
“端邊大模型蘊(yùn)藏著很大的機(jī)會(huì)”
值得一提的是,2023年下半年,后摩智能的目標(biāo)市場(chǎng)發(fā)生過(guò)轉(zhuǎn)向。
2023年5月,后摩智能推出了國(guó)內(nèi)首款存算一體智駕芯片后摩鴻途H30,其AI物理算力、功耗等多項(xiàng)數(shù)據(jù)一度驚艷了市場(chǎng),為快速發(fā)展的智能汽車(chē)產(chǎn)業(yè)帶來(lái)了全新的解決方案。
當(dāng)時(shí),后摩智能選擇了切入智能駕駛領(lǐng)域。后摩智能方面在當(dāng)時(shí)表示,智能駕駛是一個(gè)具象化的場(chǎng)景,存算一體芯片從該場(chǎng)景切入也有一些鮮明的特點(diǎn)與優(yōu)勢(shì)。
后摩智能創(chuàng)始人兼CEO吳強(qiáng)博士 圖片來(lái)源:每經(jīng)記者 陳婷 攝
然而,吳強(qiáng)很快就發(fā)現(xiàn)了這一目標(biāo)市場(chǎng)存在的問(wèn)題。
“2023年下半年,整個(gè)自動(dòng)駕駛賽道非常卷,格局逐漸穩(wěn)定,給新入局的機(jī)會(huì)越來(lái)越少。”吳強(qiáng)表示,為了體現(xiàn)存算一體的優(yōu)勢(shì),后摩智能的一代芯片算力做得很大,忽略了當(dāng)時(shí)市場(chǎng)的需求。
吳強(qiáng)解釋稱(chēng),算力大就意味著成本高,可2023年下半年都在講價(jià)格、講低成本。在此大背景下,(當(dāng)時(shí)推出的芯片)算力太超前、太冗余了。
后摩智能很快就看到了新的機(jī)會(huì)。
據(jù)悉,2023年,后摩智能就得出了一個(gè)結(jié)論,即“端邊的大模型蘊(yùn)藏著很大的機(jī)會(huì)”。
“無(wú)論是商業(yè)還是個(gè)人,端邊的AI都有可能成為更懂你的AI。因?yàn)樗旧硎怯泻芏嗵焐膬?yōu)勢(shì),盡管剛剛開(kāi)始,大模型剛剛開(kāi)始,端邊剛剛開(kāi)始,但是它本身有更好的實(shí)時(shí)響應(yīng),更低的使用成本,更安全的數(shù)據(jù)隱私,以及更好的個(gè)人的用戶(hù)體驗(yàn)。未來(lái)這會(huì)成為一個(gè)趨勢(shì)。”吳強(qiáng)說(shuō)。
得出這一結(jié)論之后,2024年初,后摩智能快速把第一代芯片調(diào)整了一版,推出了M30,針對(duì)大模型做了一些調(diào)整和優(yōu)化。
隨著M50系列產(chǎn)品的推出,后摩智能已經(jīng)確認(rèn)了新的目標(biāo)市場(chǎng)。據(jù)了解,本次推出的M50產(chǎn)品可廣泛應(yīng)用于消費(fèi)終端、智能辦公、智能工業(yè)等多元領(lǐng)域,且均能在離線(xiàn)狀態(tài)下實(shí)現(xiàn)全流程本地處理,從源頭杜絕數(shù)據(jù)聯(lián)網(wǎng)傳輸風(fēng)險(xiǎn)。
吳強(qiáng)還向記者披露了當(dāng)下后摩智能的意向客戶(hù),包括聯(lián)想的下一代AI PC產(chǎn)品、訊飛聽(tīng)見(jiàn)的下一代智能語(yǔ)音設(shè)備以及中國(guó)移動(dòng)的全新一代的5G+AI邊緣計(jì)算設(shè)備等。
就日漸火熱的具身智能給芯片行業(yè)帶來(lái)的機(jī)會(huì),吳強(qiáng)認(rèn)為,機(jī)器人包括具身智能機(jī)器人(特指陪伴機(jī)器人),更像是十年前的智能駕駛,是一個(gè)新興的垂直賽道,格局還未定,“大家還有機(jī)會(huì)”。
不過(guò),他也提到,由于具身智能的發(fā)展還處于比較早期,“專(zhuān)門(mén)為它做一個(gè)芯片養(yǎng)活自己是不可能的,它還有很長(zhǎng)的過(guò)程。但我看好它的未來(lái)”。
據(jù)了解,面向未來(lái),后摩智能已啟動(dòng)下一代DRAM-PIM技術(shù)研發(fā),通過(guò)將計(jì)算單元直接嵌入DRAM陣列,使計(jì)算與存儲(chǔ)的協(xié)同更加緊密高效。該技術(shù)將突破1TB/s片內(nèi)帶寬,能效較現(xiàn)有水平再提升三倍,推動(dòng)百億參數(shù)大模型在終端設(shè)備實(shí)現(xiàn)普及,讓更強(qiáng)大的AI算力能夠融入PC、平板等日常設(shè)備。
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線(xiàn):4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP