2025-07-28 20:39:15
每經記者|張梓桐 每經編輯|裴健如
OpenAI發布具備自主思考能力的ChatGPT智能體;零一萬物發布企業級Agent智能體“萬仔”??一時之間,AI Agent(智能體)正從概念加速落地,國內外科技巨頭紛紛布局。
7月28日,在2025世界人工智能大會暨人工智能全球治理高級別會議(WAIC 2025)上,安永大中華區發布AI Agent產品功能——安永智能問答3.0。安永大中華區人工智能與數據咨詢服務聯席主管合伙人陳劍光在接受《每日經濟新聞》(以下簡稱NBD)記者采訪時表示,衡量AI Agent“好用”的關鍵指標需兼顧技術效能與業務價值。
圖片來源:企業供圖
陳劍光強調,AI Agent是否“好用”,技術上需關注準確性、響應速度等指標,業務上則需關注效率提升、成本優化、風控增強等實際價值,需體現對業務目標的支撐度。
除此之外,不同行業的Agent需求差異顯著。
金融業聚焦風控合規,如投資組合合規助手、實時交易監控;零售業側重供應鏈優化與精準營銷,如消費者行為分析推薦Agent;制造業則深耕設備維護與生產優化,典型如預測性維護Agent、質量檢測Agent。不過,各行業在人事、行政等職能部門存在共性需求,核心是提升運營效率。
以下為對話實錄:
Agent應用兩大核心痛點:系統集成障礙與垂直領域適配度不足
NBD:目前企業在落地Agent應用時,最常遇到的痛點是什么?從您的實踐經驗來看,這些痛點背后的核心原因是什么?
陳劍光:目前,企業在部署Agent應用時,普遍面臨的兩大核心痛點是系統集成障礙與垂直領域適配度不足。
Agent與企業現有的核心業務系統(如ERP、CRM、財務系統等)的協同困難是一個高頻挑戰。實踐中經常看到,由于接口協議不一致、數據格式不兼容等問題,Agent難以順暢地與這些系統進行數據交換和指令執行,從而造成任務中斷、效率低下。比如,一個負責費用報銷的財務Agent,可能因無法正確解析不同格式的票據信息而導致流程停滯。
在面對特定行業的專業場景時,通用Agent模型常常顯得“力不從心”,關鍵在于缺乏深度融入行業的知識庫和數據來做支撐。例如,在金融風控領域,模型需要整合瞬息萬變的監管規則和市場數據;在醫療診斷領域,則需要模型具備理解并融合影像和文本病歷的能力。通用模型在這些高度專業化的環境中,精度往往難以達到業務要求。
這些痛點的背后,核心原因在于雙重壁壘。一是技術整合壁壘。打通異構系統的“最后一公里”,需要解決復雜的技術接口、數據映射和流程銜接問題,工程實施復雜度高。二是領域知識與數據治理壁壘。構建真正有效的垂直領域Agent,不僅需要引入深厚的行業專業知識,還需要高質量、結構化的領域數據進行持續訓練與調優。然而,高質量數據的獲取、清洗、標注及其所涉及的治理成本,構成了顯著的障礙。這不僅是技術門檻,更是知識工程和數據資產管理的系統性挑戰。
NBD:不同行業(比如金融、零售、制造業)的企業在使用Agent時,需求和應用場景會有明顯差異嗎?能否舉例說說典型行業的特色應用?
陳劍光:行業間的差異化需求非常顯著,主要體現在核心業務流程的差異和數據屬性的專業性要求上。
例如,金融業高度關注風險控制和合規管理,典型Agent的應用場景如面向客戶經理的投資組合分析助手,提供合規建議,或者類似于提供自動化的實時交易監控Agent,用于識別交易異常模式。
零售業的核心痛點圍繞供應鏈優化、庫存管理、精準營銷與客戶體驗提升。典型場景如分析消費者行為數據的個性化推薦Agent;優化物流路線的動態規劃Agent等。
制造業的應用場景可能更關于設備維護管理、生產流程優化與質量控制等。典型應用包括預測性維護Agent,通過分析設備傳感器數據提前預警故障;生產排程優化Agent,實時調整產線資源分配;整合視覺識別技術的質量檢測Agent,自動化識別產品缺陷等。
行業差異決定了Agent的核心使命:解決各自領域最關鍵的效率瓶頸或風險點。另外,各個企業也都存在一些共性場景,例如對于人事、行政、法務、通用IT支持等職能部門,需求通常集中于提升內部運營效率,如自動化查詢政策信息、標準化審批流程、提供IT支持等。這類Agent應用追求的核心價值是流程自動化與執行效率提升。
業務價值指標是證明Agent投入產出比的核心
NBD:企業Agent的“智能化”程度往往是關注焦點,您認為衡量一個企業Agent“好用”的關鍵指標有哪些?
陳劍光:衡量企業Agent是否真正好用,需要從技術效能與業務價值雙維度綜合評估,考量其對業務目標的支撐度。
技術效能指標是Agent基礎能力的量化體現,依據其具體目標設定,包括準確性、魯棒性、響應速度、吞吐量等。以一個面向內部的客戶服務查詢Agent為例,技術指標包括用戶咨詢的意圖識別準確度、后臺信息查詢的響應時間、調用客服系統接口的成功率等。
業務價值指標則是證明Agent投入產出比的核心,體現實際落地效果,包括效率提升(是否縮短業務流程時長、節省人力操作時長)、成本優化(優化運營成本、識別潛在客戶)、風控提升(降低合規風險/操作風險)、質量提升(提升產品/服務質量)等。
在技術指標滿足的基礎上,能清晰量化其對實際業務的影響,是Agent價值的體現。
NBD:隨著大模型技術的發展,企業Agent在功能迭代上有哪些新趨勢?比如,是否會更注重多模態交互或自主決策能力?
陳劍光:確實,企業Agent的能力邊界正在被大模型技術不斷拓寬。Agent正從單一的文本交互,向融合視覺、聽覺等多模態信號的方向發展,這使得Agent能處理和應對更復雜的企業場景。例如,通過圖像識別解析掃描文檔、表單、儀表盤截圖等非結構化信息;結合語音識別與合成技術,構建更自然、可提供多感官交互體驗的數字人(虛擬客服、培訓助手);在工業質檢中,整合視覺識別實現對產品缺陷或生產線異常的自動化檢測等。
隨著大模型理解、推理和規劃能力的提升,Agent在預設規則和安全邊界內的自主決策能力正在增強,能處理更復雜的規則組合,逐步從純“執行者”向具有一定分析能力的“輔助決策者”角色演進。通過學習和掌握更廣泛、更復雜的工具調用能力,將更深度地嵌入現有業務流程,自動觸發并協調后端系統的多項操作,形成更強的端到端自動化鏈條。
除了“多模態”“多功能”“多協作”,即由多個具備不同技能的Agent組成“團隊”,通過明確的任務分配和協作機制,共同完成更復雜的、需要多步推理或跨系統協作的任務鏈,提升整體解決問題的能力上限。
NBD:對于還未嘗試Agent應用的中小企業,您認為它們可以從哪些低成本、易落地的場景入手,逐步感受其價值?
陳劍光:對于初次嘗試的企業,我們建議采取“小步快跑”策略,可以先從輕量場景切入,即需求明確、技術輕量、能快速體現價值的“試點場景”。例如,文檔摘要與信息檢索,可以通過智能信息助手,針對企業內部政策/知識庫問答,包括HR福利查詢、IT常見問題解答;輕度的業務流程自動化,包括簡單表單數據的自動化審核(如檢查必填項、格式合規)、標準化通知的定時發送等;以及協同增強工具,包括編程助手提升、智能文檔翻譯等。
對中小企業而言,初期應當利用成熟的外部服務API(應用程序編程接口)來快速擴展Agent的功能,或選擇提供Agent能力的SaaS(軟件運營服務)產品或按需付費的模型服務(如大模型服務商的Agent平臺),也可基于低代碼/零代碼平臺構建屬于自己的Agent應用,以降低硬件投入和初始維護成本。
通過這些試點,企業能低成本驗證技術價值,積累運營經驗,培養團隊信心,為后續更復雜、深度的應用打下基礎。
最重要的是深刻理解——Agent的核心價值,絕非簡單地“替代人力”,而是通過承擔規則性、重復性的流程執行任務,釋放員工的時間和精力,使其能夠投入到更富創造力的工作、更復雜的判斷決策和更高價值的創新活動中。其終極目標是實現“人機協同、人智增強”,推動組織效能升級。
封面圖片來源:每日經濟新聞 資料圖
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP