欧美日韩a,91女人18毛片水多国产,麻豆国产成人av在线播放

端側(cè) AI 的剛需邏輯：為什么云端 AI 越主動(dòng)越虧

admin — Mon, 13 Apr 2026 08:50:19 +0000

從 2024 年底 Google Project Mariner 內(nèi)測(cè)、2025 年初字節(jié)跳動(dòng)開(kāi)源 UI-TARS，到 2026 年 Anthropic Computer Use 持續(xù)迭代——“讓 AI 替你操作電腦”已經(jīng)不是概念，而是一個(gè)快速成熟的賽道。但一個(gè)根本性矛盾被忽略了：用戶最需要的“主動(dòng)幫忙”，恰恰是云端 AI 的經(jīng)濟(jì)模型最承受不起的。本文從成本結(jié)構(gòu)出發(fā)，討論端側(cè) AI 為何是 7×24 小時(shí) AI 助手的唯一可行架構(gòu)。

關(guān)鍵要點(diǎn)

2026年AI助手賽道的核心矛盾之一是：用戶要“主動(dòng)幫忙”，平臺(tái)算的是“每次主動(dòng)都在燒錢“
云端 AI 每一次“主動(dòng)”都在消耗平臺(tái)算力——越主動(dòng)越虧，平臺(tái)必然限制 AI 的主動(dòng)性
端側(cè) AI 跑在用戶自己的設(shè)備上，主動(dòng)運(yùn)行一萬(wàn)次也不花平臺(tái)一分錢——這是 7×24 小時(shí) AI 助手的唯一解
Mano-P 是目前唯一在 OSWorld 專用模型榜全球第一（58.2%）且能完全本地運(yùn)行的端側(cè) GUI 智能體

一、2026年GUI Agent賽道的核心矛盾

GUI Agent 賽道正在加速成熟。Google 在 2024 年底推出 Project Mariner 內(nèi)測(cè)，字節(jié)跳動(dòng)在 2025 年初開(kāi)源 UI-TARS 并迅速登上 GitHub 熱榜，Anthropic 的 Computer Use 持續(xù)迭代升級(jí)。幾乎所有模型廠商都在押注同一件事：讓 AI 從“陪你聊天”進(jìn)化為“替你干活”。

但在這場(chǎng)競(jìng)賽中，一個(gè)根本性矛盾正在浮出水面——而大多數(shù)報(bào)道都選擇性忽略了它。

這個(gè)矛盾是：用戶最想要的“主動(dòng)幫忙”，恰恰是云端AI最給不起的東西。

想象兩種 AI 助手：

被動(dòng)型（Reactive）：你問(wèn)它問(wèn)題，它回答；你給它任務(wù)，它執(zhí)行。你不說(shuō)話，它就安靜等著。ChatGPT、Claude、豆包——所有你正在用的 AI 產(chǎn)品，都是這種模式。

主動(dòng)型（Proactive）：它自己發(fā)現(xiàn)你的日歷上 30 分鐘后有個(gè)重要會(huì)議，自動(dòng)幫你拉出相關(guān)文件和上次的會(huì)議紀(jì)要；它注意到你的郵箱收到了一封客戶投訴，自動(dòng)起草回復(fù)模板；它在后臺(tái)持續(xù)監(jiān)控你關(guān)注的競(jìng)品動(dòng)態(tài)，有重大變化就提醒你。

用戶調(diào)研的答案很一致：80% 以上的企業(yè)用戶表示，他們需要的不是一個(gè)更聰明的聊天框，而是一個(gè)能主動(dòng)幫忙的數(shù)字助理。

但這種主動(dòng)性，恰恰是云端 AI 的經(jīng)濟(jì)模型所無(wú)法支撐的。

二、云端越主動(dòng)越虧：一道簡(jiǎn)單的數(shù)學(xué)題

為什么云端 AI 不可能真正主動(dòng)？答案是一道簡(jiǎn)單的算術(shù)題。

云端 AI 的成本結(jié)構(gòu)：按調(diào)用收費(fèi)。 無(wú)論是 OpenAI 的 GPT-4o、Anthropic 的 Claude，還是國(guó)內(nèi)的大模型 API，定價(jià)邏輯都是按 token 計(jì)費(fèi)——你每發(fā)一條消息、每上傳一張截圖、每讓它執(zhí)行一次操作，平臺(tái)都在消耗算力，都在產(chǎn)生成本。

被動(dòng)模式下，用戶一天可能調(diào)用 AI 幾十次。平臺(tái)的收費(fèi)能覆蓋成本，甚至有利潤(rùn)。

主動(dòng)模式下，AI 需要持續(xù)運(yùn)行：

每 5 分鐘檢查一次郵箱 → 一天 288 次
每 10 分鐘掃描一次日歷和待辦 → 一天 144 次
每 15 分鐘監(jiān)控一次數(shù)據(jù)看板 → 一天 96 次
持續(xù)監(jiān)聽(tīng)系統(tǒng)通知 → 一天數(shù)百次
每次檢查都涉及截屏 + 視覺(jué)理解 + 決策推理 → 每次消耗數(shù)千 token

粗略估算：一個(gè)主動(dòng)型 AI 助手一天的調(diào)用量，是被動(dòng)型的 20-50 倍。

更關(guān)鍵的是：這道數(shù)學(xué)題決定了云端平臺(tái)的產(chǎn)品策略。平臺(tái)不可能鼓勵(lì)用戶開(kāi)啟高頻主動(dòng)模式——越主動(dòng)，平臺(tái)越虧。所以你會(huì)看到：

ChatGPT 從來(lái)不會(huì)主動(dòng)找你
Claude 只在你打開(kāi)對(duì)話框時(shí)才運(yùn)行
所有云端 AI 助手都是“你來(lái)問(wèn)我才答”的模式

這不僅是技術(shù)限制，更是經(jīng)濟(jì)模型的必然結(jié)果。

三、端側(cè)模型：唯一能讓 AI 真正“主動(dòng)”的架構(gòu)

端側(cè)模型從根本上改變了這道經(jīng)濟(jì)題的變量。

AI 跑在你自己的設(shè)備上，用的是你自己的芯片和電。 它主動(dòng)檢查郵箱一萬(wàn)次，也不花平臺(tái)一分錢。主動(dòng)性不再是成本負(fù)擔(dān)，而是設(shè)備的固有能力——就像你的手機(jī)鬧鐘不需要為每次響鈴付費(fèi)一樣。

這個(gè)架構(gòu)變化帶來(lái)三個(gè)根本性的優(yōu)勢(shì)：

1. 主動(dòng)性無(wú)上限

端側(cè) AI 可以真正做到 7×24 小時(shí)在后臺(tái)運(yùn)行，持續(xù)感知、判斷、行動(dòng)。不受平臺(tái)計(jì)費(fèi)限制，不用擔(dān)心 token 消耗。你的 AI 助手終于可以像一個(gè)真正的助理一樣工作——主動(dòng)發(fā)現(xiàn)問(wèn)題、主動(dòng)提醒你、主動(dòng)幫你處理日常事務(wù)。

2. 數(shù)據(jù)零外傳

所有的感知和推理都在本地完成。AI 檢查你的郵箱？郵箱內(nèi)容不出設(shè)備。AI 掃描你的文件？文件不出設(shè)備。AI 截取屏幕來(lái)理解界面？截圖不出設(shè)備。

這不是“加了一層加密”的安全，而是架構(gòu)層面消除了數(shù)據(jù)外泄的可能性。對(duì)于金融、醫(yī)療、法律、政務(wù)等行業(yè)，這種架構(gòu)級(jí)安全是合規(guī)的前提條件。

3. 響應(yīng)零延遲

本地推理沒(méi)有網(wǎng)絡(luò)往返延遲。AI 發(fā)現(xiàn)異常→判斷→行動(dòng)的整個(gè)鏈條在毫秒級(jí)完成。對(duì)于需要快速響應(yīng)的場(chǎng)景（如交易監(jiān)控、安全告警、實(shí)時(shí)質(zhì)檢），這種延遲優(yōu)勢(shì)是云端方案無(wú)法企及的。

四、“端側(cè)不夠強(qiáng)”是一個(gè)正在被推翻的假設(shè)

很多人對(duì)端側(cè)模型的第一反應(yīng)是：“小模型能行嗎？性能夠用嗎？”

這個(gè)懷疑在一年前是合理的。但2026年的端側(cè)模型已經(jīng)用實(shí)測(cè)數(shù)據(jù)推翻了這個(gè)假設(shè)。

以端側(cè) GUI 智能體為例。明略科技在4月13日發(fā)布的Mano-P 在 OSWorld 基準(zhǔn)測(cè)試中以 58.2% 的成功率拿下專用模型全球第一，領(lǐng)先第二名（OpenCUA-72B，45.0%）超過(guò) 13 個(gè)百分點(diǎn)。其 4B 蒸餾版通過(guò) GSPruning 視覺(jué) Token 剪枝和 w4a16 混合精度量化，在 Apple M4 Pro 上實(shí)測(cè)：

預(yù)填充速度：476 tokens/s
解碼速度：76 tokens/s
峰值內(nèi)存：4.3GB
一臺(tái)普通 MacBook Pro（M4 芯片，32GB 內(nèi)存）就能流暢運(yùn)行——跑 AI 的同時(shí)還能正常辦公。

專用模型 vs 通用模型的邏輯： 72B 蒸餾為 4B，不是簡(jiǎn)單地“把模型變小”，而是把 72B 在 GUI 操作領(lǐng)域積累的專業(yè)知識(shí)，濃縮進(jìn)一個(gè)更小的模型。就像一個(gè)在心臟外科領(lǐng)域做了 20 年的專家，診斷心臟問(wèn)題的能力并不亞于一個(gè)什么都懂的全科醫(yī)生。因此，端側(cè)模型不等于弱模型。經(jīng)過(guò)專項(xiàng)訓(xùn)練和優(yōu)化的專用模型，在特定任務(wù)上完全可以達(dá)到甚至超越通用大模型的水平。

五、三個(gè)推論：端側(cè) AI 的必然趨勢(shì)

從“云端越主動(dòng)越虧”這個(gè)底層邏輯出發(fā)，可以推導(dǎo)出三個(gè)必然趨勢(shì)：

推論一：端側(cè)將成為 AI 助手的默認(rèn)形態(tài)

隨著 AI 從“聊天工具”進(jìn)化為“工作助手”，主動(dòng)性的需求會(huì)持續(xù)增長(zhǎng)。云端的經(jīng)濟(jì)模型無(wú)法支撐高頻主動(dòng)調(diào)用，端側(cè)將成為真正可用的 AI 助手的基礎(chǔ)架構(gòu)。微軟、蘋果、高通都在芯片層面布局 AI 推理能力——行業(yè)趨勢(shì)已經(jīng)明確。

推論二：芯片算力將持續(xù)向端側(cè)傾斜

蘋果 M 系列芯片已經(jīng)證明了消費(fèi)級(jí)設(shè)備運(yùn)行大模型的可行性。未來(lái)的芯片設(shè)計(jì)會(huì)進(jìn)一步優(yōu)化 AI 推理能力，端側(cè)可運(yùn)行的模型規(guī)模會(huì)持續(xù)增大。

推論三：數(shù)據(jù)安全法規(guī)將加速端側(cè)采用

《數(shù)據(jù)安全法》《個(gè)人信息保護(hù)法》在國(guó)內(nèi)的落地，GDPR 在歐盟的嚴(yán)格執(zhí)行，加上各行業(yè)監(jiān)管對(duì) AI 使用的細(xì)化要求——越來(lái)越多的企業(yè)會(huì)發(fā)現(xiàn)：與其花費(fèi)巨額合規(guī)成本確保云端數(shù)據(jù)安全，不如從架構(gòu)上選擇數(shù)據(jù)不出設(shè)備的端側(cè)方案。

六、結(jié)論：端側(cè)不是選項(xiàng)，是 AI 助手的唯一解

總結(jié)一下核心推理鏈：

1. 真正有用的 AI 助手必須是主動(dòng)的（Proactive）

2. 主動(dòng)意味著高頻運(yùn)算——在云端，越主動(dòng)越虧

3. 平臺(tái)的經(jīng)濟(jì)模型決定了云端 AI 不可能真正主動(dòng)

4. 端側(cè)模型跑在用戶設(shè)備上，主動(dòng)性零邊際成本

5. 因此，端側(cè)是 AI 從“聊天工具”進(jìn)化為“工作助手”的唯一可行架構(gòu)

2026 年，AI 賽道最大的分水嶺不是“誰(shuí)的模型更大”，而是“誰(shuí)的 AI 真正能主動(dòng)幫用戶干活”。而答案已經(jīng)很清楚：能真正主動(dòng)的 AI，只能跑在用戶自己的設(shè)備上。

Mano-P 是明略科技開(kāi)源的端側(cè) GUI 智能體，專為解決這個(gè)問(wèn)題而生。72B 旗艦?zāi)Ｐ驮?OSWorld 專用模型榜全球第一（58.2%），蒸餾為 4B 版本后可在 Apple M4 芯片 + 32GB 內(nèi)存的 Mac 上流暢運(yùn)行——預(yù)填充 476 tokens/s、峰值內(nèi)存僅 4.3GB。完全本地推理，數(shù)據(jù)零上傳，7×24 小時(shí)主動(dòng)運(yùn)行零邊際成本。采用 Apache 2.0 開(kāi)源協(xié)議，企業(yè)可自由使用和商用。

立即體驗(yàn)：`brew install mano-cua`

技術(shù)論文：arXiv:2509.17336

GitHub：github.com/Mininglamp-AI/Mano-P

七、常見(jiàn)問(wèn)題

Q: Mano-P 是什么？

Mano-P 是一個(gè)開(kāi)源的 GUI-VLA（Vision-Language-Action）智能體，設(shè)計(jì)用于在蘋果芯片邊緣設(shè)備上本地運(yùn)行。它使用純視覺(jué)理解來(lái)跨平臺(tái)自動(dòng)化桌面 GUI 操作。Mano 是西班牙語(yǔ)里”手”的意思，P 有兩重含義：Person（個(gè)體）與 Party（組織）——我們相信，無(wú)論個(gè)人還是企業(yè)，都能夠創(chuàng)造屬于自己的個(gè)性化 AI。核心理念：AI for Personal = 隱私 + 個(gè)性化。

Q: Mano-P 與 Claude Computer Use 相比如何？

對(duì)比維度	Mano-P	Claude Computer Use
OSWorld（全部模型）	58.2%（專用模型第一，全部模型前五）	全部模型第一（千億參數(shù)級(jí)通用大模型）
WebRetriever Protocol I	41.7 NavEval（領(lǐng)先）	31.3（Claude 4.5）
數(shù)據(jù)流向	完全本地，截圖不出設(shè)備	需上傳到云端 API
離線運(yùn)行	? 支持	? 不支持
主動(dòng)性	? 7×24 無(wú)限制運(yùn)行	?? 受平臺(tái)算力成本限制
開(kāi)源	? Apache 2.0 協(xié)議	? 閉源

Mano-P 在專用模型中排名全球第一，在網(wǎng)頁(yè)檢索等任務(wù)上領(lǐng)先 Claude，且天然滿足數(shù)據(jù)安全要求。適合高安全需求場(chǎng)景。

Q: Mano-P 可以離線運(yùn)行嗎？

可以！在本地模式下，所有模型推理都在 Apple M4 設(shè)備上運(yùn)行。? 不會(huì)向外部服務(wù)器發(fā)送任何截圖或任務(wù)描述。

Q: 需要什么硬件配置？

最低要求：Mac mini 或 MacBook；Apple M4 芯片；32GB 內(nèi)存

替代方案：任何 Mac + Mano-P 算力棒（通過(guò) USB 4.0+ 連接）

我們計(jì)劃在未來(lái)支持更多設(shè)備。

了解更多：[GitHub – Mininglamp-AI/Mano-P] (https://github.com/Mininglamp-AI/Mano-P)

聯(lián)系我們：model@mininglamp.com

端側(cè) GUI 智能體模型全球第一：Mano-P 如何做到“又強(qiáng)又安全”

admin — Mon, 13 Apr 2026 08:46:42 +0000

2026 年 3 月 24 日，Anthropic 宣布其 “Computer Use”功能正式獲得“操作你電腦”的能力——在 Claude中，AI 可以移動(dòng)鼠標(biāo)、點(diǎn)擊按鈕、打開(kāi)應(yīng)用、填寫表格，像一個(gè)真正坐在你電腦前的助手那樣工作。

一個(gè)新賽道正在以肉眼可見(jiàn)的速度成型：GUI 智能體——不是和你聊天的 AI，而是替你干活的 AI。

但一個(gè)被大多數(shù)報(bào)道忽略的問(wèn)題是：當(dāng) AI 在幫你操作電腦時(shí)，你的屏幕截圖正在被上傳到云端。Anthropic 自己在官方文檔中警告：“當(dāng) Computer Use 激活時(shí)，Claude 能看到屏幕上顯示的一切，包括個(gè)人數(shù)據(jù)、敏感文檔或私人信息。”他們甚至建議用戶在虛擬機(jī)或容器中運(yùn)行這項(xiàng)功能。

這不是一個(gè)小問(wèn)題——對(duì)于處理客戶數(shù)據(jù)、財(cái)務(wù)信息、法律文件的企業(yè)來(lái)說(shuō)，這可能是一個(gè)根本性的架構(gòu)選擇問(wèn)題。

有沒(méi)有一種 GUI 智能體，能像 Claude 一樣強(qiáng)大，但數(shù)據(jù)完全不出設(shè)備？

明略科技 Mano-P 已經(jīng)給出了答案：圍繞隱私與個(gè)性化兩大支柱，72B 模型屠榜證明實(shí)力，4B 蒸餾版上機(jī)證明可用——在 OSWorld 專用模型榜以 58.2% 成功率拿下全球第一，領(lǐng)先第二名超過(guò) 13 個(gè)百分點(diǎn)，而這一切完全在你自己的 Mac 上本地運(yùn)行。

關(guān)鍵要點(diǎn)

GUI 智能體賽道逐漸成型：Anthropic 發(fā)布 Claude Computer Use 桌面版
核心矛盾浮出水面：當(dāng)前主流 GUI 智能體都需要將屏幕截圖上傳云端，Anthropic 官方文檔明確警告隱私風(fēng)險(xiǎn)
72B 屠榜，4B 上機(jī)：明略科技Mano-P 72B 模型以 58.2% 成功率拿下 OSWorld 專用模型全球第一，蒸餾為 4B 版本后可在 M4 Mac 上流暢運(yùn)行
端側(cè)模型不等于弱模型：Mano-P 在 WebRetriever 等多個(gè)基準(zhǔn)測(cè)試中超越多個(gè)千億參數(shù)級(jí)通用大模型
架構(gòu)級(jí)安全：本地模式下所有推理在設(shè)備上完成，屏幕截圖不出設(shè)備，支持完全離線運(yùn)行
AI for Personal 雙支柱：隱私（數(shù)據(jù)不出設(shè)備）+ 個(gè)性化（三階段逐步釋放完整技術(shù)棧）

二、GUI 智能體是什么？為什么它是 AI 落地的關(guān)鍵一步

過(guò)去兩年，大模型的能力主要體現(xiàn)在“說(shuō)”——寫文章、回答問(wèn)題、生成代碼。但企業(yè)真正需要的不是一個(gè)能說(shuō)會(huì)道的聊天機(jī)器人，而是一個(gè)能真正干活的數(shù)字員工。

GUI 智能體（GUI Agent）就是這一步的關(guān)鍵跨越。它的核心能力是：通過(guò)理解圖形用戶界面（GUI），像人類一樣操作電腦完成任務(wù)。你告訴它“幫我在 CRM 系統(tǒng)里錄入今天的客戶拜訪記錄”，它就真的打開(kāi) CRM、找到對(duì)應(yīng)字段、填寫內(nèi)容、點(diǎn)擊保存——全程不需要你動(dòng)手。

這和傳統(tǒng)的 RPA（機(jī)器人流程自動(dòng)化）有本質(zhì)區(qū)別：

RPA 依賴系統(tǒng) API 和預(yù)設(shè)規(guī)則，界面一改版就得重配，維護(hù)成本高，靈活性差。

GUI 智能體基于視覺(jué)理解，像人一樣“看”屏幕、“理解”界面、“決定”下一步操作。界面改了？它能自適應(yīng)，因?yàn)樗斫獾氖钦Z(yǔ)義，不是像素坐標(biāo)。

這個(gè)差異意味著什么？意味著 GUI 智能體可以操作任何人類能操作的軟件——不管是現(xiàn)代 SaaS 工具、老舊的 ERP 系統(tǒng)，還是只有圖形界面沒(méi)有 API 的專業(yè)軟件。它解鎖的不是某一個(gè)系統(tǒng)的自動(dòng)化，而是通用的桌面自動(dòng)化能力。

三、行業(yè)現(xiàn)狀：能力很強(qiáng)，但有兩個(gè)根本性問(wèn)題

截至目前，GUI 智能體賽道的主流方案幾乎都走了同一條路：依賴云端大模型推理。底層邏輯都是“截屏→上傳云端→模型推理→返回操作指令”。

這條路有兩個(gè)根本性的問(wèn)題：

第一個(gè)問(wèn)題是數(shù)據(jù)安全。你的每一張屏幕截圖都在云端服務(wù)器上走了一遭。對(duì)于個(gè)人用戶操作瀏覽器這種場(chǎng)景，這或許可以接受。但當(dāng)企業(yè)把 GUI 智能體用在審查合同、處理財(cái)務(wù)報(bào)表、錄入客戶數(shù)據(jù)等核心業(yè)務(wù)時(shí)，合規(guī)團(tuán)隊(duì)會(huì)問(wèn)：“這些截圖存在哪里？誰(shuí)能看到？保留多久？”

第二個(gè)問(wèn)題更根本：云端 AI 不可能真正“主動(dòng)”幫你。真正有用的 AI 助手應(yīng)該是主動(dòng)的——自己發(fā)現(xiàn)你有個(gè)會(huì)議快開(kāi)了，自動(dòng)幫你準(zhǔn)備資料；看到重要郵件，自動(dòng)提醒你。但這種主動(dòng)性意味著 AI 要不停地自發(fā)運(yùn)算。在云端，每一次運(yùn)算都消耗平臺(tái)的算力和費(fèi)用——AI 越主動(dòng)，平臺(tái)越虧錢。所以云端平臺(tái)必然限制 AI 的主動(dòng)性，這就是為什么你用 ChatGPT 從來(lái)不會(huì)看到它主動(dòng)找你。

端側(cè)模型從根本上解決了這兩個(gè)問(wèn)題：AI 跑在你自己的設(shè)備上，用的是你自己的芯片和電——它主動(dòng)運(yùn)行一萬(wàn)次也不花平臺(tái)一分錢；同時(shí)數(shù)據(jù)一步都不出你的設(shè)備。

這就引出了一個(gè)關(guān)鍵問(wèn)題：有沒(méi)有一種端側(cè)方案，性能也能達(dá)到頂級(jí)？

四、Mano-P：72B 屠榜，4B 上機(jī)

在上述格局中，明略科技近期開(kāi)源的的 Mano-P 占據(jù)了一個(gè)獨(dú)特的位置：專用模型性能第一 + 端側(cè)本地運(yùn)行。

性能：不是“也能用”，是“最能打”

基準(zhǔn)測(cè)試	Mano-P 成績(jī)	排名	說(shuō)明
OSWorld（專用模型）	58.2% 成功率	全球第一	領(lǐng)先第二名（OpenCUA-72b, 45.0%）13.2個(gè)百分點(diǎn)
OSWorld（全部模型）	58.2% 成功率	前五	前四均為千億參數(shù)級(jí)通用大模型
WebRetriever Protocol I	41.7 NavEval	全球第一	超越Gemini 2.5 Pro CU（40.9）和Claude 4.5 CU（31.3）
ScreenSpot-V2	93.5	領(lǐng)先	GUI Grounding視覺(jué)定位
MMBench	87.5	領(lǐng)先	感知認(rèn)知
UI-Vision	46.6	領(lǐng)先	UI視覺(jué)理解
OS-World-G	69.5	領(lǐng)先	OSWorld視覺(jué)定位子任務(wù)
端側(cè)推理（4B量化，M4 Pro）	476 tokens/s預(yù)填充，76 tokens/s解碼	—	峰值內(nèi)存僅4.356GB

72B 模型屠榜證明技術(shù)實(shí)力，蒸餾為 4B 上機(jī)證明日常可用。對(duì)于Mano-P來(lái)說(shuō)，能力和便捷不是二選一。經(jīng)過(guò)專項(xiàng)訓(xùn)練和優(yōu)化的專用模型，完全可以在特定任務(wù)上達(dá)到甚至超越通用大模型的水平。端側(cè)模型不等于弱模型。

安全：不是“更安全”，是“架構(gòu)級(jí)安全”

Mano-P 的本地模式不是在已有的云端架構(gòu)上“加了一層加密”，而是從架構(gòu)層面消除了數(shù)據(jù)外泄的可能性：

安全維度	Mano-P 端側(cè)方案	典型云端方案
數(shù)據(jù)流向	所有推理在本地完成，截圖不出設(shè)備	截圖上傳到云端服務(wù)器處理
離線能力	支持完全離線運(yùn)行，無(wú)需聯(lián)網(wǎng)	必須聯(lián)網(wǎng)才能使用
主動(dòng)性	7×24 不間斷運(yùn)行，無(wú)成本限制	平臺(tái)限制主動(dòng)頻率，越主動(dòng)越貴
代碼審計(jì)	完整源代碼開(kāi)源，企業(yè)可自行審查	閉源黑盒，依賴服務(wù)商承諾
合規(guī)適配	天然滿足數(shù)據(jù)本地化要求	需額外合規(guī)評(píng)估和協(xié)議

對(duì)于金融機(jī)構(gòu)審查合同、醫(yī)療機(jī)構(gòu)處理病歷、政務(wù)系統(tǒng)錄入公民信息等場(chǎng)景，這種“架構(gòu)級(jí)安全”不是加分項(xiàng)，而是準(zhǔn)入門檻。

技術(shù)：怎么做到“又大又快”

在一臺(tái) Mac 上運(yùn)行大參數(shù)模型做 GUI 操作，聽(tīng)起來(lái)不太現(xiàn)實(shí)。Mano-P 靠三項(xiàng)核心技術(shù)解決了這個(gè)問(wèn)題：

GSPruning 視覺(jué) Token 剪枝：處理高分辨率屏幕截圖時(shí)，智能保留界面結(jié)構(gòu)骨架和關(guān)鍵 UI 元素，將視覺(jué) Token 數(shù)量壓縮至 12.57%——相當(dāng)于只看屏幕上最重要的 13% 信息，推理速度提升數(shù)倍，而任務(wù)成功率幾乎不損失。
混合精度量化（w4a16）：用更緊湊的方式存儲(chǔ)模型——權(quán)重用 4bit，激活值保留 16bit。效果：4B 量化版本在 M4 Pro 上峰值內(nèi)存僅 4.356GB，每秒能吐出約 300-400 個(gè)中文字，跑 AI 的同時(shí)你還能正常辦公。
Mano-Action 雙向自增強(qiáng)訓(xùn)練：傳統(tǒng)模型只學(xué)“你告訴我點(diǎn)哪里，我就點(diǎn)哪里”。Mano-P 同時(shí)學(xué)習(xí)正向和反向兩個(gè)方向，通過(guò)循環(huán)一致性互相驗(yàn)證。配合三階段漸進(jìn)訓(xùn)練（監(jiān)督微調(diào)→離線強(qiáng)化學(xué)習(xí)→在線強(qiáng)化學(xué)習(xí)），模型從“背操作手冊(cè)”進(jìn)化到“真正學(xué)會(huì)操作界面”。

五、怎么讓 Mano-P在本地設(shè)備上自主操作界面完成任務(wù)？

Mano-P 提供了三種使用形式，覆蓋從開(kāi)發(fā)者到普通用戶的不同需求：

使用形式	適合誰(shuí)	安裝方式	特點(diǎn)
命令行工具（mano-cua）	開(kāi)發(fā)者、高級(jí)用戶	`brew install mano-cua`	終端直接運(yùn)行任務(wù)
Python SDK（mano-client）	Python 開(kāi)發(fā)者	`pip install mano-client`（開(kāi)發(fā)中）	集成到現(xiàn)有項(xiàng)目，支持異步調(diào)用
AI Agent Skill（mano-skill）	AI Agent 平臺(tái)用戶	OpenClaw 插件安裝	Agent 編排 + GUI 執(zhí)行無(wú)縫銜接

其中 mano-skill 最值得關(guān)注。作為 OpenClaw 等 AI Agent 平臺(tái)的技能插件，Mano-P 賦予了 Agent “看屏幕、動(dòng)鼠標(biāo)”的能力。OpenClaw 是大腦，Mano-P 是雙手——全鏈路開(kāi)源，全程端側(cè)運(yùn)行，數(shù)據(jù)一步不出你的設(shè)備。

舉個(gè)例子：你在 OpenClaw 中對(duì) Agent 說(shuō)“幫我把這份報(bào)告的數(shù)據(jù)錄入到公司的 ERP 系統(tǒng)里”，Agent 自動(dòng)規(guī)劃任務(wù)步驟，需要操作界面時(shí)調(diào)用 mano-skill，Mano-P 接管屏幕操作——整個(gè)過(guò)程在本地完成，Agent 編排和 GUI 執(zhí)行無(wú)縫銜接。

運(yùn)行時(shí)，屏幕右上角會(huì)顯示一個(gè)狀態(tài)面板，實(shí)時(shí)顯示任務(wù)進(jìn)度，用戶可以隨時(shí)暫停或停止。每一步操作執(zhí)行前，敏感或潛在危險(xiǎn)的操作會(huì)要求用戶確認(rèn)——AI 干活，人類監(jiān)督。

六、從“能用”到“敢用”：三階段開(kāi)源路線

GUI 智能體賽道正處于從“技術(shù)驗(yàn)證”到“規(guī)模落地”的關(guān)鍵轉(zhuǎn)折點(diǎn)。

從技術(shù)趨勢(shì)看，兩個(gè)方向正在同步發(fā)展：一是通用大模型持續(xù)提升 GUI 操作能力，二是專用端側(cè)模型通過(guò)精巧的訓(xùn)練和優(yōu)化方法，在更小的參數(shù)規(guī)模上逼近甚至超越通用模型的任務(wù)表現(xiàn)。Mano-P 已經(jīng)用實(shí)測(cè)數(shù)據(jù)證明了后一條路線的可行性——而這條路線天然兼容數(shù)據(jù)安全和合規(guī)要求。

Mano-P 代表的端側(cè)路線給出了一個(gè)清晰的回答：AI 最強(qiáng)大的能力，應(yīng)該跑在每個(gè)人自己的設(shè)備上。開(kāi)源、本地、可審計(jì)——AI 最強(qiáng)大的能力，應(yīng)該跑在每個(gè)人自己的設(shè)備上。這不是一句口號(hào)，而是一個(gè)正在被實(shí)現(xiàn)的技術(shù)路線。

階段	開(kāi)放內(nèi)容	目標(biāo)用戶	狀態(tài)
Phase 1（當(dāng)前）	開(kāi)源 CUA Skills——GUI 操作的技能庫(kù)	Agent愛(ài)好者，OpenClaw/Claude Code用戶	已發(fā)布
Phase 2	開(kāi)源本地模型 + Python SDK——完整的端側(cè)推理能力	高安全需求開(kāi)發(fā)者，本地部署	即將開(kāi)放
Phase 3	開(kāi)源訓(xùn)練方法 + 剪枝量化技術(shù)	研究人員、模型訓(xùn)練者	規(guī)劃中

立即體驗(yàn)：`brew install mano-cua`

七、常見(jiàn)問(wèn)題

Q: Mano-P 是什么？

Q: Mano-P 與 Claude Computer Use 相比如何？

對(duì)比維度	Mano-P	Claude Computer Use
OSWorld（全部模型）	58.2%（專用模型第一，全部模型前五）	全部模型第一（千億參數(shù)級(jí)通用大模型）
WebRetriever Protocol I	41.7 NavEval（領(lǐng)先）	31.3（Claude 4.5）
數(shù)據(jù)流向	完全本地，截圖不出設(shè)備	需上傳到云端 API
離線運(yùn)行	? 支持	? 不支持
主動(dòng)性	? 7×24 無(wú)限制運(yùn)行	?? 受平臺(tái)算力成本限制
開(kāi)源	? Apache 2.0 協(xié)議	? 閉源

Mano-P 在專用模型中排名全球第一，在網(wǎng)頁(yè)檢索等任務(wù)上領(lǐng)先 Claude，且天然滿足數(shù)據(jù)安全要求。適合高安全需求場(chǎng)景。

Q: Mano-P 可以離線運(yùn)行嗎？

可以！在本地模式下，所有模型推理都在 Apple M4 設(shè)備上運(yùn)行。? 不會(huì)向外部服務(wù)器發(fā)送任何截圖或任務(wù)描述。

Q: 需要什么硬件配置？

最低要求：Mac mini 或 MacBook；Apple M4 芯片；32GB 內(nèi)存

替代方案：任何 Mac + Mano-P 算力棒（通過(guò) USB 4.0+ 連接）

我們計(jì)劃在未來(lái)支持更多設(shè)備。

了解更多：[GitHub – Mininglamp-AI/Mano-P] (https://github.com/Mininglamp-AI/Mano-P)

聯(lián)系我們：model@mininglamp.com

Mano-P：全球第一的端側(cè) GUI 智能體模型，讓 AI 在你的設(shè)備上替你操作電腦

admin — Mon, 13 Apr 2026 08:02:08 +0000

AI for Personal——最懂你的 AI，只有你自己能造。2026 年 3 月，明略科技（港交所：2718.HK）在 GitHub 上開(kāi)源了 Mano-P——一款專為邊緣設(shè)備設(shè)計(jì)的 GUI 智能體模型，圍繞隱私與個(gè)性化兩大支柱，讓每個(gè)人都能在自己的設(shè)備上擁有一雙 AI 的手。72B 模型屠榜，4B 蒸餾版上機(jī)。Mano-P 在 OSWorld 基準(zhǔn)測(cè)試中以 58.2% 的成功率拿下專用模型全球第一，領(lǐng)先第二名超過(guò) 13 個(gè)百分點(diǎn)，并在 WebRetriever 等多項(xiàng)評(píng)測(cè)中超越千億參數(shù)級(jí)通用大模型。與當(dāng)前主流的云端 GUI 智能體不同，Mano-P 可以完全在用戶自己的 Mac 上本地運(yùn)行，屏幕截圖和任務(wù)數(shù)據(jù)不出設(shè)備。這款采用 Apache 2.0 協(xié)議的開(kāi)源項(xiàng)目，正在重新定義 AI 操作電腦的方式。

關(guān)鍵要點(diǎn)

Mano-P 是明略科技開(kāi)源的 GUI-VLA（Vision-Language-Action）智能體，專為蘋果芯片邊緣設(shè)備設(shè)計(jì)，支持完全本地運(yùn)行
72B 屠榜，4B 上機(jī)：72B 模型拿下 OSWorld 專用模型全球第一，蒸餾為 4B 版本可在 M4 Mac 上流暢運(yùn)行
本地模式下所有推理在設(shè)備上完成，屏幕截圖不出設(shè)備，支持完全離線運(yùn)行
4B 量化模型在 M4 Pro 上峰值內(nèi)存僅 4.3GB，預(yù)填充 476 tokens/s——一臺(tái) MacBook 就能流暢運(yùn)行
三種使用形式（命令行/SDK/Agent Skill）覆蓋開(kāi)發(fā)者到普通用戶全場(chǎng)景
Apache 2.0 開(kāi)源協(xié)議，三階段逐步釋放完整技術(shù)棧——從 CUA Skills 到本地模型 + SDK 再到訓(xùn)練方法 + 剪枝量化技術(shù)

一、Mano-P 是什么

Mano-P 是明略科技推出的開(kāi)源 GUI 智能體項(xiàng)目。Mano 是西班牙語(yǔ)里“手”的意思，P 有兩重含義：Person（個(gè)體）與 Party（組織）——我們相信，無(wú)論個(gè)人還是企業(yè)，都能夠創(chuàng)造屬于自己的個(gè)性化 AI。其三階段開(kāi)源計(jì)劃正在逐步釋放完整的技術(shù)棧：Phase 1 開(kāi)源 CUA Skills，Phase 2 開(kāi)源本地模型 + Python SDK，Phase 3 開(kāi)源訓(xùn)練方法 + 剪枝量化技術(shù)。

一句話概括：Mano-P 是一雙 AI 的手，能像人類一樣看屏幕、理解界面、操作電腦，而且完全跑在你自己的設(shè)備上。

它不是 RPA

和傳統(tǒng) RPA（機(jī)器人流程自動(dòng)化）相比，Mano-P 有本質(zhì)區(qū)別：

維度	傳統(tǒng) RPA	Mano-P
工作方式	依賴 API 和預(yù)設(shè)規(guī)則	純視覺(jué)理解，像人一樣“看”界面
界面變化	界面改版需重新配置	自適應(yīng)，理解語(yǔ)義而非像素坐標(biāo)
覆蓋范圍	僅支持有 API 的系統(tǒng)	能操作任何人類可操作的軟件
遺留系統(tǒng)	無(wú)法處理老舊系統(tǒng)	通過(guò)視覺(jué)交互，無(wú)需 API 接口
部署方式	通常需要服務(wù)器	本地設(shè)備即可運(yùn)行

二、72B 屠榜，4B 上機(jī)：五項(xiàng)基準(zhǔn)測(cè)試，多項(xiàng)全球領(lǐng)先

Mano-P 不是一個(gè)概念產(chǎn)品——它的能力經(jīng)過(guò)了權(quán)威基準(zhǔn)測(cè)試的嚴(yán)格驗(yàn)證。

核心成績(jī)單

基準(zhǔn)測(cè)試	Mano-P 成績(jī)	排名	說(shuō)明
OSWorld（專用模型）	58.2%	全球第一	領(lǐng)先第二名 OpenCUA-72b（45.0%）13.2 個(gè)百分點(diǎn)
OSWorld（全部模型）	58.2%	第五	前四均為千億參數(shù)級(jí)通用大模型
WebRetriever Protocol I	41.7 NavEval	全球第一	超越 Gemini 2.5 Pro（40.9）和 Claude 4.5 CU（31.3）
ScreenSpot-V2	93.5	SOTA	GUI 元素定位精度
MMBench	87.5	SOTA	多模態(tài)理解綜合評(píng)測(cè)
UI-Vision	46.6	SOTA	UI 視覺(jué)理解
OS-World-G	69.5	SOTA	GUI Grounding 定位能力
端側(cè)推理（4B, M4 Pro）	476 tokens/s 預(yù)填充	—	峰值內(nèi)存 4.3GB，解碼 76 tokens/s

一句話總結(jié)：72B 模型屠榜證明技術(shù)實(shí)力，蒸餾為 4B 上機(jī)證明日常可用。對(duì)于Mano-P來(lái)說(shuō)，能力和便捷不是二選一。經(jīng)過(guò)專項(xiàng)訓(xùn)練和優(yōu)化的專用模型，在特定任務(wù)上完全可以比“大塊頭”更強(qiáng)。端側(cè)模型不等于弱模型。

三、怎么做到“又大又快”：三項(xiàng)核心技術(shù)

在消費(fèi)級(jí)設(shè)備上運(yùn)行大參數(shù)模型做 GUI 操作，靠的是三項(xiàng)關(guān)鍵技術(shù)突破。

GSPruning 視覺(jué) Token 剪枝

處理高分辨率屏幕截圖時(shí)，Mano-P 智能識(shí)別關(guān)鍵信息——保留界面結(jié)構(gòu)骨架和重要 UI 元素，將視覺(jué) Token 壓縮至 12.57%。打個(gè)比方：看一張復(fù)雜的屏幕截圖，普通模型會(huì)逐像素地“讀”完整張圖，而 Mano-P 只看最重要的 13%——按鈕在哪、輸入框在哪、當(dāng)前選中了什么。推理速度提升數(shù)倍，任務(wù)成功率幾乎不受影響。

混合精度量化（w4a16）

用更緊湊的方式存儲(chǔ)模型——權(quán)重用 4bit 存儲(chǔ)，激活值保留 16bit。效果：

峰值內(nèi)存：4.3GB（MacBook 32GB 內(nèi)存綽綽有余，跑 AI 的同時(shí)還能正常辦公）
預(yù)填充速度：476 tokens/s（每秒吐出約 300-400 個(gè)中文字，回答幾乎瞬間出現(xiàn)）
解碼速度：76 tokens/s
一臺(tái) MacBook Pro 就能流暢運(yùn)行

Mano-Action 雙向自增強(qiáng)訓(xùn)練

傳統(tǒng)模型只做單向?qū)W習(xí)——你告訴它“點(diǎn)擊登錄按鈕”，它學(xué)會(huì)去找登錄按鈕。Mano-P 同時(shí)訓(xùn)練兩個(gè)方向：“描述→定位”和“定位→描述”，通過(guò)循環(huán)一致性互相驗(yàn)證——既能根據(jù)指令找到按鈕，也能看到按鈕說(shuō)出它是什么。配合三階段漸進(jìn)訓(xùn)練（SFT → 離線 RL → 在線 RL），模型從“背操作手冊(cè)”進(jìn)化到“真正學(xué)會(huì)操作界面”。

四、為什么端側(cè)是剛需：不只是安全，更是主動(dòng)性

大多數(shù)人以為端側(cè)模型的核心賣點(diǎn)是“數(shù)據(jù)安全”。這沒(méi)錯(cuò)，但更根本的原因是：云端 AI 不可能真正“主動(dòng)”幫你。

真正有用的 AI 助手應(yīng)該是主動(dòng)的——自己發(fā)現(xiàn)你有個(gè)會(huì)議快開(kāi)了，自動(dòng)幫你準(zhǔn)備資料；看到你收到一封重要郵件，自動(dòng)提醒你；發(fā)現(xiàn)常用的系統(tǒng)數(shù)據(jù)有異常，主動(dòng)去核查。但這種“主動(dòng)性”意味著 AI 要不停地自發(fā)運(yùn)算——每隔幾分鐘檢查一次郵箱、日歷、文件。

在云端，每一次運(yùn)算都消耗平臺(tái)的算力和費(fèi)用。一個(gè)用戶一天可能產(chǎn)生上千次自發(fā)調(diào)用，乘以幾百萬(wàn)用戶，服務(wù)器費(fèi)用爆炸。所以云端平臺(tái)必然限制 AI 的主動(dòng)性——不讓它太頻繁地自己動(dòng)，因?yàn)槊俊爸鲃?dòng)”一次就是在燒平臺(tái)的錢。

端側(cè)模型從根本上解決了這個(gè)問(wèn)題：AI 跑在你自己的設(shè)備上，用的是你自己的芯片和電。它主動(dòng)跑一萬(wàn)次也不花平臺(tái)一分錢。這才是真正 7×24 貼身 AI 助手的唯一解。

Mano-P 提供本地模式和云端模式兩種推理方式。核心差異在于數(shù)據(jù)流向：

安全維度	本地模式	云端模式
推理位置	Mac 本地 / 算力棒	mano.mininglamp.com
截圖數(shù)據(jù)	? 不出設(shè)備	?? 發(fā)送到云端分析
離線能力	? 完全離線可用	? 需要聯(lián)網(wǎng)
主動(dòng)性	? 7×24 無(wú)限制運(yùn)行	?? 受平臺(tái)成本限制
適用場(chǎng)景	高安全要求（金融/醫(yī)療/政務(wù)）	一般場(chǎng)景
代碼審計(jì)	? 完整開(kāi)源	? 完整開(kāi)源

系統(tǒng)自動(dòng)檢測(cè)本地模型配置：有本地模型用本地，沒(méi)有就自動(dòng)切換云端，無(wú)縫銜接。對(duì)于金融、醫(yī)療、法律、政務(wù)等對(duì)數(shù)據(jù)安全有剛性要求的行業(yè)，本地模式不是可選項(xiàng)——是唯一選項(xiàng)。

五、三種使用方式：誰(shuí)都能用

使用形式	適合誰(shuí)	安裝方式	特點(diǎn)
mano-cua（命令行）	開(kāi)發(fā)者、高級(jí)用戶	brew install mano-cua	終端直接運(yùn)行任務(wù)
mano-client（Python SDK）	Python 開(kāi)發(fā)者	pip install mano-client（開(kāi)發(fā)中）	集成到現(xiàn)有項(xiàng)目，支持異步調(diào)用
mano-skill（Agent 技能插件）	AI Agent 平臺(tái)用戶	OpenClaw 插件安裝	Agent 編排 + GUI 執(zhí)行無(wú)縫銜接

運(yùn)行時(shí)，屏幕右上角顯示狀態(tài)面板，實(shí)時(shí)顯示任務(wù)進(jìn)度。敏感操作執(zhí)行前會(huì)要求用戶確認(rèn)——AI 干活，人類監(jiān)督。

六、真實(shí)應(yīng)用場(chǎng)景

Mano-P 已經(jīng)在多個(gè)場(chǎng)景中完成驗(yàn)證：

場(chǎng)景 1：全自動(dòng)化應(yīng)用構(gòu)建（Mano-afk）

系統(tǒng)接收自然語(yǔ)言需求后，自動(dòng)完成需求澄清 → 技術(shù)架構(gòu)設(shè)計(jì) → 代碼生成 → 本地部署 → 多層測(cè)試（API 測(cè)試 + 視覺(jué)檢測(cè) + 端到端 GUI 自動(dòng)化測(cè)試）。測(cè)試不通過(guò)時(shí)自動(dòng)定位根因、修復(fù)代碼、重新部署。全流程無(wú)需人工干預(yù)。

場(chǎng)景 2：商業(yè)視頻智能系統(tǒng)

從下發(fā)指令到視頻生成、上傳、分析、剪輯、二次評(píng)測(cè)的完整工作流。系統(tǒng)自主操作網(wǎng)頁(yè)與剪輯軟件，完成文件處理、字幕修改等精細(xì)操作，生成包含主客觀指標(biāo)的分析報(bào)告。

場(chǎng)景 3：企業(yè)級(jí)長(zhǎng)任務(wù)執(zhí)行

支持 100+ 步驟的企業(yè)級(jí)業(yè)務(wù)流程自動(dòng)化，包括跨應(yīng)用數(shù)據(jù)錄入、系統(tǒng)間信息遷移、批量文檔處理等復(fù)雜任務(wù)，全程無(wú)需聯(lián)網(wǎng)。

七、開(kāi)源路線圖：Apache 2.0 協(xié)議，三階段漸進(jìn)開(kāi)放

Mano-P 采用 Apache 2.0 開(kāi)源協(xié)議——寬松且附帶專利保護(hù)的開(kāi)源協(xié)議，任何人和企業(yè)都可以自由使用、修改和商用，無(wú)傳染性限制，且自動(dòng)授予專利許可——企業(yè)用了不會(huì)被專利訴訟。對(duì)投資人來(lái)說(shuō)，這意味著生態(tài)壁壘不靠法律鎖定，而靠技術(shù)領(lǐng)先和社區(qū)信任。

分三個(gè)階段漸進(jìn)開(kāi)放完整技術(shù)棧。其三階段開(kāi)源計(jì)劃正在逐步釋放完整的技術(shù)棧：

階段	開(kāi)放內(nèi)容	說(shuō)明	狀態(tài)
Phase 1（當(dāng)前）	CUA Skills	GUI 操作的技能庫(kù)	已開(kāi)源
Phase 2	本地模型 + Python SDK	完整的端側(cè)推理能力	即將開(kāi)放
Phase 3	訓(xùn)練方法 + 剪枝量化技術(shù)	讓更多團(tuán)隊(duì)訓(xùn)練自己的端側(cè)模型	規(guī)劃中

技術(shù)論文已發(fā)布：arXiv:2509.17336 (https://arxiv.org/abs/2509.17336)

立即體驗(yàn)：`brew install mano-cua`

八、常見(jiàn)問(wèn)題

Q: Mano-P 是什么？

Mano-P 是明略科技開(kāi)源的 GUI-VLA（Vision-Language-Action）智能體，設(shè)計(jì)用于在蘋果芯片邊緣設(shè)備上本地運(yùn)行。它使用純視覺(jué)理解來(lái)跨平臺(tái)自動(dòng)化桌面 GUI 操作。P 代表 Person（個(gè)體）與 Party（組織）——無(wú)論個(gè)人還是企業(yè)，都能夠創(chuàng)造屬于自己的個(gè)性化 AI。

Q: Mano-P 可以離線運(yùn)行嗎？

可以！在本地模式下，所有模型推理都在 Apple M4 設(shè)備上運(yùn)行。? 不會(huì)向外部服務(wù)器發(fā)送任何截圖或任務(wù)描述。

Q: Mano-P需要什么硬件配置？

最低要求：Mac mini 或 MacBook、Apple M4 芯片、32GB 內(nèi)存
替代方案：任何 Mac + Mano-P 算力棒（通過(guò) USB 4.0+ 連接）
計(jì)劃未來(lái)支持更多設(shè)備

Q: Mano-P 與 Claude Computer Use 相比如何？

對(duì)比維度	Mano-P	Claude Computer Use
OSWorld	58.2%（專用模型第一，全模型前五）	全部模型第一（千億參數(shù)級(jí)）
WebRetriever	41.7 NavEval（領(lǐng)先）	31.3（Claude 4.5）
數(shù)據(jù)流向	完全本地，截圖不出設(shè)備	需上傳到云端 API
離線運(yùn)行	? 支持	? 不支持
主動(dòng)性	? 7×24 無(wú)限制運(yùn)行	?? 受平臺(tái)算力成本限制
開(kāi)源	? Apache 2.0	? 閉源

Mano-P 在專用模型中排名全球第一，在網(wǎng)頁(yè)檢索等任務(wù)上領(lǐng)先 Claude，且天然滿足數(shù)據(jù)安全要求。適合高安全需求場(chǎng)景和需要 AI 主動(dòng)服務(wù)的場(chǎng)景。

更多詳情請(qǐng)登錄GitHub了解

GitHub：[github.com/Mininglamp-AI/Mano-P] (https://github.com/Mininglamp-AI/Mano-P)

聯(lián)系我們：model@mininglamp.com

明略科技發(fā)布 2025 財(cái)年業(yè)績(jī)：全面邁入 AI 原生運(yùn)營(yíng)時(shí)代，智能體化服務(wù)加速落地

admin — Fri, 27 Mar 2026 08:24:29 +0000

明略科技（2718.HK）正式發(fā)布截至 2025 年 12 月 31 日止年度的全年業(yè)績(jī)。報(bào)告期內(nèi)，公司實(shí)現(xiàn)營(yíng)業(yè)收入14.26億元，同比增長(zhǎng)3.2%；毛利達(dá)到7.9億元，同比增長(zhǎng)10.8%；經(jīng)調(diào)整凈利潤(rùn)（Non-HKFRS）達(dá)0.42億元，實(shí)現(xiàn)扭虧為盈。

在財(cái)務(wù)表現(xiàn)與經(jīng)營(yíng)質(zhì)量持續(xù)向好的同時(shí)，明略科技已全面邁入 AI 原生運(yùn)營(yíng)時(shí)代。AI 正加速?gòu)妮o助工具轉(zhuǎn)變?yōu)榍度胝鎸?shí)業(yè)務(wù)流的關(guān)鍵生產(chǎn)力，推動(dòng)公司從“提供數(shù)據(jù)智能”進(jìn)一步走向“交付可量化結(jié)果”。其中，Agentic Services（智能體化服務(wù)）業(yè)務(wù)模式已完成從能力驗(yàn)證到商業(yè)化落地的關(guān)鍵突破，成為明略科技推動(dòng) AI 商業(yè)化演進(jìn)的重要標(biāo)志。

明略科技創(chuàng)始人、CEO 兼 CTO 吳明輝表示：“2025 年，明略科技完成了一次關(guān)鍵轉(zhuǎn)型——從幫助客戶‘看懂?dāng)?shù)據(jù)’，到幫助客戶‘拿到結(jié)果’。Agentic Services 的意義，正是在于推動(dòng) AI 的價(jià)值從工具交付走向結(jié)果交付。這不僅改變了客戶采購(gòu)專業(yè)服務(wù)的邏輯，也正在重塑服務(wù)方式與商業(yè)模式，為明略未來(lái)打開(kāi)更大的增長(zhǎng)空間。”

經(jīng)營(yíng)質(zhì)量持續(xù)優(yōu)化，AI 深度重塑業(yè)務(wù)流

2025 財(cái)年，明略科技繼續(xù)以 Data Intelligence（數(shù)據(jù)智能）為基礎(chǔ)盤，以 Agentic AI 為核心驅(qū)動(dòng)力，推動(dòng)業(yè)務(wù)結(jié)構(gòu)持續(xù)優(yōu)化。公司目前已賦能約 2,100 家知名品牌客戶以及逾 24 萬(wàn)家企業(yè)用戶，持續(xù)幫助客戶優(yōu)化決策、提升運(yùn)營(yíng)效率。報(bào)告期內(nèi)，公司大客戶續(xù)約率達(dá)到 96%，核心客戶群保持穩(wěn)定，整體業(yè)務(wù)展現(xiàn)出較強(qiáng)的韌性與黏性。

依托自研企業(yè)級(jí)可信商業(yè)智能體平臺(tái) DeepMiner，公司已將 AI 系統(tǒng)性嵌入主要業(yè)務(wù)線，推動(dòng)交付邏輯加速向“Agent 驅(qū)動(dòng)”轉(zhuǎn)變，并在多個(gè)核心場(chǎng)景中取得明確成效，實(shí)現(xiàn)Data Intelligence業(yè)務(wù)板塊的運(yùn)營(yíng)效率提升，其中營(yíng)銷智能業(yè)務(wù)交付提效最高可達(dá)4倍，營(yíng)運(yùn)智能業(yè)務(wù)實(shí)現(xiàn)單工單解決時(shí)間壓縮超過(guò)30%。

報(bào)告期內(nèi)，秒針系統(tǒng)全面推進(jìn)工作流的 Agentic AI 改造，歷時(shí) 60 天實(shí)現(xiàn)全鏈路貫通，系統(tǒng)性解決了社媒數(shù)據(jù)處理與AI應(yīng)用的融合難題。在保留必要人機(jī)協(xié)作的前提下，全鏈路AI自動(dòng)完成率達(dá)90%，深度復(fù)盤報(bào)告產(chǎn)出工作實(shí)現(xiàn)了 20 倍的人效提升，系統(tǒng)輸出在洞察穩(wěn)定性、框架完整性、深層洞察能力及微趨勢(shì)識(shí)別新穎性等方面也均有顯著提升。

AI 正在從輔助工具逐步演進(jìn)為業(yè)務(wù)流中的關(guān)鍵生產(chǎn)力，驅(qū)動(dòng)公司從傳統(tǒng)人力主導(dǎo)的交付模式，邁向更高效率、更強(qiáng)復(fù)用能力的智能化運(yùn)營(yíng)體系。

Agentic Services 模式加速落地，已實(shí)現(xiàn)規(guī)模化收入

基于長(zhǎng)期沉淀的海量營(yíng)銷數(shù)據(jù)、客戶場(chǎng)景理解及行業(yè) Know-how，明略科技前瞻性布局 Agentic Services 模式，并正推動(dòng)其加速落地。報(bào)告期內(nèi)，公司Agentic Services 業(yè)務(wù)收入超過(guò) 1 億元。作為公司 AI 商業(yè)化的重要方向，Agentic Services 不再停留于工具輸出或單點(diǎn)能力交付，而是進(jìn)一步面向客戶可量化的業(yè)務(wù)目標(biāo)，提供更貼近結(jié)果的端到端服務(wù)。

報(bào)告期內(nèi)，公司新增大客戶中超過(guò) 30% 來(lái)自 Agentic Services 業(yè)務(wù)板塊，表明這一模式已在多個(gè)行業(yè)的復(fù)雜需求中展現(xiàn)出較強(qiáng)的商業(yè)適配性和現(xiàn)實(shí)吸引力。圍繞營(yíng)銷場(chǎng)景，明略科技已打通從數(shù)據(jù)洞察、內(nèi)容生產(chǎn)與分發(fā)到營(yíng)銷投放的端到端業(yè)務(wù)流，以近 3 倍的運(yùn)營(yíng)效率幫助客戶實(shí)現(xiàn)平均 20% 的營(yíng)銷效果增長(zhǎng)。

AI 原生底座持續(xù)強(qiáng)化，構(gòu)筑可信智能長(zhǎng)期壁壘

無(wú)論是核心業(yè)務(wù)效率提升，還是 Agentic Services 模式的加速落地，都離不開(kāi)底層技術(shù)體系的持續(xù)支撐。作為明略科技自主研發(fā)的企業(yè)級(jí)可信 AI 智能體平臺(tái)，DeepMiner 已成為連接公司各項(xiàng)業(yè)務(wù)能力的統(tǒng)一基礎(chǔ)設(shè)施，并持續(xù)支撐業(yè)務(wù)從單點(diǎn)提效走向系統(tǒng)級(jí)協(xié)同。

DeepMiner 采用“調(diào)度—決策—執(zhí)行”的多智能體分層協(xié)作架構(gòu)，能夠在復(fù)雜商業(yè)場(chǎng)景中實(shí)現(xiàn)從理解任務(wù)、規(guī)劃路徑到執(zhí)行落地的全鏈條協(xié)同。截至 2025 年 10 月，公司自研 GUI 模型 Mano 在 OS-World 榜單位列總榜第二、Mind2Web 榜單第一；推理模型 Cito 則在 BFCL 小尺寸模型領(lǐng)域排名第一，以持續(xù)創(chuàng)新、領(lǐng)先行業(yè)的技術(shù)實(shí)力，進(jìn)一步夯實(shí)了明略科技在可信 AI 賽道上的長(zhǎng)期壁壘。

值得一提的是，明略科技已將 AI 深度融入組織運(yùn)行的日常肌理。報(bào)告期內(nèi)，公司實(shí)現(xiàn)全體員工 100% 接入 DeepMiner 平臺(tái)。員工可結(jié)合具體業(yè)務(wù)場(chǎng)景，自主創(chuàng)建并部署專屬業(yè)務(wù) Agent，推動(dòng)內(nèi)部標(biāo)準(zhǔn)操作路徑從單向人力執(zhí)行，逐步演進(jìn)為人機(jī)協(xié)同編排。通過(guò)這一持續(xù)深入的內(nèi)部實(shí)踐，DeepMiner 已逐步沉淀為支撐公司日常運(yùn)轉(zhuǎn)的組織級(jí)基礎(chǔ)設(shè)施。

面向未來(lái)，推動(dòng) Agentic Services 規(guī)模化發(fā)展

明略科技將堅(jiān)定圍繞“可信”這一核心方向，持續(xù)推進(jìn)業(yè)務(wù)縱深發(fā)展。一方面，公司將推進(jìn)軟硬一體化部署，進(jìn)一步筑牢 Agentic AI 基礎(chǔ)設(shè)施；另一方面，將加速 Agentic Services 模式在更多場(chǎng)景中的復(fù)制，持續(xù)拓寬其在內(nèi)容營(yíng)銷、文娛生態(tài)及更多數(shù)字白領(lǐng)工作領(lǐng)域的應(yīng)用邊界，并向人力與專家密集型行業(yè)滲透。

圍繞系統(tǒng)割裂、流程斷點(diǎn)、數(shù)據(jù)孤島等現(xiàn)實(shí)痛點(diǎn)，公司將通過(guò)可信 AI 勞動(dòng)力的規(guī)模化輸出，推動(dòng)更多行業(yè)實(shí)現(xiàn) Agent 化改造。

與此同時(shí)，明略科技也將持續(xù)對(duì)外輸出端到端 AI 調(diào)度能力，系統(tǒng)性拓展全球化業(yè)務(wù)版圖，構(gòu)建多智能體協(xié)作平臺(tái)，探索人機(jī)協(xié)同生產(chǎn)力的新范式。

從提供工具到交付結(jié)果，從局部提效到 AI 原生運(yùn)營(yíng)，明略科技正在通過(guò)一個(gè)個(gè)真實(shí)的業(yè)務(wù)閉環(huán)，持續(xù)驗(yàn)證可信 Agentic AI 的產(chǎn)業(yè)價(jià)值，并致力于將“結(jié)果可驗(yàn)證、過(guò)程可審計(jì)、知識(shí)可沉淀”的確定性標(biāo)準(zhǔn)，逐步沉淀為產(chǎn)業(yè) AI 原生交付的通用準(zhǔn)則。沿著“讓 AI 真正走進(jìn)業(yè)務(wù)、走向結(jié)果、走向規(guī)模化”的方向，明略科技將繼續(xù)堅(jiān)定前行。

明略科技-W(02718.HK)2025年年度業(yè)績(jī)發(fā)布會(huì)

admin — Thu, 26 Mar 2026 10:05:42 +0000

給廣告做「腦電圖」：AdEff 為什么又快又準(zhǔn)？

admin — Tue, 24 Mar 2026 08:33:04 +0000

一條廣告好不好，該問(wèn)消費(fèi)者，還是問(wèn)他的大腦？

問(wèn)卷調(diào)查用了半個(gè)多世紀(jì)，邏輯清晰但有個(gè)致命bug：消費(fèi)者喜歡的廣告和刷手機(jī)時(shí)真正會(huì)看完的，往往不是同一條。

諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主丹尼爾·卡尼曼曾指出，人的大多數(shù)日常決策是由無(wú)意識(shí)的”系統(tǒng) 1″驅(qū)動(dòng)的。

問(wèn)卷調(diào)研本質(zhì)上是用理性的”系統(tǒng) 2″回答”系統(tǒng) 1″；腦電和眼動(dòng)測(cè)量則直接捕捉大腦對(duì)廣告的真實(shí)反應(yīng)。問(wèn)題是：?jiǎn)柧肀阋说粔驕?zhǔn)，腦電準(zhǔn)但太貴。

直到我們找到了第三條路——用 AI 來(lái)”問(wèn)大腦”。

AdEff 是明略科技（2718.HK）于2025年推出的 AI 驅(qū)動(dòng)的全球化廣告創(chuàng)意測(cè)試及優(yōu)化平臺(tái)。基于自研超圖多模態(tài)大語(yǔ)言模型（HMLLM）+過(guò)去10+年積累的10萬(wàn)+次神經(jīng)科學(xué)測(cè)量經(jīng)驗(yàn)和數(shù)據(jù)”研發(fā)。用戶上傳一條廣告視頻，最快 15 分鐘即可拿到一份完整的測(cè)試報(bào)告，涵蓋受眾注意力曲線、情感波動(dòng)分析、關(guān)鍵時(shí)刻診斷等多維度分析以及具體優(yōu)化建議。

聽(tīng)上去很簡(jiǎn)單？值得拆解的是底層。

01 為什么是”超圖”？

AdEff 的核心技術(shù)底座是我們自主研發(fā)的 HMLLM（超圖多模態(tài)大語(yǔ)言模型，Hypergraph Multimodal Large Language Model）。這個(gè)名字里最關(guān)鍵的一個(gè)詞是“超圖”。

先說(shuō)”圖”。在數(shù)學(xué)中，圖是描述關(guān)系的結(jié)構(gòu)：兩個(gè)節(jié)點(diǎn)之間畫一條邊，表示它們有關(guān)聯(lián)。社交網(wǎng)絡(luò)就是典型的圖，你和每個(gè)朋友之間各連一條線。但普通圖有一個(gè)局限：每條邊只能連接兩個(gè)節(jié)點(diǎn)，只能表達(dá)”A 和 B 有關(guān)系”這種兩兩之間的簡(jiǎn)單關(guān)聯(lián)。

“超圖”突破了這一限制。一條超邊可以同時(shí)連接任意多個(gè)節(jié)點(diǎn)，描述的是”A、B、C、D 同時(shí)出現(xiàn)時(shí)才會(huì)產(chǎn)生的高階關(guān)聯(lián)”。

為什么廣告測(cè)試需要超圖？因?yàn)橐粭l廣告的效果從來(lái)不是單一元素決定的。

舉個(gè)例子：一條 15 秒的品牌廣告中，第 3 秒的畫面切換、背景音樂(lè)從舒緩變激昂、字幕上閃過(guò)一句”限時(shí)特惠”。這三個(gè)元素單獨(dú)來(lái)看都平平無(wú)奇，但它們?cè)谕粫r(shí)刻疊加，可能恰好觸發(fā)了一次注意力峰值。這種多因素的協(xié)同效應(yīng)，普通圖結(jié)構(gòu)捕捉不到，但超圖可以。

HMLLM 正是通過(guò)超圖結(jié)構(gòu)來(lái)建模視覺(jué)元素、EEG 腦電信號(hào)與眼動(dòng)追蹤數(shù)據(jù)之間的復(fù)雜關(guān)系。模型不僅能”看”到廣告里有什么畫面、”聽(tīng)”到了什么聲音，更能捕捉這些多模態(tài)信息同時(shí)出現(xiàn)時(shí)，人類大腦產(chǎn)生了怎樣的反應(yīng)——注意力是否被吸引、情緒是否波動(dòng)、品牌信息是否被編碼進(jìn)記憶。

這項(xiàng)技術(shù)代表了全球范圍內(nèi)首次嘗試讓機(jī)器系統(tǒng)性地理解人類觀看視頻時(shí)的主觀感受，我們的相關(guān)研究成果在全球頂級(jí)多媒體會(huì)議 ACM Multimedia（ACMMM）2024 上獲得最佳論文提名。

02 自研超大規(guī)模數(shù)據(jù)集支撐

一個(gè)模型的預(yù)測(cè)能力，取決于它見(jiàn)過(guò)多少”真題”。

HMLLM 的訓(xùn)練數(shù)據(jù)既不是通用互聯(lián)網(wǎng)語(yǔ)料，也不是人工標(biāo)注的廣告質(zhì)量分類集。它來(lái)自一個(gè)更稀缺、更有價(jià)值的數(shù)據(jù)源：大規(guī)模真人受眾的腦電與眼動(dòng)測(cè)量數(shù)據(jù)。

在 AdEff 問(wèn)世之前，我們用了超過(guò)十年的時(shí)間積累這些數(shù)據(jù)。把真人受試者請(qǐng)進(jìn)實(shí)驗(yàn)室，戴上 EEG 腦電帽、坐在眼動(dòng)儀前，觀看不同的廣告素材，全程采集他們的神經(jīng)信號(hào)和視覺(jué)注意力數(shù)據(jù)。然后把這些主觀反應(yīng)數(shù)據(jù)與廣告素材的多模態(tài)特征一一配對(duì)，形成訓(xùn)練集。迄今為止，這個(gè)數(shù)據(jù)集已經(jīng)積累了超過(guò) 10 萬(wàn)人次的真實(shí)測(cè)量數(shù)據(jù)，覆蓋了跨行業(yè)、跨品類、跨文化的廣告素材。

在此基礎(chǔ)上，我們構(gòu)建并開(kāi)源了兩個(gè)原創(chuàng)數(shù)據(jù)集：

? Video-SME：大規(guī)模視頻主觀多模態(tài)評(píng)估數(shù)據(jù)集，收集了不同人群在觀看相同視頻內(nèi)容時(shí)的腦電波和眼動(dòng)區(qū)域的真實(shí)變化，為視頻內(nèi)容的主觀體驗(yàn)量化提供了標(biāo)準(zhǔn)化基準(zhǔn)。

? SPA-ADV：大規(guī)模廣告注視點(diǎn)預(yù)測(cè)數(shù)據(jù)集，專注于捕捉個(gè)體差異對(duì)視覺(jué)注意力的影響。

這也是 AdEff 最核心的壁壘所在：不僅有海量廣告素材，更有海量廣告素材所對(duì)應(yīng)的真實(shí)人類神經(jīng)反應(yīng)數(shù)據(jù)，也是我們推動(dòng)整個(gè)行業(yè)建立更科學(xué)的廣告效果評(píng)估標(biāo)準(zhǔn)所貢獻(xiàn)的綿薄之力。

03 15 分鐘出報(bào)告，AdEff 如何實(shí)現(xiàn)？

用戶上傳一條廣告素材后，HMLLM 經(jīng)歷四個(gè)核心步驟：

第一步，內(nèi)容解碼。 將廣告素材拆解為結(jié)構(gòu)化的多模態(tài)特征向量，如畫面構(gòu)成、文案語(yǔ)義、品牌元素的出現(xiàn)時(shí)機(jī)與位置，每一幀都被充分解析。

第二步，反饋預(yù)測(cè)。基于超圖結(jié)構(gòu)，將多模態(tài)特征映射到腦電和眼動(dòng)空間，預(yù)測(cè)真實(shí)受眾的注意力分配模式、情緒反應(yīng)曲線等信息，輸出注意力曲線和情感波動(dòng)圖，并自動(dòng)識(shí)別出關(guān)鍵時(shí)刻。

第三步，基準(zhǔn)對(duì)標(biāo)。將預(yù)測(cè)結(jié)果與創(chuàng)意數(shù)據(jù)庫(kù)中同品類、同媒介形式的歷史數(shù)據(jù)進(jìn)行比對(duì)。同樣一個(gè)注意力得分，對(duì)快消品和汽車行業(yè)的含義完全不同，需要在正確的參照系下解讀。

第四步，診斷推理。基于明略科技自研大模型的多智能體協(xié)作架構(gòu)，不同的 Agent 分別負(fù)責(zé)歸因分析、優(yōu)化建議生成和可視化呈現(xiàn)。最終輸出的報(bào)告不僅能告訴用戶哪一秒注意力下降了，還會(huì)指出為什么下降以及如何改進(jìn)，讓優(yōu)化有據(jù)可依。

經(jīng)科學(xué)驗(yàn)證，89% 的 AdEff 預(yù)測(cè)得分與真人樣本測(cè)試結(jié)果具有強(qiáng)相關(guān)性，76% 的測(cè)評(píng)結(jié)論與行業(yè)專家判斷一致。在絕大多數(shù)場(chǎng)景下，AI 預(yù)測(cè)的可靠性已經(jīng)足以支撐商業(yè)決策。

回到最初的問(wèn)題：一條廣告好不好，到底該問(wèn)消費(fèi)者還是問(wèn)他的大腦？

我們的答案是：用AI來(lái)問(wèn)大腦。當(dāng) Seedance 2.0、Sora 們讓每條素材的生產(chǎn)成本趨近于零，判斷”哪條值得投”的能力，反而成了最昂貴的環(huán)節(jié)。創(chuàng)意不再稀缺，判斷力才是。

AdEff 正在做的事，是把原本只有大品牌才負(fù)擔(dān)得起的專業(yè)判斷力，通過(guò) AI 交付給每一個(gè)需要它的人。讓每一條創(chuàng)意，都值得被科學(xué)地評(píng)價(jià)。

目前，AdEff 已服務(wù)快消、醫(yī)藥保健、美妝個(gè)護(hù)、3C、互聯(lián)網(wǎng)零售等多個(gè)行業(yè)客戶。

圍繞企業(yè)廣告視頻創(chuàng)意場(chǎng)景，明略科技可信商業(yè)智能體DeepMiner、零壹貳叁還可提供視頻內(nèi)容洞察、AIGC創(chuàng)意視頻生成等全方位解決方案。

如果你也在面臨創(chuàng)意量產(chǎn)帶來(lái)的試錯(cuò)壓力

???點(diǎn)擊此處，進(jìn)一步了解 AdEff

鎖定AI時(shí)代優(yōu)質(zhì)創(chuàng)意

明略科技正式加入香港中國(guó)企業(yè)協(xié)會(huì)，以AI技術(shù)賦能在港中資企業(yè)智能化升級(jí)

admin — Mon, 16 Mar 2026 03:39:48 +0000

隨著香港加速建設(shè)國(guó)際創(chuàng)新科技中心，AI技術(shù)正成為深化內(nèi)地與香港經(jīng)貿(mào)合作的重要引擎。

今年1月，憑借企業(yè)級(jí)大模型與智能體技術(shù)能力與實(shí)踐經(jīng)驗(yàn)，明略科技（2718.HK）正式加入香港中國(guó)企業(yè)協(xié)會(huì)（簡(jiǎn)稱”中企協(xié)會(huì)”），成為協(xié)會(huì)會(huì)員單位，為協(xié)會(huì)生態(tài)注入前沿AI技術(shù)能力。

據(jù)介紹，香港中國(guó)企業(yè)協(xié)會(huì)（“中企協(xié)會(huì)”）成立于1991年，以“貫徹一國(guó)兩制方針，促進(jìn)香港繁榮穩(wěn)定”為創(chuàng)會(huì)宗旨，是全體在港中資企業(yè)的代表，也是團(tuán)結(jié)引領(lǐng)中資企業(yè)全面參與香港各項(xiàng)事務(wù)的工作平臺(tái)，在香港工商界及社會(huì)各界具有較高知名度和重要影響力。中企協(xié)會(huì)現(xiàn)有會(huì)員企業(yè)超過(guò)1300家，涉及金融、航運(yùn)、商貿(mào)、創(chuàng)科等各個(gè)行業(yè)領(lǐng)域，為香港的經(jīng)濟(jì)發(fā)展、社會(huì)穩(wěn)定、文化繁榮、民生保供等，做出了重要貢獻(xiàn)。

近日，明略科技高級(jí)副總裁孫方超、香港總經(jīng)理張曉及AIGC業(yè)務(wù)（零壹貳叁）合伙人兼高級(jí)副總裁周昊一行拜訪中企協(xié)會(huì)，與中企協(xié)會(huì)副總裁曾燊典、中企協(xié)會(huì)會(huì)員事務(wù)部總監(jiān)任鈦石進(jìn)行友好會(huì)談，并現(xiàn)場(chǎng)接受會(huì)員證書(shū)頒發(fā)。

明略科技團(tuán)隊(duì)與中企協(xié)領(lǐng)導(dǎo)合影
（從左至右：明略科技AIGC業(yè)務(wù)（零壹貳叁）合伙人兼高級(jí)副總裁周昊、明略科技香港總經(jīng)理張曉、中企協(xié)會(huì)副總裁曾燊典、明略科技高級(jí)副總裁孫方超、中企協(xié)會(huì)會(huì)員事務(wù)部總監(jiān)任鈦石）

會(huì)談中，明略科技團(tuán)隊(duì)重點(diǎn)展示了AI領(lǐng)域的技術(shù)積累與創(chuàng)新能力。近年來(lái)，公司已構(gòu)建起從多模態(tài)數(shù)據(jù)智能到Agentic AI的完整技術(shù)棧，依托專有大模型能力與深厚的行業(yè)數(shù)據(jù)知識(shí)，持續(xù)為企業(yè)打造Agentic AI時(shí)代的可信生產(chǎn)力，并在多個(gè)行業(yè)積累了豐富的落地經(jīng)驗(yàn)，能夠?yàn)樵诟壑匈Y企業(yè)提供多場(chǎng)景的智能化解決方案，幫助企業(yè)解決實(shí)際業(yè)務(wù)痛點(diǎn)。

中企協(xié)會(huì)領(lǐng)導(dǎo)對(duì)明略科技的加入表示熱烈歡迎，高度認(rèn)可明略科技在AI技術(shù)創(chuàng)新與應(yīng)用落地方面的成就，并期待未來(lái)與協(xié)會(huì)其他成員企業(yè)開(kāi)展更多交流合作。

雙方一致認(rèn)為，明略科技的AI技術(shù)能力與協(xié)會(huì)會(huì)員企業(yè)的多元化需求高度契合，未來(lái)可通過(guò)技術(shù)分享會(huì)、專題研討等形式展開(kāi)務(wù)實(shí)合作，為協(xié)會(huì)內(nèi)廣大中資企業(yè)提供先進(jìn)的AI賦能服務(wù)，助力企業(yè)智能化升級(jí)。

中企協(xié)會(huì)副總裁曾燊典向明略科技高級(jí)副總裁孫方超頒發(fā)會(huì)員證書(shū)

明略科技于2025年進(jìn)駐香港，作為香港第五批重點(diǎn)企業(yè)，同年成功登陸港交所，成為”全球Agentic AI第一股”。目前已在香港建立本地化團(tuán)隊(duì)，持續(xù)拓展在港業(yè)務(wù)。

此次加入中企協(xié)會(huì)，是明略科技深化香港布局的又一重要舉措。借助中企協(xié)會(huì)覆蓋廣泛的會(huì)員網(wǎng)絡(luò)，明略科技將進(jìn)一步拓展在港業(yè)務(wù)版圖，推動(dòng)AI技術(shù)在更多場(chǎng)景落地，為內(nèi)地與香港經(jīng)貿(mào)技術(shù)交流合作注入新動(dòng)能。

重磅 | 明略科技吳明輝榮獲2025中國(guó)產(chǎn)學(xué)研合作促進(jìn)會(huì)科技”創(chuàng)新人物獎(jiǎng)”

admin — Mon, 16 Mar 2026 03:30:46 +0000

2026年3月15日，第十七屆中國(guó)產(chǎn)學(xué)研合作創(chuàng)新大會(huì)在北京會(huì)議中心隆重舉行。全國(guó)人大常委會(huì)原副委員長(zhǎng)陳至立，全國(guó)政協(xié)原副主席、中國(guó)科協(xié)主席萬(wàn)鋼等領(lǐng)導(dǎo)，以及教育部黨組成員、副部長(zhǎng)徐青森，國(guó)家知識(shí)產(chǎn)權(quán)局黨組成員、副局長(zhǎng)胡文輝等部委領(lǐng)導(dǎo)發(fā)表致辭。中國(guó)產(chǎn)學(xué)研合作促進(jìn)會(huì)會(huì)長(zhǎng)王建華主持會(huì)議。來(lái)自全國(guó)產(chǎn)學(xué)研界的千余位代表共聚一堂，圍繞“科技創(chuàng)新產(chǎn)業(yè)創(chuàng)新深度融合”主題展開(kāi)深度交流。

大會(huì)隆重頒發(fā)2025年中國(guó)產(chǎn)學(xué)研合作促進(jìn)會(huì)科技創(chuàng)新獎(jiǎng)。明略科技（2718.HK）創(chuàng)始人、CEO兼CTO吳明輝 憑借在人工智能技術(shù)與產(chǎn)業(yè)深度融合方面的卓越貢獻(xiàn)，從眾多候選人中脫穎而出，榮獲“2025年中國(guó)產(chǎn)學(xué)研合作促進(jìn)會(huì)科技創(chuàng)新獎(jiǎng)——?jiǎng)?chuàng)新人物獎(jiǎng)”，并作為獲獎(jiǎng)代表登臺(tái)領(lǐng)獎(jiǎng)。

中國(guó)產(chǎn)學(xué)研界最高榮譽(yù)

中國(guó)產(chǎn)學(xué)研合作促進(jìn)會(huì)科技創(chuàng)新獎(jiǎng)，由中國(guó)產(chǎn)學(xué)研合作促進(jìn)會(huì)發(fā)起，2008年獲科技部、國(guó)家科技獎(jiǎng)勵(lì)工作辦公室正式批準(zhǔn)，是我國(guó)產(chǎn)學(xué)研協(xié)同創(chuàng)新領(lǐng)域的最高榮譽(yù)獎(jiǎng)。該獎(jiǎng)項(xiàng)分設(shè)：創(chuàng)新人物獎(jiǎng)、創(chuàng)新成果獎(jiǎng)，評(píng)選層次高、標(biāo)準(zhǔn)嚴(yán)、公信力強(qiáng)，旨在表彰在推進(jìn)產(chǎn)學(xué)研用協(xié)同創(chuàng)新和實(shí)現(xiàn)高水平科技自立自強(qiáng)工作中做出突出貢獻(xiàn)的科技工作者和重要科技成果，被公認(rèn)為產(chǎn)學(xué)研界的“風(fēng)向標(biāo)”。

當(dāng)前，全球科技競(jìng)爭(zhēng)加劇，人才作為科技創(chuàng)新的第一資源，是破解“卡脖子”技術(shù)難題，實(shí)現(xiàn)高水平科技自立自強(qiáng)、培育新質(zhì)生產(chǎn)力的核心動(dòng)力。

為進(jìn)一步激發(fā)產(chǎn)學(xué)研界科技人才創(chuàng)新活力、推動(dòng)更多科技成果轉(zhuǎn)化為現(xiàn)實(shí)生產(chǎn)力，在科技部和國(guó)家獎(jiǎng)勵(lì)辦的指導(dǎo)下，中國(guó)產(chǎn)學(xué)研合作促進(jìn)會(huì)于2025年組織開(kāi)展創(chuàng)新人物獎(jiǎng)評(píng)審。

經(jīng)過(guò)專家評(píng)審、公示、終審多輪嚴(yán)格篩選，明略科技創(chuàng)始人、CEO兼CTO吳明輝、宇樹(shù)科技CEO王興興、海爾集團(tuán)CEO周云杰等優(yōu)秀企業(yè)家，以及兩院院士、杰青、長(zhǎng)江學(xué)者、萬(wàn)人領(lǐng)軍等頂尖人才共同入選，集中展現(xiàn)我國(guó)科技創(chuàng)新與產(chǎn)業(yè)融合領(lǐng)域的硬實(shí)力。

大會(huì)現(xiàn)場(chǎng)，全國(guó)人大常委會(huì)原副委員長(zhǎng)陳至立，全國(guó)政協(xié)原副主席、中國(guó)科協(xié)主席萬(wàn)鋼，教育部黨組成員、副部長(zhǎng)徐青森，國(guó)家知識(shí)產(chǎn)權(quán)局黨組成員、副局長(zhǎng)胡文輝等領(lǐng)導(dǎo)為獲獎(jiǎng)?wù)哳C獎(jiǎng)。明略科技吳明輝作為創(chuàng)新人物獎(jiǎng)獲獎(jiǎng)代表登臺(tái)領(lǐng)獎(jiǎng)。

明略科技吳明輝作為獲獎(jiǎng)代表登臺(tái)領(lǐng)獎(jiǎng)（左起第六位）

明略科技吳明輝獲獎(jiǎng)證書(shū)及獎(jiǎng)杯

從學(xué)術(shù)到產(chǎn)業(yè)，吳明輝的二十年AI創(chuàng)新之路

作為明略科技的領(lǐng)航者，吳明輝此次獲獎(jiǎng)源于他二十年來(lái)深耕產(chǎn)學(xué)研一線的堅(jiān)守與創(chuàng)新。2006年，他在北大讀研期間創(chuàng)立秒針系統(tǒng)，打造中國(guó)首個(gè)互聯(lián)網(wǎng)用戶行為與營(yíng)銷數(shù)據(jù)分析平臺(tái)，填補(bǔ)國(guó)內(nèi)市場(chǎng)空白。此后，他帶領(lǐng)團(tuán)隊(duì)完成多次技術(shù)創(chuàng)新：

明略科技吳明輝在大會(huì)現(xiàn)場(chǎng)

2019年 ?成立明略科技集團(tuán)，同年入選科技部“營(yíng)銷智能國(guó)家新一代人工智能開(kāi)放創(chuàng)新平臺(tái)”

2020年 ?推動(dòng)知識(shí)圖譜自動(dòng)構(gòu)建及行業(yè)應(yīng)用技術(shù)成果，榮獲吳文俊人工智能技術(shù)發(fā)明一等獎(jiǎng)

2024年 ?研發(fā)超圖多模態(tài)大語(yǔ)言模型HMLLM，并提出全球首個(gè)主客觀合一的營(yíng)銷視頻評(píng)測(cè)基準(zhǔn)Video-SME，榮獲ACM Multimedia 2024 最佳論文提名

2025年 ?進(jìn)一步聚焦Agentic AI，專有GUI模型Mano在全球權(quán)威雙榜Mind2Web、OSWorld達(dá)到SOTA水平；推動(dòng)明略科技成功登陸港交所，成就“全球Agentic AI第一股”

吳明輝的創(chuàng)新實(shí)踐始終圍繞“技術(shù)落地”展開(kāi)，推動(dòng)明略科技將AI技術(shù)深度融入營(yíng)銷智能與營(yíng)運(yùn)智能場(chǎng)景，迄今已服務(wù)135家財(cái)富世界500強(qiáng)企業(yè)，賦能2000+國(guó)內(nèi)外頭部企業(yè)，20萬(wàn)+中小企業(yè)，惠及零售、快消、汽車、3C、美妝、母嬰等行業(yè)客戶。

此次榮膺創(chuàng)新人物獎(jiǎng)，既是中國(guó)產(chǎn)學(xué)研界對(duì)吳明輝多年來(lái)堅(jiān)守創(chuàng)新初心、深耕產(chǎn)業(yè)落地的充分肯定，更是對(duì)明略科技產(chǎn)學(xué)研一體化發(fā)展模式的高度贊譽(yù)。

站在新的榮譽(yù)起點(diǎn)上，明略科技將在吳明輝的帶領(lǐng)下，繼續(xù)以科技創(chuàng)新為核心驅(qū)動(dòng)力，深化產(chǎn)學(xué)研協(xié)同創(chuàng)新合作，加速關(guān)鍵核心技術(shù)攻關(guān)與成果轉(zhuǎn)化，借人工智能之力解決復(fù)雜的商業(yè)問(wèn)題，為實(shí)現(xiàn)高水平科技自立自強(qiáng)、推動(dòng)高質(zhì)量發(fā)展貢獻(xiàn)更多“明略力量”。

AI創(chuàng)意視頻進(jìn)入量產(chǎn)，AdEff 教你選出好創(chuàng)意

admin — Tue, 10 Mar 2026 11:01:13 +0000

進(jìn)入2026年，AIGC在營(yíng)銷領(lǐng)域的滲透已經(jīng)進(jìn)入全新階段。以SeeDance為代表的視頻生成技術(shù)持續(xù)突破，讓廣告創(chuàng)意的生產(chǎn)效率實(shí)現(xiàn)量級(jí)提升，過(guò)去需要數(shù)天、數(shù)周完成的素材制作，如今在分鐘級(jí)即可實(shí)現(xiàn)批量產(chǎn)出。創(chuàng)意不再是行業(yè)的稀缺資源，內(nèi)容工業(yè)化的浪潮，已然席卷品牌營(yíng)銷、電商投放、信息流推廣等全場(chǎng)景。

當(dāng)生產(chǎn)端的瓶頸被打破，新的行業(yè)痛點(diǎn)正在以更隱蔽、更劇烈的方式出現(xiàn)。越來(lái)越多的品牌市場(chǎng)負(fù)責(zé)人、增長(zhǎng)操盤手、企業(yè)決策者，都在面對(duì)同一個(gè)現(xiàn)實(shí)困境：

創(chuàng)意產(chǎn)出越快，試錯(cuò)壓力越大；素材變體越多，決策成本越高；制作成本越低，投放浪費(fèi)越嚴(yán)重。AIGC解決了”做不出”的問(wèn)題，卻讓”測(cè)不起”成為全行業(yè)共同的新挑戰(zhàn)。

一個(gè)品牌單日通過(guò)AI生成數(shù)十支創(chuàng)意視頻，團(tuán)隊(duì)卻陷入無(wú)從選擇的迷茫。依靠人工經(jīng)驗(yàn)篩選，難免主觀片面；開(kāi)啟小流量實(shí)測(cè)，周期長(zhǎng)、成本高；等到數(shù)據(jù)回收完成，熱點(diǎn)窗口期已過(guò)，競(jìng)品早已占據(jù)用戶心智。最終，大量預(yù)算消耗在“證明素材無(wú)效”的過(guò)程中，真正能夠穩(wěn)定貢獻(xiàn)轉(zhuǎn)化的創(chuàng)意，依舊屈指可數(shù)。

隨著創(chuàng)意生產(chǎn)實(shí)現(xiàn)普惠，行業(yè)的下一個(gè)核心命題是：讓創(chuàng)意投放回歸科學(xué)。

企業(yè)真正需要的，不再只是“更多創(chuàng)意”，而是“更對(duì)的創(chuàng)意”；不再只是“更快產(chǎn)出”，而是“更準(zhǔn)決策”。

能不能在投放之前，就快速知道這條創(chuàng)意行不行？

能不能不用燒錢測(cè)試，就能篩掉大概率跑不出來(lái)的素材？

能不能讓幾十上百條創(chuàng)意，有個(gè)高效、低成本、靠譜的篩選方式？

這也是 AdEff 的出發(fā)點(diǎn)：

在你把視頻廣告預(yù)算花出去之前，先用低成本、高效率的方式，幫你把高潛力創(chuàng)意找出來(lái)，把無(wú)效消耗攔在前面。

什么是 AdEff？

AdEff?是明略科技（2718.HK）基于“自研超圖多模態(tài)大語(yǔ)言模型（HMLLM）+過(guò)去10+年積累的10萬(wàn)+次神經(jīng)科學(xué)測(cè)量經(jīng)驗(yàn)和數(shù)據(jù)”研發(fā)的全球化AI創(chuàng)意測(cè)試產(chǎn)品。【即刻注冊(cè)】

AdEff 能幫你做什么？

? 分鐘級(jí)創(chuàng)意效果測(cè)試：最快15分鐘完成廣告測(cè)試

? 秒級(jí)優(yōu)化建議：根據(jù)受眾注意力曲線、情感波動(dòng)等維度變化，提供視頻關(guān)鍵片段（如廣告黃金3秒、品牌時(shí)刻、用戶興趣時(shí)刻等）優(yōu)劣勢(shì)分析及優(yōu)化建議

? 最優(yōu)創(chuàng)意篩選：支持多種采買模式，低成本測(cè)試多個(gè)創(chuàng)意（不同版本、不同內(nèi)容），結(jié)合DeepMiner，分析不同創(chuàng)意優(yōu)劣勢(shì)

AdEff 的準(zhǔn)確率如何？

為了驗(yàn)證 AdEff 的商業(yè)實(shí)用性，2025年我們對(duì)其進(jìn)行了樣本一致性與專家一致性測(cè)試。

通過(guò)對(duì)真人樣本廣告創(chuàng)意測(cè)試的平均分，以及 AdEff 廣告創(chuàng)意預(yù)測(cè)得分進(jìn)行回歸分析，89% 的 AdEff 的預(yù)測(cè)得分與真人樣本測(cè)試得分具有強(qiáng)相關(guān)性，實(shí)際應(yīng)用中具有高度準(zhǔn)確性及可靠性。

相較于普通的真人樣本，專家對(duì)廣告片中的專業(yè)表達(dá)理解更到位，對(duì)廣告創(chuàng)意測(cè)評(píng)的要求更高，對(duì)“好創(chuàng)意”也有更嚴(yán)苛的評(píng)判標(biāo)準(zhǔn)。綜合效果指數(shù)、反應(yīng)曲線、指標(biāo)分析、黃金3秒、結(jié)尾3秒、熱力圖及4項(xiàng)核心結(jié)果的測(cè)評(píng)結(jié)果，76% 的 AdEff 測(cè)評(píng)結(jié)果符合專家預(yù)期（所有結(jié)果均符合預(yù)期為100%）。

AdEff 是如何實(shí)現(xiàn)精準(zhǔn)分析的？

? 自研超大規(guī)模主觀個(gè)性化數(shù)據(jù)集支撐

利用明略科技（2718.HK）自研設(shè)備，采集海量真實(shí)受試者的腦電與注視點(diǎn)信號(hào)，構(gòu)建 Video-SME 與 SPA-ADV 兩大原創(chuàng)數(shù)據(jù)集并發(fā)表開(kāi)源，為主觀體驗(yàn)的科學(xué)量化提供堅(jiān)實(shí)基準(zhǔn)。

? 多模態(tài)主觀指標(biāo)建模

突破傳統(tǒng)依賴問(wèn)卷與顯著性熱圖的方式，首次將眼動(dòng)、腦電等多源信號(hào)與視頻、音頻內(nèi)容深度融合，實(shí)現(xiàn)秒級(jí)粒度的注意力、情緒與認(rèn)知建模。

? 全球領(lǐng)先自研超圖多模態(tài)大語(yǔ)言模型（HMLLM）

ACMMM 2024 最佳論文提名研究成果，通過(guò)超圖結(jié)構(gòu)將視頻幀、音頻、人口特征與生理信號(hào)統(tǒng)一建模，彌合語(yǔ)義鴻溝，支持幀級(jí)邏輯推理與人群差異解讀。

? 多模態(tài)混合專家模型協(xié)同

采用明略科技（2718.HK）自研多模態(tài)混合專家模型協(xié)同架構(gòu)（MoE），通過(guò)動(dòng)態(tài)調(diào)度不同領(lǐng)域的專家模型，AdEff 能夠在主觀上理解人類感受，在客觀上洞察多模態(tài)數(shù)據(jù)之間的關(guān)聯(lián)，結(jié)合專家的判斷與分析，幫助企業(yè)快速制定科學(xué)決策。

為什么 AdEff 值得關(guān)注？

隨著廣告的泛化、效果化，人們對(duì)于“什么是好廣告？”的認(rèn)知逐漸模糊，這也將引發(fā)關(guān)乎投放成本、內(nèi)容風(fēng)險(xiǎn)等一系列連鎖反應(yīng)。

在AI盛行的時(shí)代，我們會(huì)失去判斷力嗎？AdEff 的答案是不會(huì)。我們希望通過(guò)“可信模型+可信數(shù)據(jù)”建立一套科學(xué)的標(biāo)準(zhǔn)，為企業(yè)生產(chǎn)更多用戶喜愛(ài)的“好內(nèi)容”保駕護(hù)航。

在 OPC 成為新流行的當(dāng)下，如果你是超級(jí)個(gè)體，AdEff 也能在“接單—制作—交付—復(fù)盤”等環(huán)節(jié)助你一臂之力：

? 接單：提前測(cè)試過(guò)往樣片效果，基于測(cè)試數(shù)據(jù)，展示專業(yè)能力，建立客戶信任；

? 制作：既可以測(cè)試未完稿創(chuàng)意，也可以在完稿后從多版創(chuàng)意中選出最優(yōu)版本；

? 交付：基于 AdEff 測(cè)試結(jié)果進(jìn)行交付，減少因主觀判斷不同造成的重復(fù)溝通；

? 復(fù)盤：建立個(gè)人創(chuàng)意素材庫(kù)，積累測(cè)試案例，基于測(cè)試數(shù)據(jù)，總結(jié)優(yōu)秀創(chuàng)意方法論，提升個(gè)人創(chuàng)作能力和商業(yè)價(jià)值。

目前，AdEff 已服務(wù)快消、醫(yī)藥保健、美妝個(gè)護(hù)、3C、互聯(lián)網(wǎng)零售等多個(gè)行業(yè)客戶。

圍繞企業(yè)廣告視頻創(chuàng)意場(chǎng)景，明略科技（2718.HK）可信商業(yè)智能體DeepMiner、零壹貳叁還可提供視頻內(nèi)容洞察、AIGC創(chuàng)意視頻生成等全方位解決方案。

如果你也在面臨創(chuàng)意量產(chǎn)帶來(lái)的試錯(cuò)壓力

???點(diǎn)擊此處，進(jìn)入?AdEff?官網(wǎng)

即刻鎖定AI時(shí)代的優(yōu)質(zhì)創(chuàng)意~~

專家解讀 | 從OpenClaw看中國(guó)AI Agent落地：企業(yè)應(yīng)用的機(jī)遇與挑戰(zhàn)（下）

admin — Tue, 03 Mar 2026 02:25:25 +0000

2026年2月，開(kāi)源AI助手OpenClaw在全球科技圈引發(fā)熱議。這個(gè)被稱為”真正能干活的AI”以其獨(dú)特的”自主執(zhí)行”能力，讓企業(yè)管理者既看到了效率提升的巨大潛力，也產(chǎn)生了諸多現(xiàn)實(shí)疑問(wèn)：它能為企業(yè)帶來(lái)什么實(shí)際價(jià)值？如何在組織內(nèi)部落地？安全風(fēng)險(xiǎn)如何控制？技術(shù)選型應(yīng)該考慮哪些因素？

在上一期專家解讀中，我們介紹了OpenClaw的核心理念與企業(yè)應(yīng)用。本期，明略科技（2718.HK）副總裁李夢(mèng)林將進(jìn)一步解讀AI Agent的行業(yè)影響及未來(lái)發(fā)展趨勢(shì)。

Q1：最近，谷歌、Anthropic等企業(yè)在不同程度上限制了 OpenClaw 接入。與此同時(shí)，越來(lái)越多的中國(guó)模型廠商則主動(dòng)擁抱 OpenClaw，這對(duì)中國(guó) AI Agent 發(fā)展將產(chǎn)生怎樣的深遠(yuǎn)影響？

李夢(mèng)林：OpenClaw的”自帶代理”（Bring Your Own Agent）模式，本質(zhì)上觸發(fā)了AI產(chǎn)業(yè)鏈的一次利益再分配。海外模型廠商的限制舉措，核心原因是訂閱制定價(jià)模型與Agent高強(qiáng)度調(diào)用之間的經(jīng)濟(jì)矛盾。這一博弈對(duì)中國(guó)AI發(fā)展反而創(chuàng)造了獨(dú)特機(jī)遇。

一方面，中國(guó)市場(chǎng)正處于AI應(yīng)用的快速擴(kuò)張期，企業(yè)對(duì)能夠真正提升效率的AI Agent有強(qiáng)烈的落地需求。OpenClaw這樣的開(kāi)源工具讓大量企業(yè)第一次真切感受到AI Agent的實(shí)際價(jià)值，這種認(rèn)知普及本身就在加速整個(gè)市場(chǎng)的成熟。

另一方面，部分海外廠商的限制客觀上為中國(guó)模型廠商打開(kāi)了生態(tài)窗口。當(dāng)Anthropic和谷歌收緊接口時(shí)，國(guó)產(chǎn)模型通過(guò)積極兼容OpenClaw等開(kāi)源框架，能夠快速服務(wù)于用戶的應(yīng)用場(chǎng)景，在實(shí)戰(zhàn)中打磨模型能力。

但我們也需要理性看到，當(dāng)前階段OpenClaw接入國(guó)產(chǎn)模型后的效果參差不齊，這恰恰說(shuō)明通用Agent框架的能力天花板受限于底層模型。對(duì)中國(guó)AI產(chǎn)業(yè)而言，更具戰(zhàn)略價(jià)值的方向不是單純做”更兼容OpenClaw的模型”，而是發(fā)展面向企業(yè)核心場(chǎng)景的專用模型能力，將通用模型的推理能力與行業(yè)知識(shí)深度融合，形成企業(yè)真正能用、敢用的解決方案。

Q2：OpenClaw雖然開(kāi)源，但核心開(kāi)發(fā)者在海外，對(duì)中國(guó)企業(yè)的特定需求理解有限。若想解決這一問(wèn)題，中國(guó)企業(yè)或服務(wù)商還需補(bǔ)足哪些能力？

李夢(mèng)林：OpenClaw的局限恰恰指向了中國(guó)企業(yè)的機(jī)會(huì)所在。作為通用框架，OpenClaw試圖用”一個(gè)Agent+工具調(diào)用”解決所有問(wèn)題，但企業(yè)級(jí)應(yīng)用的現(xiàn)實(shí)是不同行業(yè)、不同場(chǎng)景的知識(shí)壁壘和流程差異巨大，通用方案很難做到又穩(wěn)又準(zhǔn)。

第一是場(chǎng)景深度。以營(yíng)銷領(lǐng)域?yàn)槔瑥南M(fèi)者洞察、策略制定、內(nèi)容生成到效果歸因，每一環(huán)都需要行業(yè)專屬知識(shí)，不是通用模型簡(jiǎn)單調(diào)用工具就能解決的。中國(guó)企業(yè)在這些垂直場(chǎng)景中積累的行業(yè)數(shù)據(jù)和業(yè)務(wù)理解，是構(gòu)建專用Agent最重要的壁壘。

第二是端到端的GUI自動(dòng)化能力。企業(yè)員工日常工作中大量時(shí)間花在各種軟件系統(tǒng)之間的切換操作上，這些工作機(jī)械重復(fù)卻不可或缺。通用框架通過(guò)Shell命令和API調(diào)用來(lái)執(zhí)行任務(wù)，對(duì)于沒(méi)有開(kāi)放API的企業(yè)軟件系統(tǒng)力不從心。而專門針對(duì)GUI交互訓(xùn)練的模型，能像人一樣直接操作軟件界面，覆蓋更多真實(shí)企業(yè)場(chǎng)景。

第三是工程化和產(chǎn)品化能力。從技術(shù)原型到企業(yè)級(jí)產(chǎn)品，中間需要解決穩(wěn)定性、安全性、可管控性等一系列工程問(wèn)題。中國(guó)企業(yè)在ToB服務(wù)中積累的落地經(jīng)驗(yàn)本身就是核心競(jìng)爭(zhēng)力。

我們認(rèn)為，中國(guó)企業(yè)在AI Agent領(lǐng)域的機(jī)會(huì)不是做”中國(guó)版OpenClaw”，而是做OpenClaw做不到的事：更懂行業(yè)、更深場(chǎng)景、更穩(wěn)落地。

Q3：OpenClaw的出現(xiàn)預(yù)示了AI Agent發(fā)展的哪些新趨勢(shì)？未來(lái)的AI助手會(huì)朝什么樣的方向進(jìn)化？

李夢(mèng)林：OpenClaw的爆火不僅是一個(gè)開(kāi)源項(xiàng)目的成功，更是AI應(yīng)用范式轉(zhuǎn)變的標(biāo)志性事件，它預(yù)示了四個(gè)重要趨勢(shì)。

一是從”對(duì)話”到”執(zhí)行”的能力質(zhì)變。過(guò)去幾年AI應(yīng)用主要停留在信息處理層面。OpenClaw標(biāo)志著AI進(jìn)入了”任務(wù)執(zhí)行”階段：7×24小時(shí)后臺(tái)運(yùn)行，通過(guò)消息平臺(tái)遠(yuǎn)程控制，自主完成跨應(yīng)用、跨平臺(tái)的綜合任務(wù)。未來(lái)的AI助手將在主動(dòng)性（主動(dòng)發(fā)現(xiàn)問(wèn)題并提醒）、持續(xù)性（長(zhǎng)期記憶和行為一致性）和自主性（目標(biāo)驅(qū)動(dòng)的自主規(guī)劃執(zhí)行）上實(shí)現(xiàn)新的突破。

二是從”單一Agent”到”多智能體協(xié)同”的架構(gòu)演進(jìn)。值得注意的是，OpenClaw已經(jīng)支持多Agent架構(gòu)。一個(gè)Gateway管理多個(gè)獨(dú)立Agent，各自擁有獨(dú)立身份、記憶和工具，Agent之間可以互相通信協(xié)作。但當(dāng)前的多Agent協(xié)同更多停留在”同質(zhì)Agent的任務(wù)分發(fā)”層面。更深遠(yuǎn)的趨勢(shì)是”異構(gòu)Agent的專業(yè)化協(xié)同”：不同Agent在特定領(lǐng)域深度優(yōu)化，協(xié)同完成復(fù)雜任務(wù)。就像一個(gè)公司不是找一個(gè)”全能員工”，而是組建專業(yè)團(tuán)隊(duì)。

我們的實(shí)踐表明，基于明略科技DeepMiner平臺(tái)構(gòu)建面向企業(yè)場(chǎng)景的多智能體協(xié)同架構(gòu)，每個(gè)Agent針對(duì)特定業(yè)務(wù)領(lǐng)域深度優(yōu)化，多Agent協(xié)同能夠產(chǎn)生超越個(gè)體的涌現(xiàn)能力。這種架構(gòu)的優(yōu)勢(shì)在于：專業(yè)Agent協(xié)同能力超越單一通用模型、不同任務(wù)匹配不同規(guī)模的模型使成本更可控、某個(gè)Agent失效不影響整個(gè)系統(tǒng)的穩(wěn)定性。

三是從”流程編排”到”智能涌現(xiàn)”的范式轉(zhuǎn)變。傳統(tǒng)的企業(yè)自動(dòng)化工具（如RPA）基于預(yù)設(shè)的固定流程執(zhí)行任務(wù)，AI Agent則代表了一種全新范式，給定目標(biāo)和工具，AI自主規(guī)劃執(zhí)行路徑，其優(yōu)勢(shì)在于靈活性更強(qiáng)、可擴(kuò)展性更好，且具備進(jìn)化能力。

四是從”工具”到”同事”的人機(jī)關(guān)系重構(gòu)。OpenClaw的Workspace設(shè)計(jì)已經(jīng)展現(xiàn)了這種趨勢(shì)的雛形，AI有自己的人設(shè)、記憶、身份和行為規(guī)范，它不再是一個(gè)無(wú)狀態(tài)的工具，而更像一個(gè)有記憶、有個(gè)性的數(shù)字同事。這種轉(zhuǎn)變將深刻改變企業(yè)的組織形態(tài)和工作方式。

面對(duì)這些趨勢(shì)，企業(yè)的務(wù)實(shí)策略是：一、邊試點(diǎn)邊學(xué)習(xí)，而不是等待完美方案；二、投資于能力建設(shè)而非特定工具；三、關(guān)注架構(gòu)靈活性而非功能堆疊；四、建立進(jìn)化機(jī)制，讓AI系統(tǒng)在使用中不斷沉淀知識(shí)、提升能力。

OpenClaw的出現(xiàn)標(biāo)志著AI應(yīng)用進(jìn)入了新階段，但這只是開(kāi)始，真正的變革還在后面，企業(yè)需要在保持理性的同時(shí)積極擁抱變化。

AI Agent時(shí)代已經(jīng)來(lái)臨，企業(yè)需要的不僅是”能干活的AI”，更是”可信賴、可管控、可持續(xù)”的智能化解決方案。

明略科技（2718.HK）深耕AI領(lǐng)域二十年，在企業(yè)級(jí)大模型、智能體方向持續(xù)投入，多模態(tài)大模型、GUI智能體大模型技術(shù)居于全球領(lǐng)先地位，致力于打造真正適合中國(guó)企業(yè)的AI產(chǎn)品服務(wù)。