科技互聯(lián)網(wǎng)公眾號(hào)首圖.jpg)
GUI Agent 賽道正在加速成熟。Google 在 2024 年底推出 Project Mariner 內(nèi)測(cè),字節(jié)跳動(dòng)在 2025 年初開(kāi)源 UI-TARS 并迅速登上 GitHub 熱榜,Anthropic 的 Computer Use 持續(xù)迭代升級(jí)。幾乎所有模型廠商都在押注同一件事:讓 AI 從“陪你聊天”進(jìn)化為“替你干活”。
但在這場(chǎng)競(jìng)賽中,一個(gè)根本性矛盾正在浮出水面——而大多數(shù)報(bào)道都選擇性忽略了它。
這個(gè)矛盾是:用戶最想要的“主動(dòng)幫忙”,恰恰是云端AI最給不起的東西。
想象兩種 AI 助手:
被動(dòng)型(Reactive):你問(wèn)它問(wèn)題,它回答;你給它任務(wù),它執(zhí)行。你不說(shuō)話,它就安靜等著。ChatGPT、Claude、豆包——所有你正在用的 AI 產(chǎn)品,都是這種模式。
主動(dòng)型(Proactive):它自己發(fā)現(xiàn)你的日歷上 30 分鐘后有個(gè)重要會(huì)議,自動(dòng)幫你拉出相關(guān)文件和上次的會(huì)議紀(jì)要;它注意到你的郵箱收到了一封客戶投訴,自動(dòng)起草回復(fù)模板;它在后臺(tái)持續(xù)監(jiān)控你關(guān)注的競(jìng)品動(dòng)態(tài),有重大變化就提醒你。
用戶調(diào)研的答案很一致:80% 以上的企業(yè)用戶表示,他們需要的不是一個(gè)更聰明的聊天框,而是一個(gè)能主動(dòng)幫忙的數(shù)字助理。
但這種主動(dòng)性,恰恰是云端 AI 的經(jīng)濟(jì)模型所無(wú)法支撐的。
為什么云端 AI 不可能真正主動(dòng)?答案是一道簡(jiǎn)單的算術(shù)題。
云端 AI 的成本結(jié)構(gòu):按調(diào)用收費(fèi)。 無(wú)論是 OpenAI 的 GPT-4o、Anthropic 的 Claude,還是國(guó)內(nèi)的大模型 API,定價(jià)邏輯都是按 token 計(jì)費(fèi)——你每發(fā)一條消息、每上傳一張截圖、每讓它執(zhí)行一次操作,平臺(tái)都在消耗算力,都在產(chǎn)生成本。
被動(dòng)模式下,用戶一天可能調(diào)用 AI 幾十次。平臺(tái)的收費(fèi)能覆蓋成本,甚至有利潤(rùn)。
主動(dòng)模式下,AI 需要持續(xù)運(yùn)行:
粗略估算:一個(gè)主動(dòng)型 AI 助手一天的調(diào)用量,是被動(dòng)型的 20-50 倍。
更關(guān)鍵的是:這道數(shù)學(xué)題決定了云端平臺(tái)的產(chǎn)品策略。平臺(tái)不可能鼓勵(lì)用戶開(kāi)啟高頻主動(dòng)模式——越主動(dòng),平臺(tái)越虧。所以你會(huì)看到:
這不僅是技術(shù)限制,更是經(jīng)濟(jì)模型的必然結(jié)果。
端側(cè)模型從根本上改變了這道經(jīng)濟(jì)題的變量。
AI 跑在你自己的設(shè)備上,用的是你自己的芯片和電。 它主動(dòng)檢查郵箱一萬(wàn)次,也不花平臺(tái)一分錢。主動(dòng)性不再是成本負(fù)擔(dān),而是設(shè)備的固有能力——就像你的手機(jī)鬧鐘不需要為每次響鈴付費(fèi)一樣。
這個(gè)架構(gòu)變化帶來(lái)三個(gè)根本性的優(yōu)勢(shì):
端側(cè) AI 可以真正做到 7×24 小時(shí)在后臺(tái)運(yùn)行,持續(xù)感知、判斷、行動(dòng)。不受平臺(tái)計(jì)費(fèi)限制,不用擔(dān)心 token 消耗。你的 AI 助手終于可以像一個(gè)真正的助理一樣工作——主動(dòng)發(fā)現(xiàn)問(wèn)題、主動(dòng)提醒你、主動(dòng)幫你處理日常事務(wù)。
所有的感知和推理都在本地完成。AI 檢查你的郵箱?郵箱內(nèi)容不出設(shè)備。AI 掃描你的文件?文件不出設(shè)備。AI 截取屏幕來(lái)理解界面?截圖不出設(shè)備。
這不是“加了一層加密”的安全,而是架構(gòu)層面消除了數(shù)據(jù)外泄的可能性。對(duì)于金融、醫(yī)療、法律、政務(wù)等行業(yè),這種架構(gòu)級(jí)安全是合規(guī)的前提條件。
本地推理沒(méi)有網(wǎng)絡(luò)往返延遲。AI 發(fā)現(xiàn)異常→判斷→行動(dòng)的整個(gè)鏈條在毫秒級(jí)完成。對(duì)于需要快速響應(yīng)的場(chǎng)景(如交易監(jiān)控、安全告警、實(shí)時(shí)質(zhì)檢),這種延遲優(yōu)勢(shì)是云端方案無(wú)法企及的。
很多人對(duì)端側(cè)模型的第一反應(yīng)是:“小模型能行嗎?性能夠用嗎?”
這個(gè)懷疑在一年前是合理的。但2026年的端側(cè)模型已經(jīng)用實(shí)測(cè)數(shù)據(jù)推翻了這個(gè)假設(shè)。
以端側(cè) GUI 智能體為例。明略科技在4月13日發(fā)布的Mano-P 在 OSWorld 基準(zhǔn)測(cè)試中以 58.2% 的成功率拿下專用模型全球第一,領(lǐng)先第二名(OpenCUA-72B,45.0%)超過(guò) 13 個(gè)百分點(diǎn)。其 4B 蒸餾版通過(guò) GSPruning 視覺(jué) Token 剪枝和 w4a16 混合精度量化,在 Apple M4 Pro 上實(shí)測(cè):

專用模型 vs 通用模型的邏輯: 72B 蒸餾為 4B,不是簡(jiǎn)單地“把模型變小”,而是把 72B 在 GUI 操作領(lǐng)域積累的專業(yè)知識(shí),濃縮進(jìn)一個(gè)更小的模型。就像一個(gè)在心臟外科領(lǐng)域做了 20 年的專家,診斷心臟問(wèn)題的能力并不亞于一個(gè)什么都懂的全科醫(yī)生。因此,端側(cè)模型不等于弱模型。經(jīng)過(guò)專項(xiàng)訓(xùn)練和優(yōu)化的專用模型,在特定任務(wù)上完全可以達(dá)到甚至超越通用大模型的水平。

從“云端越主動(dòng)越虧”這個(gè)底層邏輯出發(fā),可以推導(dǎo)出三個(gè)必然趨勢(shì):
隨著 AI 從“聊天工具”進(jìn)化為“工作助手”,主動(dòng)性的需求會(huì)持續(xù)增長(zhǎng)。云端的經(jīng)濟(jì)模型無(wú)法支撐高頻主動(dòng)調(diào)用,端側(cè)將成為真正可用的 AI 助手的基礎(chǔ)架構(gòu)。微軟、蘋果、高通都在芯片層面布局 AI 推理能力——行業(yè)趨勢(shì)已經(jīng)明確。
蘋果 M 系列芯片已經(jīng)證明了消費(fèi)級(jí)設(shè)備運(yùn)行大模型的可行性。未來(lái)的芯片設(shè)計(jì)會(huì)進(jìn)一步優(yōu)化 AI 推理能力,端側(cè)可運(yùn)行的模型規(guī)模會(huì)持續(xù)增大。
《數(shù)據(jù)安全法》《個(gè)人信息保護(hù)法》在國(guó)內(nèi)的落地,GDPR 在歐盟的嚴(yán)格執(zhí)行,加上各行業(yè)監(jiān)管對(duì) AI 使用的細(xì)化要求——越來(lái)越多的企業(yè)會(huì)發(fā)現(xiàn):與其花費(fèi)巨額合規(guī)成本確保云端數(shù)據(jù)安全,不如從架構(gòu)上選擇數(shù)據(jù)不出設(shè)備的端側(cè)方案。
總結(jié)一下核心推理鏈:
1. 真正有用的 AI 助手必須是主動(dòng)的(Proactive)
2. 主動(dòng)意味著高頻運(yùn)算——在云端,越主動(dòng)越虧
3. 平臺(tái)的經(jīng)濟(jì)模型決定了云端 AI 不可能真正主動(dòng)
4. 端側(cè)模型跑在用戶設(shè)備上,主動(dòng)性零邊際成本
5. 因此,端側(cè)是 AI 從“聊天工具”進(jìn)化為“工作助手”的唯一可行架構(gòu)
2026 年,AI 賽道最大的分水嶺不是“誰(shuí)的模型更大”,而是“誰(shuí)的 AI 真正能主動(dòng)幫用戶干活”。而答案已經(jīng)很清楚:能真正主動(dòng)的 AI,只能跑在用戶自己的設(shè)備上。
Mano-P 是明略科技開(kāi)源的端側(cè) GUI 智能體,專為解決這個(gè)問(wèn)題而生。72B 旗艦?zāi)P驮?OSWorld 專用模型榜全球第一(58.2%),蒸餾為 4B 版本后可在 Apple M4 芯片 + 32GB 內(nèi)存的 Mac 上流暢運(yùn)行——預(yù)填充 476 tokens/s、峰值內(nèi)存僅 4.3GB。完全本地推理,數(shù)據(jù)零上傳,7×24 小時(shí)主動(dòng)運(yùn)行零邊際成本。采用 Apache 2.0 開(kāi)源協(xié)議,企業(yè)可自由使用和商用。
立即體驗(yàn):`brew install mano-cua`
技術(shù)論文:arXiv:2509.17336
GitHub:github.com/Mininglamp-AI/Mano-P
Mano-P 是一個(gè)開(kāi)源的 GUI-VLA(Vision-Language-Action)智能體,設(shè)計(jì)用于在蘋果芯片邊緣設(shè)備上本地運(yùn)行。它使用純視覺(jué)理解來(lái)跨平臺(tái)自動(dòng)化桌面 GUI 操作。Mano 是西班牙語(yǔ)里”手”的意思,P 有兩重含義:Person(個(gè)體)與 Party(組織)——我們相信,無(wú)論個(gè)人還是企業(yè),都能夠創(chuàng)造屬于自己的個(gè)性化 AI。核心理念:AI for Personal = 隱私 + 個(gè)性化。
| 對(duì)比維度 | Mano-P | Claude Computer Use |
| OSWorld(全部模型) | 58.2%(專用模型第一,全部模型前五) | 全部模型第一(千億參數(shù)級(jí)通用大模型) |
| WebRetriever Protocol I | 41.7 NavEval(領(lǐng)先) | 31.3(Claude 4.5) |
| 數(shù)據(jù)流向 | 完全本地,截圖不出設(shè)備 | 需上傳到云端 API |
| 離線運(yùn)行 | ? 支持 | ? 不支持 |
| 主動(dòng)性 | ? 7×24 無(wú)限制運(yùn)行 | ?? 受平臺(tái)算力成本限制 |
| 開(kāi)源 | ? Apache 2.0 協(xié)議 | ? 閉源 |
Mano-P 在專用模型中排名全球第一,在網(wǎng)頁(yè)檢索等任務(wù)上領(lǐng)先 Claude,且天然滿足數(shù)據(jù)安全要求。適合高安全需求場(chǎng)景。
可以! 在本地模式下,所有模型推理都在 Apple M4 設(shè)備上運(yùn)行。? 不會(huì)向外部服務(wù)器發(fā)送任何截圖或任務(wù)描述。
最低要求:Mac mini 或 MacBook;Apple M4 芯片;32GB 內(nèi)存
替代方案:任何 Mac + Mano-P 算力棒(通過(guò) USB 4.0+ 連接)
我們計(jì)劃在未來(lái)支持更多設(shè)備。
了解更多:[GitHub – Mininglamp-AI/Mano-P] (https://github.com/Mininglamp-AI/Mano-P)
聯(lián)系我們:model@mininglamp.com
]]>一個(gè)新賽道正在以肉眼可見(jiàn)的速度成型:GUI 智能體——不是和你聊天的 AI,而是替你干活的 AI。
但一個(gè)被大多數(shù)報(bào)道忽略的問(wèn)題是:當(dāng) AI 在幫你操作電腦時(shí),你的屏幕截圖正在被上傳到云端。Anthropic 自己在官方文檔中警告:“當(dāng) Computer Use 激活時(shí),Claude 能看到屏幕上顯示的一切,包括個(gè)人數(shù)據(jù)、敏感文檔或私人信息。”他們甚至建議用戶在虛擬機(jī)或容器中運(yùn)行這項(xiàng)功能。
這不是一個(gè)小問(wèn)題——對(duì)于處理客戶數(shù)據(jù)、財(cái)務(wù)信息、法律文件的企業(yè)來(lái)說(shuō),這可能是一個(gè)根本性的架構(gòu)選擇問(wèn)題。
有沒(méi)有一種 GUI 智能體,能像 Claude 一樣強(qiáng)大,但數(shù)據(jù)完全不出設(shè)備?
明略科技 Mano-P 已經(jīng)給出了答案:圍繞隱私與個(gè)性化兩大支柱,72B 模型屠榜證明實(shí)力,4B 蒸餾版上機(jī)證明可用——在 OSWorld 專用模型榜以 58.2% 成功率拿下全球第一,領(lǐng)先第二名超過(guò) 13 個(gè)百分點(diǎn),而這一切完全在你自己的 Mac 上本地運(yùn)行。
活動(dòng)會(huì)議宣傳首圖1.jpg)
過(guò)去兩年,大模型的能力主要體現(xiàn)在“說(shuō)”——寫文章、回答問(wèn)題、生成代碼。但企業(yè)真正需要的不是一個(gè)能說(shuō)會(huì)道的聊天機(jī)器人,而是一個(gè)能真正干活的數(shù)字員工。
GUI 智能體(GUI Agent)就是這一步的關(guān)鍵跨越。它的核心能力是:通過(guò)理解圖形用戶界面(GUI),像人類一樣操作電腦完成任務(wù)。你告訴它“幫我在 CRM 系統(tǒng)里錄入今天的客戶拜訪記錄”,它就真的打開(kāi) CRM、找到對(duì)應(yīng)字段、填寫內(nèi)容、點(diǎn)擊保存——全程不需要你動(dòng)手。
這和傳統(tǒng)的 RPA(機(jī)器人流程自動(dòng)化)有本質(zhì)區(qū)別:
RPA 依賴系統(tǒng) API 和預(yù)設(shè)規(guī)則,界面一改版就得重配,維護(hù)成本高,靈活性差。
GUI 智能體 基于視覺(jué)理解,像人一樣“看”屏幕、“理解”界面、“決定”下一步操作。界面改了?它能自適應(yīng),因?yàn)樗斫獾氖钦Z(yǔ)義,不是像素坐標(biāo)。
這個(gè)差異意味著什么?意味著 GUI 智能體可以操作任何人類能操作的軟件——不管是現(xiàn)代 SaaS 工具、老舊的 ERP 系統(tǒng),還是只有圖形界面沒(méi)有 API 的專業(yè)軟件。它解鎖的不是某一個(gè)系統(tǒng)的自動(dòng)化,而是通用的桌面自動(dòng)化能力。
截至目前,GUI 智能體賽道的主流方案幾乎都走了同一條路:依賴云端大模型推理。底層邏輯都是“截屏→上傳云端→模型推理→返回操作指令”。
這條路有兩個(gè)根本性的問(wèn)題:
第一個(gè)問(wèn)題是數(shù)據(jù)安全。你的每一張屏幕截圖都在云端服務(wù)器上走了一遭。對(duì)于個(gè)人用戶操作瀏覽器這種場(chǎng)景,這或許可以接受。但當(dāng)企業(yè)把 GUI 智能體用在審查合同、處理財(cái)務(wù)報(bào)表、錄入客戶數(shù)據(jù)等核心業(yè)務(wù)時(shí),合規(guī)團(tuán)隊(duì)會(huì)問(wèn):“這些截圖存在哪里?誰(shuí)能看到?保留多久?”
第二個(gè)問(wèn)題更根本:云端 AI 不可能真正“主動(dòng)”幫你。 真正有用的 AI 助手應(yīng)該是主動(dòng)的——自己發(fā)現(xiàn)你有個(gè)會(huì)議快開(kāi)了,自動(dòng)幫你準(zhǔn)備資料;看到重要郵件,自動(dòng)提醒你。但這種主動(dòng)性意味著 AI 要不停地自發(fā)運(yùn)算。在云端,每一次運(yùn)算都消耗平臺(tái)的算力和費(fèi)用——AI 越主動(dòng),平臺(tái)越虧錢。所以云端平臺(tái)必然限制 AI 的主動(dòng)性,這就是為什么你用 ChatGPT 從來(lái)不會(huì)看到它主動(dòng)找你。
端側(cè)模型從根本上解決了這兩個(gè)問(wèn)題:AI 跑在你自己的設(shè)備上,用的是你自己的芯片和電——它主動(dòng)運(yùn)行一萬(wàn)次也不花平臺(tái)一分錢;同時(shí)數(shù)據(jù)一步都不出你的設(shè)備。
這就引出了一個(gè)關(guān)鍵問(wèn)題:有沒(méi)有一種端側(cè)方案,性能也能達(dá)到頂級(jí)?
在上述格局中,明略科技近期開(kāi)源的的 Mano-P 占據(jù)了一個(gè)獨(dú)特的位置:專用模型性能第一 + 端側(cè)本地運(yùn)行。

| 基準(zhǔn)測(cè)試 | Mano-P 成績(jī) | 排名 | 說(shuō)明 |
| OSWorld(專用模型) | 58.2% 成功率 | 全球第一 | 領(lǐng)先第二名(OpenCUA-72b, 45.0%)13.2個(gè)百分點(diǎn) |
| OSWorld(全部模型) | 58.2% 成功率 | 前五 | 前四均為千億參數(shù)級(jí)通用大模型 |
| WebRetriever Protocol I | 41.7 NavEval | 全球第一 | 超越Gemini 2.5 Pro CU(40.9)和Claude 4.5 CU(31.3) |
| ScreenSpot-V2 | 93.5 | 領(lǐng)先 | GUI Grounding視覺(jué)定位 |
| MMBench | 87.5 | 領(lǐng)先 | 感知認(rèn)知 |
| UI-Vision | 46.6 | 領(lǐng)先 | UI視覺(jué)理解 |
| OS-World-G | 69.5 | 領(lǐng)先 | OSWorld視覺(jué)定位子任務(wù) |
| 端側(cè)推理(4B量化,M4 Pro) | 476 tokens/s預(yù)填充,76 tokens/s解碼 | — | 峰值內(nèi)存僅4.356GB |
72B 模型屠榜證明技術(shù)實(shí)力,蒸餾為 4B 上機(jī)證明日常可用。對(duì)于Mano-P來(lái)說(shuō),能力和便捷不是二選一。經(jīng)過(guò)專項(xiàng)訓(xùn)練和優(yōu)化的專用模型,完全可以在特定任務(wù)上達(dá)到甚至超越通用大模型的水平。端側(cè)模型不等于弱模型。

Mano-P 的本地模式不是在已有的云端架構(gòu)上“加了一層加密”,而是從架構(gòu)層面消除了數(shù)據(jù)外泄的可能性:
| 安全維度 | Mano-P 端側(cè)方案 | 典型云端方案 |
| 數(shù)據(jù)流向 | 所有推理在本地完成,截圖不出設(shè)備 | 截圖上傳到云端服務(wù)器處理 |
| 離線能力 | 支持完全離線運(yùn)行,無(wú)需聯(lián)網(wǎng) | 必須聯(lián)網(wǎng)才能使用 |
| 主動(dòng)性 | 7×24 不間斷運(yùn)行,無(wú)成本限制 | 平臺(tái)限制主動(dòng)頻率,越主動(dòng)越貴 |
| 代碼審計(jì) | 完整源代碼開(kāi)源,企業(yè)可自行審查 | 閉源黑盒,依賴服務(wù)商承諾 |
| 合規(guī)適配 | 天然滿足數(shù)據(jù)本地化要求 | 需額外合規(guī)評(píng)估和協(xié)議 |
對(duì)于金融機(jī)構(gòu)審查合同、醫(yī)療機(jī)構(gòu)處理病歷、政務(wù)系統(tǒng)錄入公民信息等場(chǎng)景,這種“架構(gòu)級(jí)安全”不是加分項(xiàng),而是準(zhǔn)入門檻。
在一臺(tái) Mac 上運(yùn)行大參數(shù)模型做 GUI 操作,聽(tīng)起來(lái)不太現(xiàn)實(shí)。Mano-P 靠三項(xiàng)核心技術(shù)解決了這個(gè)問(wèn)題:
Mano-P 提供了三種使用形式,覆蓋從開(kāi)發(fā)者到普通用戶的不同需求:
| 使用形式 | 適合誰(shuí) | 安裝方式 | 特點(diǎn) |
| 命令行工具(mano-cua) | 開(kāi)發(fā)者、高級(jí)用戶 | `brew install mano-cua` | 終端直接運(yùn)行任務(wù) |
| Python SDK(mano-client) | Python 開(kāi)發(fā)者 | `pip install mano-client`(開(kāi)發(fā)中) | 集成到現(xiàn)有項(xiàng)目,支持異步調(diào)用 |
| AI Agent Skill(mano-skill) | AI Agent 平臺(tái)用戶 | OpenClaw 插件安裝 | Agent 編排 + GUI 執(zhí)行無(wú)縫銜接 |
其中 mano-skill 最值得關(guān)注。作為 OpenClaw 等 AI Agent 平臺(tái)的技能插件,Mano-P 賦予了 Agent “看屏幕、動(dòng)鼠標(biāo)”的能力。OpenClaw 是大腦,Mano-P 是雙手——全鏈路開(kāi)源,全程端側(cè)運(yùn)行,數(shù)據(jù)一步不出你的設(shè)備。
舉個(gè)例子:你在 OpenClaw 中對(duì) Agent 說(shuō)“幫我把這份報(bào)告的數(shù)據(jù)錄入到公司的 ERP 系統(tǒng)里”,Agent 自動(dòng)規(guī)劃任務(wù)步驟,需要操作界面時(shí)調(diào)用 mano-skill,Mano-P 接管屏幕操作——整個(gè)過(guò)程在本地完成,Agent 編排和 GUI 執(zhí)行無(wú)縫銜接。
運(yùn)行時(shí),屏幕右上角會(huì)顯示一個(gè)狀態(tài)面板,實(shí)時(shí)顯示任務(wù)進(jìn)度,用戶可以隨時(shí)暫停或停止。每一步操作執(zhí)行前,敏感或潛在危險(xiǎn)的操作會(huì)要求用戶確認(rèn)——AI 干活,人類監(jiān)督。
GUI 智能體賽道正處于從“技術(shù)驗(yàn)證”到“規(guī)模落地”的關(guān)鍵轉(zhuǎn)折點(diǎn)。
從技術(shù)趨勢(shì)看,兩個(gè)方向正在同步發(fā)展:一是通用大模型持續(xù)提升 GUI 操作能力,二是專用端側(cè)模型通過(guò)精巧的訓(xùn)練和優(yōu)化方法,在更小的參數(shù)規(guī)模上逼近甚至超越通用模型的任務(wù)表現(xiàn)。Mano-P 已經(jīng)用實(shí)測(cè)數(shù)據(jù)證明了后一條路線的可行性——而這條路線天然兼容數(shù)據(jù)安全和合規(guī)要求。
Mano-P 代表的端側(cè)路線給出了一個(gè)清晰的回答:AI 最強(qiáng)大的能力,應(yīng)該跑在每個(gè)人自己的設(shè)備上。 開(kāi)源、本地、可審計(jì)——AI 最強(qiáng)大的能力,應(yīng)該跑在每個(gè)人自己的設(shè)備上。這不是一句口號(hào),而是一個(gè)正在被實(shí)現(xiàn)的技術(shù)路線。
| 階段 | 開(kāi)放內(nèi)容 | 目標(biāo)用戶 | 狀態(tài) |
| Phase 1(當(dāng)前) | 開(kāi)源 CUA Skills——GUI 操作的技能庫(kù) | Agent愛(ài)好者,OpenClaw/Claude Code用戶 | 已發(fā)布 |
| Phase 2 | 開(kāi)源本地模型 + Python SDK——完整的端側(cè)推理能力 | 高安全需求開(kāi)發(fā)者,本地部署 | 即將開(kāi)放 |
| Phase 3 | 開(kāi)源訓(xùn)練方法 + 剪枝量化技術(shù) | 研究人員、模型訓(xùn)練者 | 規(guī)劃中 |
立即體驗(yàn):`brew install mano-cua`

Mano-P 是一個(gè)開(kāi)源的 GUI-VLA(Vision-Language-Action)智能體,設(shè)計(jì)用于在蘋果芯片邊緣設(shè)備上本地運(yùn)行。它使用純視覺(jué)理解來(lái)跨平臺(tái)自動(dòng)化桌面 GUI 操作。Mano 是西班牙語(yǔ)里”手”的意思,P 有兩重含義:Person(個(gè)體)與 Party(組織)——我們相信,無(wú)論個(gè)人還是企業(yè),都能夠創(chuàng)造屬于自己的個(gè)性化 AI。核心理念:AI for Personal = 隱私 + 個(gè)性化。
| 對(duì)比維度 | Mano-P | Claude Computer Use |
| OSWorld(全部模型) | 58.2%(專用模型第一,全部模型前五) | 全部模型第一(千億參數(shù)級(jí)通用大模型) |
| WebRetriever Protocol I | 41.7 NavEval(領(lǐng)先) | 31.3(Claude 4.5) |
| 數(shù)據(jù)流向 | 完全本地,截圖不出設(shè)備 | 需上傳到云端 API |
| 離線運(yùn)行 | ? 支持 | ? 不支持 |
| 主動(dòng)性 | ? 7×24 無(wú)限制運(yùn)行 | ?? 受平臺(tái)算力成本限制 |
| 開(kāi)源 | ? Apache 2.0 協(xié)議 | ? 閉源 |
Mano-P 在專用模型中排名全球第一,在網(wǎng)頁(yè)檢索等任務(wù)上領(lǐng)先 Claude,且天然滿足數(shù)據(jù)安全要求。適合高安全需求場(chǎng)景。
可以! 在本地模式下,所有模型推理都在 Apple M4 設(shè)備上運(yùn)行。? 不會(huì)向外部服務(wù)器發(fā)送任何截圖或任務(wù)描述。
最低要求:Mac mini 或 MacBook;Apple M4 芯片;32GB 內(nèi)存
替代方案:任何 Mac + Mano-P 算力棒(通過(guò) USB 4.0+ 連接)
我們計(jì)劃在未來(lái)支持更多設(shè)備。
了解更多:[GitHub – Mininglamp-AI/Mano-P] (https://github.com/Mininglamp-AI/Mano-P)
聯(lián)系我們:model@mininglamp.com
]]>
Mano-P 是明略科技推出的開(kāi)源 GUI 智能體項(xiàng)目。Mano 是西班牙語(yǔ)里“手”的意思,P 有兩重含義:Person(個(gè)體)與 Party(組織)——我們相信,無(wú)論個(gè)人還是企業(yè),都能夠創(chuàng)造屬于自己的個(gè)性化 AI。其三階段開(kāi)源計(jì)劃正在逐步釋放完整的技術(shù)棧:Phase 1 開(kāi)源 CUA Skills,Phase 2 開(kāi)源本地模型 + Python SDK,Phase 3 開(kāi)源訓(xùn)練方法 + 剪枝量化技術(shù)。
一句話概括:Mano-P 是一雙 AI 的手,能像人類一樣看屏幕、理解界面、操作電腦,而且完全跑在你自己的設(shè)備上。

和傳統(tǒng) RPA(機(jī)器人流程自動(dòng)化)相比,Mano-P 有本質(zhì)區(qū)別:
| 維度 | 傳統(tǒng) RPA | Mano-P |
| 工作方式 | 依賴 API 和預(yù)設(shè)規(guī)則 | 純視覺(jué)理解,像人一樣“看”界面 |
| 界面變化 | 界面改版需重新配置 | 自適應(yīng),理解語(yǔ)義而非像素坐標(biāo) |
| 覆蓋范圍 | 僅支持有 API 的系統(tǒng) | 能操作任何人類可操作的軟件 |
| 遺留系統(tǒng) | 無(wú)法處理老舊系統(tǒng) | 通過(guò)視覺(jué)交互,無(wú)需 API 接口 |
| 部署方式 | 通常需要服務(wù)器 | 本地設(shè)備即可運(yùn)行 |
Mano-P 不是一個(gè)概念產(chǎn)品——它的能力經(jīng)過(guò)了權(quán)威基準(zhǔn)測(cè)試的嚴(yán)格驗(yàn)證。
| 基準(zhǔn)測(cè)試 | Mano-P 成績(jī) | 排名 | 說(shuō)明 |
| OSWorld(專用模型) | 58.2% | 全球第一 | 領(lǐng)先第二名 OpenCUA-72b(45.0%)13.2 個(gè)百分點(diǎn) |
| OSWorld(全部模型) | 58.2% | 第五 | 前四均為千億參數(shù)級(jí)通用大模型 |
| WebRetriever Protocol I | 41.7 NavEval | 全球第一 | 超越 Gemini 2.5 Pro(40.9)和 Claude 4.5 CU(31.3) |
| ScreenSpot-V2 | 93.5 | SOTA | GUI 元素定位精度 |
| MMBench | 87.5 | SOTA | 多模態(tài)理解綜合評(píng)測(cè) |
| UI-Vision | 46.6 | SOTA | UI 視覺(jué)理解 |
| OS-World-G | 69.5 | SOTA | GUI Grounding 定位能力 |
| 端側(cè)推理(4B, M4 Pro) | 476 tokens/s 預(yù)填充 | — | 峰值內(nèi)存 4.3GB,解碼 76 tokens/s |
一句話總結(jié):72B 模型屠榜證明技術(shù)實(shí)力,蒸餾為 4B 上機(jī)證明日常可用。對(duì)于Mano-P來(lái)說(shuō),能力和便捷不是二選一。 經(jīng)過(guò)專項(xiàng)訓(xùn)練和優(yōu)化的專用模型,在特定任務(wù)上完全可以比“大塊頭”更強(qiáng)。端側(cè)模型不等于弱模型。

在消費(fèi)級(jí)設(shè)備上運(yùn)行大參數(shù)模型做 GUI 操作,靠的是三項(xiàng)關(guān)鍵技術(shù)突破。
處理高分辨率屏幕截圖時(shí),Mano-P 智能識(shí)別關(guān)鍵信息——保留界面結(jié)構(gòu)骨架和重要 UI 元素,將視覺(jué) Token 壓縮至 12.57%。打個(gè)比方:看一張復(fù)雜的屏幕截圖,普通模型會(huì)逐像素地“讀”完整張圖,而 Mano-P 只看最重要的 13%——按鈕在哪、輸入框在哪、當(dāng)前選中了什么。推理速度提升數(shù)倍,任務(wù)成功率幾乎不受影響。
用更緊湊的方式存儲(chǔ)模型——權(quán)重用 4bit 存儲(chǔ),激活值保留 16bit。效果:
傳統(tǒng)模型只做單向?qū)W習(xí)——你告訴它“點(diǎn)擊登錄按鈕”,它學(xué)會(huì)去找登錄按鈕。Mano-P 同時(shí)訓(xùn)練兩個(gè)方向:“描述→定位”和“定位→描述”,通過(guò)循環(huán)一致性互相驗(yàn)證——既能根據(jù)指令找到按鈕,也能看到按鈕說(shuō)出它是什么。配合三階段漸進(jìn)訓(xùn)練(SFT → 離線 RL → 在線 RL),模型從“背操作手冊(cè)”進(jìn)化到“真正學(xué)會(huì)操作界面”。
大多數(shù)人以為端側(cè)模型的核心賣點(diǎn)是“數(shù)據(jù)安全”。這沒(méi)錯(cuò),但更根本的原因是:云端 AI 不可能真正“主動(dòng)”幫你。
真正有用的 AI 助手應(yīng)該是主動(dòng)的——自己發(fā)現(xiàn)你有個(gè)會(huì)議快開(kāi)了,自動(dòng)幫你準(zhǔn)備資料;看到你收到一封重要郵件,自動(dòng)提醒你;發(fā)現(xiàn)常用的系統(tǒng)數(shù)據(jù)有異常,主動(dòng)去核查。但這種“主動(dòng)性”意味著 AI 要不停地自發(fā)運(yùn)算——每隔幾分鐘檢查一次郵箱、日歷、文件。
在云端,每一次運(yùn)算都消耗平臺(tái)的算力和費(fèi)用。一個(gè)用戶一天可能產(chǎn)生上千次自發(fā)調(diào)用,乘以幾百萬(wàn)用戶,服務(wù)器費(fèi)用爆炸。所以云端平臺(tái)必然限制 AI 的主動(dòng)性——不讓它太頻繁地自己動(dòng),因?yàn)槊俊爸鲃?dòng)”一次就是在燒平臺(tái)的錢。
端側(cè)模型從根本上解決了這個(gè)問(wèn)題:AI 跑在你自己的設(shè)備上,用的是你自己的芯片和電。 它主動(dòng)跑一萬(wàn)次也不花平臺(tái)一分錢。這才是真正 7×24 貼身 AI 助手的唯一解。
Mano-P 提供本地模式和云端模式兩種推理方式。核心差異在于數(shù)據(jù)流向:
| 安全維度 | 本地模式 | 云端模式 |
| 推理位置 | Mac 本地 / 算力棒 | mano.mininglamp.com |
| 截圖數(shù)據(jù) | ? 不出設(shè)備 | ?? 發(fā)送到云端分析 |
| 離線能力 | ? 完全離線可用 | ? 需要聯(lián)網(wǎng) |
| 主動(dòng)性 | ? 7×24 無(wú)限制運(yùn)行 | ?? 受平臺(tái)成本限制 |
| 適用場(chǎng)景 | 高安全要求(金融/醫(yī)療/政務(wù)) | 一般場(chǎng)景 |
| 代碼審計(jì) | ? 完整開(kāi)源 | ? 完整開(kāi)源 |
系統(tǒng)自動(dòng)檢測(cè)本地模型配置:有本地模型用本地,沒(méi)有就自動(dòng)切換云端,無(wú)縫銜接。對(duì)于金融、醫(yī)療、法律、政務(wù)等對(duì)數(shù)據(jù)安全有剛性要求的行業(yè),本地模式不是可選項(xiàng)——是唯一選項(xiàng)。
| 使用形式 | 適合誰(shuí) | 安裝方式 | 特點(diǎn) |
| mano-cua(命令行) | 開(kāi)發(fā)者、高級(jí)用戶 | brew install mano-cua | 終端直接運(yùn)行任務(wù) |
| mano-client(Python SDK) | Python 開(kāi)發(fā)者 | pip install mano-client(開(kāi)發(fā)中) | 集成到現(xiàn)有項(xiàng)目,支持異步調(diào)用 |
| mano-skill(Agent 技能插件) | AI Agent 平臺(tái)用戶 | OpenClaw 插件安裝 | Agent 編排 + GUI 執(zhí)行無(wú)縫銜接 |
運(yùn)行時(shí),屏幕右上角顯示狀態(tài)面板,實(shí)時(shí)顯示任務(wù)進(jìn)度。敏感操作執(zhí)行前會(huì)要求用戶確認(rèn)——AI 干活,人類監(jiān)督。
Mano-P 已經(jīng)在多個(gè)場(chǎng)景中完成驗(yàn)證:
場(chǎng)景 1:全自動(dòng)化應(yīng)用構(gòu)建(Mano-afk)
系統(tǒng)接收自然語(yǔ)言需求后,自動(dòng)完成需求澄清 → 技術(shù)架構(gòu)設(shè)計(jì) → 代碼生成 → 本地部署 → 多層測(cè)試(API 測(cè)試 + 視覺(jué)檢測(cè) + 端到端 GUI 自動(dòng)化測(cè)試)。測(cè)試不通過(guò)時(shí)自動(dòng)定位根因、修復(fù)代碼、重新部署。全流程無(wú)需人工干預(yù)。
場(chǎng)景 2:商業(yè)視頻智能系統(tǒng)
從下發(fā)指令到視頻生成、上傳、分析、剪輯、二次評(píng)測(cè)的完整工作流。系統(tǒng)自主操作網(wǎng)頁(yè)與剪輯軟件,完成文件處理、字幕修改等精細(xì)操作,生成包含主客觀指標(biāo)的分析報(bào)告。
場(chǎng)景 3:企業(yè)級(jí)長(zhǎng)任務(wù)執(zhí)行
支持 100+ 步驟的企業(yè)級(jí)業(yè)務(wù)流程自動(dòng)化,包括跨應(yīng)用數(shù)據(jù)錄入、系統(tǒng)間信息遷移、批量文檔處理等復(fù)雜任務(wù),全程無(wú)需聯(lián)網(wǎng)。
Mano-P 采用 Apache 2.0 開(kāi)源協(xié)議——寬松且附帶專利保護(hù)的開(kāi)源協(xié)議,任何人和企業(yè)都可以自由使用、修改和商用,無(wú)傳染性限制,且自動(dòng)授予專利許可——企業(yè)用了不會(huì)被專利訴訟。對(duì)投資人來(lái)說(shuō),這意味著生態(tài)壁壘不靠法律鎖定,而靠技術(shù)領(lǐng)先和社區(qū)信任。
分三個(gè)階段漸進(jìn)開(kāi)放完整技術(shù)棧。其三階段開(kāi)源計(jì)劃正在逐步釋放完整的技術(shù)棧:
| 階段 | 開(kāi)放內(nèi)容 | 說(shuō)明 | 狀態(tài) |
| Phase 1(當(dāng)前) | CUA Skills | GUI 操作的技能庫(kù) | 已開(kāi)源 |
| Phase 2 | 本地模型 + Python SDK | 完整的端側(cè)推理能力 | 即將開(kāi)放 |
| Phase 3 | 訓(xùn)練方法 + 剪枝量化技術(shù) | 讓更多團(tuán)隊(duì)訓(xùn)練自己的端側(cè)模型 | 規(guī)劃中 |
技術(shù)論文已發(fā)布:arXiv:2509.17336 (https://arxiv.org/abs/2509.17336)
立即體驗(yàn):`brew install mano-cua`

Mano-P 是明略科技開(kāi)源的 GUI-VLA(Vision-Language-Action)智能體,設(shè)計(jì)用于在蘋果芯片邊緣設(shè)備上本地運(yùn)行。它使用純視覺(jué)理解來(lái)跨平臺(tái)自動(dòng)化桌面 GUI 操作。P 代表 Person(個(gè)體)與 Party(組織)——無(wú)論個(gè)人還是企業(yè),都能夠創(chuàng)造屬于自己的個(gè)性化 AI。
可以! 在本地模式下,所有模型推理都在 Apple M4 設(shè)備上運(yùn)行。? 不會(huì)向外部服務(wù)器發(fā)送任何截圖或任務(wù)描述。
| 對(duì)比維度 | Mano-P | Claude Computer Use |
| OSWorld | 58.2%(專用模型第一,全模型前五) | 全部模型第一(千億參數(shù)級(jí)) |
| WebRetriever | 41.7 NavEval(領(lǐng)先) | 31.3(Claude 4.5) |
| 數(shù)據(jù)流向 | 完全本地,截圖不出設(shè)備 | 需上傳到云端 API |
| 離線運(yùn)行 | ? 支持 | ? 不支持 |
| 主動(dòng)性 | ? 7×24 無(wú)限制運(yùn)行 | ?? 受平臺(tái)算力成本限制 |
| 開(kāi)源 | ? Apache 2.0 | ? 閉源 |
Mano-P 在專用模型中排名全球第一,在網(wǎng)頁(yè)檢索等任務(wù)上領(lǐng)先 Claude,且天然滿足數(shù)據(jù)安全要求。適合高安全需求場(chǎng)景和需要 AI 主動(dòng)服務(wù)的場(chǎng)景。
更多詳情請(qǐng)登錄GitHub了解
GitHub:[github.com/Mininglamp-AI/Mano-P] (https://github.com/Mininglamp-AI/Mano-P)
聯(lián)系我們:model@mininglamp.com
]]>在財(cái)務(wù)表現(xiàn)與經(jīng)營(yíng)質(zhì)量持續(xù)向好的同時(shí),明略科技已全面邁入 AI 原生運(yùn)營(yíng)時(shí)代。AI 正加速?gòu)妮o助工具轉(zhuǎn)變?yōu)榍度胝鎸?shí)業(yè)務(wù)流的關(guān)鍵生產(chǎn)力,推動(dòng)公司從“提供數(shù)據(jù)智能”進(jìn)一步走向“交付可量化結(jié)果”。其中,Agentic Services(智能體化服務(wù))業(yè)務(wù)模式已完成從能力驗(yàn)證到商業(yè)化落地的關(guān)鍵突破,成為明略科技推動(dòng) AI 商業(yè)化演進(jìn)的重要標(biāo)志。
明略科技創(chuàng)始人、CEO 兼 CTO 吳明輝表示:“2025 年,明略科技完成了一次關(guān)鍵轉(zhuǎn)型——從幫助客戶‘看懂?dāng)?shù)據(jù)’,到幫助客戶‘拿到結(jié)果’。Agentic Services 的意義,正是在于推動(dòng) AI 的價(jià)值從工具交付走向結(jié)果交付。這不僅改變了客戶采購(gòu)專業(yè)服務(wù)的邏輯,也正在重塑服務(wù)方式與商業(yè)模式,為明略未來(lái)打開(kāi)更大的增長(zhǎng)空間。”
2025 財(cái)年,明略科技繼續(xù)以 Data Intelligence(數(shù)據(jù)智能)為基礎(chǔ)盤,以 Agentic AI 為核心驅(qū)動(dòng)力,推動(dòng)業(yè)務(wù)結(jié)構(gòu)持續(xù)優(yōu)化。公司目前已賦能約 2,100 家知名品牌客戶以及逾 24 萬(wàn)家企業(yè)用戶,持續(xù)幫助客戶優(yōu)化決策、提升運(yùn)營(yíng)效率。報(bào)告期內(nèi),公司大客戶續(xù)約率達(dá)到 96%,核心客戶群保持穩(wěn)定,整體業(yè)務(wù)展現(xiàn)出較強(qiáng)的韌性與黏性。
依托自研企業(yè)級(jí)可信商業(yè)智能體平臺(tái) DeepMiner,公司已將 AI 系統(tǒng)性嵌入主要業(yè)務(wù)線,推動(dòng)交付邏輯加速向“Agent 驅(qū)動(dòng)”轉(zhuǎn)變,并在多個(gè)核心場(chǎng)景中取得明確成效,實(shí)現(xiàn)Data Intelligence業(yè)務(wù)板塊的運(yùn)營(yíng)效率提升,其中營(yíng)銷智能業(yè)務(wù)交付提效最高可達(dá)4倍,營(yíng)運(yùn)智能業(yè)務(wù)實(shí)現(xiàn)單工單解決時(shí)間壓縮超過(guò)30%。
報(bào)告期內(nèi),秒針系統(tǒng)全面推進(jìn)工作流的 Agentic AI 改造,歷時(shí) 60 天實(shí)現(xiàn)全鏈路貫通,系統(tǒng)性解決了社媒數(shù)據(jù)處理與AI應(yīng)用的融合難題。在保留必要人機(jī)協(xié)作的前提下,全鏈路AI自動(dòng)完成率達(dá)90%,深度復(fù)盤報(bào)告產(chǎn)出工作實(shí)現(xiàn)了 20 倍的人效提升,系統(tǒng)輸出在洞察穩(wěn)定性、框架完整性、深層洞察能力及微趨勢(shì)識(shí)別新穎性等方面也均有顯著提升。
AI 正在從輔助工具逐步演進(jìn)為業(yè)務(wù)流中的關(guān)鍵生產(chǎn)力,驅(qū)動(dòng)公司從傳統(tǒng)人力主導(dǎo)的交付模式,邁向更高效率、更強(qiáng)復(fù)用能力的智能化運(yùn)營(yíng)體系。
基于長(zhǎng)期沉淀的海量營(yíng)銷數(shù)據(jù)、客戶場(chǎng)景理解及行業(yè) Know-how,明略科技前瞻性布局 Agentic Services 模式,并正推動(dòng)其加速落地。報(bào)告期內(nèi),公司Agentic Services 業(yè)務(wù)收入超過(guò) 1 億元。作為公司 AI 商業(yè)化的重要方向,Agentic Services 不再停留于工具輸出或單點(diǎn)能力交付,而是進(jìn)一步面向客戶可量化的業(yè)務(wù)目標(biāo),提供更貼近結(jié)果的端到端服務(wù)。
報(bào)告期內(nèi),公司新增大客戶中超過(guò) 30% 來(lái)自 Agentic Services 業(yè)務(wù)板塊,表明這一模式已在多個(gè)行業(yè)的復(fù)雜需求中展現(xiàn)出較強(qiáng)的商業(yè)適配性和現(xiàn)實(shí)吸引力。圍繞營(yíng)銷場(chǎng)景,明略科技已打通從數(shù)據(jù)洞察、內(nèi)容生產(chǎn)與分發(fā)到營(yíng)銷投放的端到端業(yè)務(wù)流,以近 3 倍的運(yùn)營(yíng)效率幫助客戶實(shí)現(xiàn)平均 20% 的營(yíng)銷效果增長(zhǎng)。
無(wú)論是核心業(yè)務(wù)效率提升,還是 Agentic Services 模式的加速落地,都離不開(kāi)底層技術(shù)體系的持續(xù)支撐。作為明略科技自主研發(fā)的企業(yè)級(jí)可信 AI 智能體平臺(tái),DeepMiner 已成為連接公司各項(xiàng)業(yè)務(wù)能力的統(tǒng)一基礎(chǔ)設(shè)施,并持續(xù)支撐業(yè)務(wù)從單點(diǎn)提效走向系統(tǒng)級(jí)協(xié)同。
DeepMiner 采用“調(diào)度—決策—執(zhí)行”的多智能體分層協(xié)作架構(gòu),能夠在復(fù)雜商業(yè)場(chǎng)景中實(shí)現(xiàn)從理解任務(wù)、規(guī)劃路徑到執(zhí)行落地的全鏈條協(xié)同。截至 2025 年 10 月,公司自研 GUI 模型 Mano 在 OS-World 榜單位列總榜第二、Mind2Web 榜單第一;推理模型 Cito 則在 BFCL 小尺寸模型領(lǐng)域排名第一,以持續(xù)創(chuàng)新、領(lǐng)先行業(yè)的技術(shù)實(shí)力,進(jìn)一步夯實(shí)了明略科技在可信 AI 賽道上的長(zhǎng)期壁壘。
值得一提的是,明略科技已將 AI 深度融入組織運(yùn)行的日常肌理。報(bào)告期內(nèi),公司實(shí)現(xiàn)全體員工 100% 接入 DeepMiner 平臺(tái)。員工可結(jié)合具體業(yè)務(wù)場(chǎng)景,自主創(chuàng)建并部署專屬業(yè)務(wù) Agent,推動(dòng)內(nèi)部標(biāo)準(zhǔn)操作路徑從單向人力執(zhí)行,逐步演進(jìn)為人機(jī)協(xié)同編排。通過(guò)這一持續(xù)深入的內(nèi)部實(shí)踐,DeepMiner 已逐步沉淀為支撐公司日常運(yùn)轉(zhuǎn)的組織級(jí)基礎(chǔ)設(shè)施。
明略科技將堅(jiān)定圍繞“可信”這一核心方向,持續(xù)推進(jìn)業(yè)務(wù)縱深發(fā)展。一方面,公司將推進(jìn)軟硬一體化部署,進(jìn)一步筑牢 Agentic AI 基礎(chǔ)設(shè)施;另一方面,將加速 Agentic Services 模式在更多場(chǎng)景中的復(fù)制,持續(xù)拓寬其在內(nèi)容營(yíng)銷、文娛生態(tài)及更多數(shù)字白領(lǐng)工作領(lǐng)域的應(yīng)用邊界,并向人力與專家密集型行業(yè)滲透。
圍繞系統(tǒng)割裂、流程斷點(diǎn)、數(shù)據(jù)孤島等現(xiàn)實(shí)痛點(diǎn),公司將通過(guò)可信 AI 勞動(dòng)力的規(guī)模化輸出,推動(dòng)更多行業(yè)實(shí)現(xiàn) Agent 化改造。
與此同時(shí),明略科技也將持續(xù)對(duì)外輸出端到端 AI 調(diào)度能力,系統(tǒng)性拓展全球化業(yè)務(wù)版圖,構(gòu)建多智能體協(xié)作平臺(tái),探索人機(jī)協(xié)同生產(chǎn)力的新范式。
從提供工具到交付結(jié)果,從局部提效到 AI 原生運(yùn)營(yíng),明略科技正在通過(guò)一個(gè)個(gè)真實(shí)的業(yè)務(wù)閉環(huán),持續(xù)驗(yàn)證可信 Agentic AI 的產(chǎn)業(yè)價(jià)值,并致力于將“結(jié)果可驗(yàn)證、過(guò)程可審計(jì)、知識(shí)可沉淀”的確定性標(biāo)準(zhǔn),逐步沉淀為產(chǎn)業(yè) AI 原生交付的通用準(zhǔn)則。沿著“讓 AI 真正走進(jìn)業(yè)務(wù)、走向結(jié)果、走向規(guī)模化”的方向,明略科技將繼續(xù)堅(jiān)定前行。
報(bào)長(zhǎng)圖V3.jpg)
]]>問(wèn)卷調(diào)查用了半個(gè)多世紀(jì),邏輯清晰但有個(gè)致命bug:消費(fèi)者喜歡的廣告和刷手機(jī)時(shí)真正會(huì)看完的,往往不是同一條。
諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主丹尼爾·卡尼曼曾指出,人的大多數(shù)日常決策是由無(wú)意識(shí)的”系統(tǒng) 1″驅(qū)動(dòng)的。
問(wèn)卷調(diào)研本質(zhì)上是用理性的”系統(tǒng) 2″回答”系統(tǒng) 1″;腦電和眼動(dòng)測(cè)量則直接捕捉大腦對(duì)廣告的真實(shí)反應(yīng)。問(wèn)題是:?jiǎn)柧肀阋说粔驕?zhǔn),腦電準(zhǔn)但太貴。
直到我們找到了第三條路——用 AI 來(lái)”問(wèn)大腦”。
AdEff 是明略科技(2718.HK)于2025年推出的 AI 驅(qū)動(dòng)的全球化廣告創(chuàng)意測(cè)試及優(yōu)化平臺(tái)。基于自研超圖多模態(tài)大語(yǔ)言模型(HMLLM)+過(guò)去10+年積累的10萬(wàn)+次神經(jīng)科學(xué)測(cè)量經(jīng)驗(yàn)和數(shù)據(jù)”研發(fā)。用戶上傳一條廣告視頻,最快 15 分鐘即可拿到一份完整的測(cè)試報(bào)告,涵蓋受眾注意力曲線、情感波動(dòng)分析、關(guān)鍵時(shí)刻診斷等多維度分析以及具體優(yōu)化建議。

聽(tīng)上去很簡(jiǎn)單?值得拆解的是底層。
AdEff 的核心技術(shù)底座是我們自主研發(fā)的 HMLLM(超圖多模態(tài)大語(yǔ)言模型,Hypergraph Multimodal Large Language Model)。這個(gè)名字里最關(guān)鍵的一個(gè)詞是“超圖”。
先說(shuō)”圖”。在數(shù)學(xué)中,圖是描述關(guān)系的結(jié)構(gòu):兩個(gè)節(jié)點(diǎn)之間畫一條邊,表示它們有關(guān)聯(lián)。社交網(wǎng)絡(luò)就是典型的圖,你和每個(gè)朋友之間各連一條線。但普通圖有一個(gè)局限:每條邊只能連接兩個(gè)節(jié)點(diǎn),只能表達(dá)”A 和 B 有關(guān)系”這種兩兩之間的簡(jiǎn)單關(guān)聯(lián)。
“超圖”突破了這一限制。一條超邊可以同時(shí)連接任意多個(gè)節(jié)點(diǎn),描述的是”A、B、C、D 同時(shí)出現(xiàn)時(shí)才會(huì)產(chǎn)生的高階關(guān)聯(lián)”。
為什么廣告測(cè)試需要超圖?因?yàn)橐粭l廣告的效果從來(lái)不是單一元素決定的。
舉個(gè)例子:一條 15 秒的品牌廣告中,第 3 秒的畫面切換、背景音樂(lè)從舒緩變激昂、字幕上閃過(guò)一句”限時(shí)特惠”。這三個(gè)元素單獨(dú)來(lái)看都平平無(wú)奇,但它們?cè)谕粫r(shí)刻疊加,可能恰好觸發(fā)了一次注意力峰值。這種多因素的協(xié)同效應(yīng),普通圖結(jié)構(gòu)捕捉不到,但超圖可以。
HMLLM 正是通過(guò)超圖結(jié)構(gòu)來(lái)建模視覺(jué)元素、EEG 腦電信號(hào)與眼動(dòng)追蹤數(shù)據(jù)之間的復(fù)雜關(guān)系。模型不僅能”看”到廣告里有什么畫面、”聽(tīng)”到了什么聲音,更能捕捉這些多模態(tài)信息同時(shí)出現(xiàn)時(shí),人類大腦產(chǎn)生了怎樣的反應(yīng)——注意力是否被吸引、情緒是否波動(dòng)、品牌信息是否被編碼進(jìn)記憶。
這項(xiàng)技術(shù)代表了全球范圍內(nèi)首次嘗試讓機(jī)器系統(tǒng)性地理解人類觀看視頻時(shí)的主觀感受,我們的相關(guān)研究成果在全球頂級(jí)多媒體會(huì)議 ACM Multimedia(ACMMM)2024 上獲得最佳論文提名。

一個(gè)模型的預(yù)測(cè)能力,取決于它見(jiàn)過(guò)多少”真題”。
HMLLM 的訓(xùn)練數(shù)據(jù)既不是通用互聯(lián)網(wǎng)語(yǔ)料,也不是人工標(biāo)注的廣告質(zhì)量分類集。它來(lái)自一個(gè)更稀缺、更有價(jià)值的數(shù)據(jù)源:大規(guī)模真人受眾的腦電與眼動(dòng)測(cè)量數(shù)據(jù)。
在 AdEff 問(wèn)世之前,我們用了超過(guò)十年的時(shí)間積累這些數(shù)據(jù)。把真人受試者請(qǐng)進(jìn)實(shí)驗(yàn)室,戴上 EEG 腦電帽、坐在眼動(dòng)儀前,觀看不同的廣告素材,全程采集他們的神經(jīng)信號(hào)和視覺(jué)注意力數(shù)據(jù)。然后把這些主觀反應(yīng)數(shù)據(jù)與廣告素材的多模態(tài)特征一一配對(duì),形成訓(xùn)練集。迄今為止,這個(gè)數(shù)據(jù)集已經(jīng)積累了超過(guò) 10 萬(wàn)人次的真實(shí)測(cè)量數(shù)據(jù),覆蓋了跨行業(yè)、跨品類、跨文化的廣告素材。
在此基礎(chǔ)上,我們構(gòu)建并開(kāi)源了兩個(gè)原創(chuàng)數(shù)據(jù)集:
? Video-SME:大規(guī)模視頻主觀多模態(tài)評(píng)估數(shù)據(jù)集,收集了不同人群在觀看相同視頻內(nèi)容時(shí)的腦電波和眼動(dòng)區(qū)域的真實(shí)變化,為視頻內(nèi)容的主觀體驗(yàn)量化提供了標(biāo)準(zhǔn)化基準(zhǔn)。
? SPA-ADV:大規(guī)模廣告注視點(diǎn)預(yù)測(cè)數(shù)據(jù)集,專注于捕捉個(gè)體差異對(duì)視覺(jué)注意力的影響。
這也是 AdEff 最核心的壁壘所在:不僅有海量廣告素材,更有海量廣告素材所對(duì)應(yīng)的真實(shí)人類神經(jīng)反應(yīng)數(shù)據(jù),也是我們推動(dòng)整個(gè)行業(yè)建立更科學(xué)的廣告效果評(píng)估標(biāo)準(zhǔn)所貢獻(xiàn)的綿薄之力。
用戶上傳一條廣告素材后,HMLLM 經(jīng)歷四個(gè)核心步驟:
第一步,內(nèi)容解碼。 將廣告素材拆解為結(jié)構(gòu)化的多模態(tài)特征向量,如畫面構(gòu)成、文案語(yǔ)義、品牌元素的出現(xiàn)時(shí)機(jī)與位置,每一幀都被充分解析。
第二步,反饋預(yù)測(cè)。基于超圖結(jié)構(gòu),將多模態(tài)特征映射到腦電和眼動(dòng)空間,預(yù)測(cè)真實(shí)受眾的注意力分配模式、情緒反應(yīng)曲線等信息,輸出注意力曲線和情感波動(dòng)圖,并自動(dòng)識(shí)別出關(guān)鍵時(shí)刻。
第三步,基準(zhǔn)對(duì)標(biāo)。將預(yù)測(cè)結(jié)果與創(chuàng)意數(shù)據(jù)庫(kù)中同品類、同媒介形式的歷史數(shù)據(jù)進(jìn)行比對(duì)。同樣一個(gè)注意力得分,對(duì)快消品和汽車行業(yè)的含義完全不同,需要在正確的參照系下解讀。
第四步,診斷推理。基于明略科技自研大模型的多智能體協(xié)作架構(gòu),不同的 Agent 分別負(fù)責(zé)歸因分析、優(yōu)化建議生成和可視化呈現(xiàn)。最終輸出的報(bào)告不僅能告訴用戶哪一秒注意力下降了,還會(huì)指出為什么下降以及如何改進(jìn),讓優(yōu)化有據(jù)可依。
經(jīng)科學(xué)驗(yàn)證,89% 的 AdEff 預(yù)測(cè)得分與真人樣本測(cè)試結(jié)果具有強(qiáng)相關(guān)性,76% 的測(cè)評(píng)結(jié)論與行業(yè)專家判斷一致。在絕大多數(shù)場(chǎng)景下,AI 預(yù)測(cè)的可靠性已經(jīng)足以支撐商業(yè)決策。
回到最初的問(wèn)題:一條廣告好不好,到底該問(wèn)消費(fèi)者還是問(wèn)他的大腦?
我們的答案是:用AI來(lái)問(wèn)大腦。當(dāng) Seedance 2.0、Sora 們讓每條素材的生產(chǎn)成本趨近于零,判斷”哪條值得投”的能力,反而成了最昂貴的環(huán)節(jié)。創(chuàng)意不再稀缺,判斷力才是。
AdEff 正在做的事,是把原本只有大品牌才負(fù)擔(dān)得起的專業(yè)判斷力,通過(guò) AI 交付給每一個(gè)需要它的人。讓每一條創(chuàng)意,都值得被科學(xué)地評(píng)價(jià)。
目前,AdEff 已服務(wù)快消、醫(yī)藥保健、美妝個(gè)護(hù)、3C、互聯(lián)網(wǎng)零售等多個(gè)行業(yè)客戶。
圍繞企業(yè)廣告視頻創(chuàng)意場(chǎng)景,明略科技可信商業(yè)智能體DeepMiner、零壹貳叁還可提供視頻內(nèi)容洞察、AIGC創(chuàng)意視頻生成等全方位解決方案。
如果你也在面臨創(chuàng)意量產(chǎn)帶來(lái)的試錯(cuò)壓力
???點(diǎn)擊此處,進(jìn)一步了解 AdEff
鎖定AI時(shí)代優(yōu)質(zhì)創(chuàng)意
隨著香港加速建設(shè)國(guó)際創(chuàng)新科技中心,AI技術(shù)正成為深化內(nèi)地與香港經(jīng)貿(mào)合作的重要引擎。
今年1月,憑借企業(yè)級(jí)大模型與智能體技術(shù)能力與實(shí)踐經(jīng)驗(yàn),明略科技(2718.HK)正式加入香港中國(guó)企業(yè)協(xié)會(huì)(簡(jiǎn)稱”中企協(xié)會(huì)”),成為協(xié)會(huì)會(huì)員單位,為協(xié)會(huì)生態(tài)注入前沿AI技術(shù)能力。
據(jù)介紹,香港中國(guó)企業(yè)協(xié)會(huì)(“中企協(xié)會(huì)”)成立于1991年,以“貫徹一國(guó)兩制方針,促進(jìn)香港繁榮穩(wěn)定”為創(chuàng)會(huì)宗旨,是全體在港中資企業(yè)的代表,也是團(tuán)結(jié)引領(lǐng)中資企業(yè)全面參與香港各項(xiàng)事務(wù)的工作平臺(tái),在香港工商界及社會(huì)各界具有較高知名度和重要影響力。中企協(xié)會(huì)現(xiàn)有會(huì)員企業(yè)超過(guò)1300家,涉及金融、航運(yùn)、商貿(mào)、創(chuàng)科等各個(gè)行業(yè)領(lǐng)域,為香港的經(jīng)濟(jì)發(fā)展、社會(huì)穩(wěn)定、文化繁榮、民生保供等,做出了重要貢獻(xiàn)。
近日,明略科技高級(jí)副總裁孫方超、香港總經(jīng)理張曉及AIGC業(yè)務(wù)(零壹貳叁)合伙人兼高級(jí)副總裁周昊一行拜訪中企協(xié)會(huì),與中企協(xié)會(huì)副總裁曾燊典、中企協(xié)會(huì)會(huì)員事務(wù)部總監(jiān)任鈦石進(jìn)行友好會(huì)談,并現(xiàn)場(chǎng)接受會(huì)員證書(shū)頒發(fā)。

會(huì)談中,明略科技團(tuán)隊(duì)重點(diǎn)展示了AI領(lǐng)域的技術(shù)積累與創(chuàng)新能力。近年來(lái),公司已構(gòu)建起從多模態(tài)數(shù)據(jù)智能到Agentic AI的完整技術(shù)棧,依托專有大模型能力與深厚的行業(yè)數(shù)據(jù)知識(shí),持續(xù)為企業(yè)打造Agentic AI時(shí)代的可信生產(chǎn)力,并在多個(gè)行業(yè)積累了豐富的落地經(jīng)驗(yàn),能夠?yàn)樵诟壑匈Y企業(yè)提供多場(chǎng)景的智能化解決方案,幫助企業(yè)解決實(shí)際業(yè)務(wù)痛點(diǎn)。
中企協(xié)會(huì)領(lǐng)導(dǎo)對(duì)明略科技的加入表示熱烈歡迎,高度認(rèn)可明略科技在AI技術(shù)創(chuàng)新與應(yīng)用落地方面的成就,并期待未來(lái)與協(xié)會(huì)其他成員企業(yè)開(kāi)展更多交流合作。
雙方一致認(rèn)為,明略科技的AI技術(shù)能力與協(xié)會(huì)會(huì)員企業(yè)的多元化需求高度契合,未來(lái)可通過(guò)技術(shù)分享會(huì)、專題研討等形式展開(kāi)務(wù)實(shí)合作,為協(xié)會(huì)內(nèi)廣大中資企業(yè)提供先進(jìn)的AI賦能服務(wù),助力企業(yè)智能化升級(jí)。

明略科技于2025年進(jìn)駐香港,作為香港第五批重點(diǎn)企業(yè),同年成功登陸港交所,成為”全球Agentic AI第一股”。目前已在香港建立本地化團(tuán)隊(duì),持續(xù)拓展在港業(yè)務(wù)。
此次加入中企協(xié)會(huì),是明略科技深化香港布局的又一重要舉措。借助中企協(xié)會(huì)覆蓋廣泛的會(huì)員網(wǎng)絡(luò),明略科技將進(jìn)一步拓展在港業(yè)務(wù)版圖,推動(dòng)AI技術(shù)在更多場(chǎng)景落地,為內(nèi)地與香港經(jīng)貿(mào)技術(shù)交流合作注入新動(dòng)能。
2026年3月15日,第十七屆中國(guó)產(chǎn)學(xué)研合作創(chuàng)新大會(huì)在北京會(huì)議中心隆重舉行。全國(guó)人大常委會(huì)原副委員長(zhǎng)陳至立,全國(guó)政協(xié)原副主席、中國(guó)科協(xié)主席萬(wàn)鋼等領(lǐng)導(dǎo),以及教育部黨組成員、副部長(zhǎng)徐青森,國(guó)家知識(shí)產(chǎn)權(quán)局黨組成員、副局長(zhǎng)胡文輝等部委領(lǐng)導(dǎo)發(fā)表致辭。中國(guó)產(chǎn)學(xué)研合作促進(jìn)會(huì)會(huì)長(zhǎng)王建華主持會(huì)議。來(lái)自全國(guó)產(chǎn)學(xué)研界的千余位代表共聚一堂,圍繞“科技創(chuàng)新 產(chǎn)業(yè)創(chuàng)新 深度融合”主題展開(kāi)深度交流。
大會(huì)隆重頒發(fā)2025年中國(guó)產(chǎn)學(xué)研合作促進(jìn)會(huì)科技創(chuàng)新獎(jiǎng)。明略科技(2718.HK)創(chuàng)始人、CEO兼CTO吳明輝 憑借在人工智能技術(shù)與產(chǎn)業(yè)深度融合方面的卓越貢獻(xiàn),從眾多候選人中脫穎而出,榮獲“2025年中國(guó)產(chǎn)學(xué)研合作促進(jìn)會(huì)科技創(chuàng)新獎(jiǎng)——?jiǎng)?chuàng)新人物獎(jiǎng)”,并作為獲獎(jiǎng)代表登臺(tái)領(lǐng)獎(jiǎng)。

中國(guó)產(chǎn)學(xué)研合作促進(jìn)會(huì)科技創(chuàng)新獎(jiǎng),由中國(guó)產(chǎn)學(xué)研合作促進(jìn)會(huì)發(fā)起,2008年獲科技部、國(guó)家科技獎(jiǎng)勵(lì)工作辦公室正式批準(zhǔn),是我國(guó)產(chǎn)學(xué)研協(xié)同創(chuàng)新領(lǐng)域的最高榮譽(yù)獎(jiǎng)。該獎(jiǎng)項(xiàng)分設(shè):創(chuàng)新人物獎(jiǎng)、創(chuàng)新成果獎(jiǎng),評(píng)選層次高、標(biāo)準(zhǔn)嚴(yán)、公信力強(qiáng),旨在表彰在推進(jìn)產(chǎn)學(xué)研用協(xié)同創(chuàng)新和實(shí)現(xiàn)高水平科技自立自強(qiáng)工作中做出突出貢獻(xiàn)的科技工作者和重要科技成果,被公認(rèn)為產(chǎn)學(xué)研界的“風(fēng)向標(biāo)”。
當(dāng)前,全球科技競(jìng)爭(zhēng)加劇,人才作為科技創(chuàng)新的第一資源,是破解“卡脖子”技術(shù)難題,實(shí)現(xiàn)高水平科技自立自強(qiáng)、培育新質(zhì)生產(chǎn)力的核心動(dòng)力。
為進(jìn)一步激發(fā)產(chǎn)學(xué)研界科技人才創(chuàng)新活力、推動(dòng)更多科技成果轉(zhuǎn)化為現(xiàn)實(shí)生產(chǎn)力,在科技部和國(guó)家獎(jiǎng)勵(lì)辦的指導(dǎo)下,中國(guó)產(chǎn)學(xué)研合作促進(jìn)會(huì)于2025年組織開(kāi)展創(chuàng)新人物獎(jiǎng)評(píng)審。
經(jīng)過(guò)專家評(píng)審、公示、終審多輪嚴(yán)格篩選,明略科技創(chuàng)始人、CEO兼CTO吳明輝、宇樹(shù)科技CEO王興興、海爾集團(tuán)CEO周云杰等優(yōu)秀企業(yè)家,以及兩院院士、杰青、長(zhǎng)江學(xué)者、萬(wàn)人領(lǐng)軍等頂尖人才共同入選,集中展現(xiàn)我國(guó)科技創(chuàng)新與產(chǎn)業(yè)融合領(lǐng)域的硬實(shí)力。
大會(huì)現(xiàn)場(chǎng),全國(guó)人大常委會(huì)原副委員長(zhǎng)陳至立,全國(guó)政協(xié)原副主席、中國(guó)科協(xié)主席萬(wàn)鋼,教育部黨組成員、副部長(zhǎng)徐青森,國(guó)家知識(shí)產(chǎn)權(quán)局黨組成員、副局長(zhǎng)胡文輝等領(lǐng)導(dǎo)為獲獎(jiǎng)?wù)哳C獎(jiǎng)。明略科技吳明輝作為創(chuàng)新人物獎(jiǎng)獲獎(jiǎng)代表登臺(tái)領(lǐng)獎(jiǎng)。


作為明略科技的領(lǐng)航者,吳明輝此次獲獎(jiǎng)源于他二十年來(lái)深耕產(chǎn)學(xué)研一線的堅(jiān)守與創(chuàng)新。2006年,他在北大讀研期間創(chuàng)立秒針系統(tǒng),打造中國(guó)首個(gè)互聯(lián)網(wǎng)用戶行為與營(yíng)銷數(shù)據(jù)分析平臺(tái),填補(bǔ)國(guó)內(nèi)市場(chǎng)空白。此后,他帶領(lǐng)團(tuán)隊(duì)完成多次技術(shù)創(chuàng)新:

吳明輝的創(chuàng)新實(shí)踐始終圍繞“技術(shù)落地”展開(kāi),推動(dòng)明略科技將AI技術(shù)深度融入營(yíng)銷智能與營(yíng)運(yùn)智能場(chǎng)景,迄今已服務(wù)135家財(cái)富世界500強(qiáng)企業(yè),賦能2000+國(guó)內(nèi)外頭部企業(yè),20萬(wàn)+中小企業(yè),惠及零售、快消、汽車、3C、美妝、母嬰等行業(yè)客戶。
此次榮膺創(chuàng)新人物獎(jiǎng),既是中國(guó)產(chǎn)學(xué)研界對(duì)吳明輝多年來(lái)堅(jiān)守創(chuàng)新初心、深耕產(chǎn)業(yè)落地的充分肯定,更是對(duì)明略科技產(chǎn)學(xué)研一體化發(fā)展模式的高度贊譽(yù)。
站在新的榮譽(yù)起點(diǎn)上,明略科技將在吳明輝的帶領(lǐng)下,繼續(xù)以科技創(chuàng)新為核心驅(qū)動(dòng)力,深化產(chǎn)學(xué)研協(xié)同創(chuàng)新合作,加速關(guān)鍵核心技術(shù)攻關(guān)與成果轉(zhuǎn)化,借人工智能之力解決復(fù)雜的商業(yè)問(wèn)題,為實(shí)現(xiàn)高水平科技自立自強(qiáng)、推動(dòng)高質(zhì)量發(fā)展貢獻(xiàn)更多“明略力量”。
當(dāng)生產(chǎn)端的瓶頸被打破,新的行業(yè)痛點(diǎn)正在以更隱蔽、更劇烈的方式出現(xiàn)。越來(lái)越多的品牌市場(chǎng)負(fù)責(zé)人、增長(zhǎng)操盤手、企業(yè)決策者,都在面對(duì)同一個(gè)現(xiàn)實(shí)困境:
創(chuàng)意產(chǎn)出越快,試錯(cuò)壓力越大;素材變體越多,決策成本越高;制作成本越低,投放浪費(fèi)越嚴(yán)重。AIGC解決了”做不出”的問(wèn)題,卻讓”測(cè)不起”成為全行業(yè)共同的新挑戰(zhàn)。
一個(gè)品牌單日通過(guò)AI生成數(shù)十支創(chuàng)意視頻,團(tuán)隊(duì)卻陷入無(wú)從選擇的迷茫。依靠人工經(jīng)驗(yàn)篩選,難免主觀片面;開(kāi)啟小流量實(shí)測(cè),周期長(zhǎng)、成本高;等到數(shù)據(jù)回收完成,熱點(diǎn)窗口期已過(guò),競(jìng)品早已占據(jù)用戶心智。最終,大量預(yù)算消耗在“證明素材無(wú)效”的過(guò)程中,真正能夠穩(wěn)定貢獻(xiàn)轉(zhuǎn)化的創(chuàng)意,依舊屈指可數(shù)。
隨著創(chuàng)意生產(chǎn)實(shí)現(xiàn)普惠,行業(yè)的下一個(gè)核心命題是:讓創(chuàng)意投放回歸科學(xué)。
企業(yè)真正需要的,不再只是“更多創(chuàng)意”,而是“更對(duì)的創(chuàng)意”;不再只是“更快產(chǎn)出”,而是“更準(zhǔn)決策”。
能不能在投放之前,就快速知道這條創(chuàng)意行不行?
能不能不用燒錢測(cè)試,就能篩掉大概率跑不出來(lái)的素材?
能不能讓幾十上百條創(chuàng)意,有個(gè)高效、低成本、靠譜的篩選方式?
在你把視頻廣告預(yù)算花出去之前,先用低成本、高效率的方式,幫你把高潛力創(chuàng)意找出來(lái),把無(wú)效消耗攔在前面。
AdEff?是明略科技(2718.HK)基于“自研超圖多模態(tài)大語(yǔ)言模型(HMLLM)+過(guò)去10+年積累的10萬(wàn)+次神經(jīng)科學(xué)測(cè)量經(jīng)驗(yàn)和數(shù)據(jù)”研發(fā)的全球化AI創(chuàng)意測(cè)試產(chǎn)品。【即刻注冊(cè)】

? 分鐘級(jí)創(chuàng)意效果測(cè)試:最快15分鐘完成廣告測(cè)試
? 秒級(jí)優(yōu)化建議:根據(jù)受眾注意力曲線、情感波動(dòng)等維度變化,提供視頻關(guān)鍵片段(如廣告黃金3秒、品牌時(shí)刻、用戶興趣時(shí)刻等)優(yōu)劣勢(shì)分析及優(yōu)化建議
? 最優(yōu)創(chuàng)意篩選:支持多種采買模式,低成本測(cè)試多個(gè)創(chuàng)意(不同版本、不同內(nèi)容),結(jié)合DeepMiner,分析不同創(chuàng)意優(yōu)劣勢(shì)
為了驗(yàn)證 AdEff 的商業(yè)實(shí)用性,2025年我們對(duì)其進(jìn)行了樣本一致性與專家一致性測(cè)試。
通過(guò)對(duì)真人樣本廣告創(chuàng)意測(cè)試的平均分,以及 AdEff 廣告創(chuàng)意預(yù)測(cè)得分進(jìn)行回歸分析,89% 的 AdEff 的預(yù)測(cè)得分與真人樣本測(cè)試得分具有強(qiáng)相關(guān)性,實(shí)際應(yīng)用中具有高度準(zhǔn)確性及可靠性。
相較于普通的真人樣本,專家對(duì)廣告片中的專業(yè)表達(dá)理解更到位,對(duì)廣告創(chuàng)意測(cè)評(píng)的要求更高,對(duì)“好創(chuàng)意”也有更嚴(yán)苛的評(píng)判標(biāo)準(zhǔn)。綜合效果指數(shù)、反應(yīng)曲線、指標(biāo)分析、黃金3秒、結(jié)尾3秒、熱力圖及4項(xiàng)核心結(jié)果的測(cè)評(píng)結(jié)果,76% 的 AdEff 測(cè)評(píng)結(jié)果符合專家預(yù)期(所有結(jié)果均符合預(yù)期為100%)。

? 自研超大規(guī)模主觀個(gè)性化數(shù)據(jù)集支撐
利用明略科技(2718.HK)自研設(shè)備,采集海量真實(shí)受試者的腦電與注視點(diǎn)信號(hào),構(gòu)建 Video-SME 與 SPA-ADV 兩大原創(chuàng)數(shù)據(jù)集并發(fā)表開(kāi)源,為主觀體驗(yàn)的科學(xué)量化提供堅(jiān)實(shí)基準(zhǔn)。
? 多模態(tài)主觀指標(biāo)建模
突破傳統(tǒng)依賴問(wèn)卷與顯著性熱圖的方式,首次將眼動(dòng)、腦電等多源信號(hào)與視頻、音頻內(nèi)容深度融合,實(shí)現(xiàn)秒級(jí)粒度的注意力、情緒與認(rèn)知建模。
? 全球領(lǐng)先自研超圖多模態(tài)大語(yǔ)言模型(HMLLM)
ACMMM 2024 最佳論文提名研究成果,通過(guò)超圖結(jié)構(gòu)將視頻幀、音頻、人口特征與生理信號(hào)統(tǒng)一建模,彌合語(yǔ)義鴻溝,支持幀級(jí)邏輯推理與人群差異解讀。
? 多模態(tài)混合專家模型協(xié)同
采用明略科技(2718.HK)自研多模態(tài)混合專家模型協(xié)同架構(gòu)(MoE),通過(guò)動(dòng)態(tài)調(diào)度不同領(lǐng)域的專家模型,AdEff 能夠在主觀上理解人類感受,在客觀上洞察多模態(tài)數(shù)據(jù)之間的關(guān)聯(lián),結(jié)合專家的判斷與分析,幫助企業(yè)快速制定科學(xué)決策。
隨著廣告的泛化、效果化,人們對(duì)于“什么是好廣告?”的認(rèn)知逐漸模糊,這也將引發(fā)關(guān)乎投放成本、內(nèi)容風(fēng)險(xiǎn)等一系列連鎖反應(yīng)。
在AI盛行的時(shí)代,我們會(huì)失去判斷力嗎?AdEff 的答案是不會(huì)。我們希望通過(guò)“可信模型+可信數(shù)據(jù)”建立一套科學(xué)的標(biāo)準(zhǔn),為企業(yè)生產(chǎn)更多用戶喜愛(ài)的“好內(nèi)容”保駕護(hù)航。
在 OPC 成為新流行的當(dāng)下,如果你是超級(jí)個(gè)體,AdEff 也能在“接單—制作—交付—復(fù)盤”等環(huán)節(jié)助你一臂之力:
? 接單:提前測(cè)試過(guò)往樣片效果,基于測(cè)試數(shù)據(jù),展示專業(yè)能力,建立客戶信任;
? 制作:既可以測(cè)試未完稿創(chuàng)意,也可以在完稿后從多版創(chuàng)意中選出最優(yōu)版本;
? 交付:基于 AdEff 測(cè)試結(jié)果進(jìn)行交付,減少因主觀判斷不同造成的重復(fù)溝通;
? 復(fù)盤:建立個(gè)人創(chuàng)意素材庫(kù),積累測(cè)試案例,基于測(cè)試數(shù)據(jù),總結(jié)優(yōu)秀創(chuàng)意方法論,提升個(gè)人創(chuàng)作能力和商業(yè)價(jià)值。
目前,AdEff 已服務(wù)快消、醫(yī)藥保健、美妝個(gè)護(hù)、3C、互聯(lián)網(wǎng)零售等多個(gè)行業(yè)客戶。
圍繞企業(yè)廣告視頻創(chuàng)意場(chǎng)景,明略科技(2718.HK)可信商業(yè)智能體DeepMiner、零壹貳叁還可提供視頻內(nèi)容洞察、AIGC創(chuàng)意視頻生成等全方位解決方案。
如果你也在面臨創(chuàng)意量產(chǎn)帶來(lái)的試錯(cuò)壓力
???點(diǎn)擊此處,進(jìn)入?AdEff?官網(wǎng)
即刻鎖定AI時(shí)代的優(yōu)質(zhì)創(chuàng)意~~
]]>2026年2月,開(kāi)源AI助手OpenClaw在全球科技圈引發(fā)熱議。這個(gè)被稱為”真正能干活的AI”以其獨(dú)特的”自主執(zhí)行”能力,讓企業(yè)管理者既看到了效率提升的巨大潛力,也產(chǎn)生了諸多現(xiàn)實(shí)疑問(wèn):它能為企業(yè)帶來(lái)什么實(shí)際價(jià)值?如何在組織內(nèi)部落地?安全風(fēng)險(xiǎn)如何控制?技術(shù)選型應(yīng)該考慮哪些因素?
在上一期專家解讀中,我們介紹了OpenClaw的核心理念與企業(yè)應(yīng)用。本期,明略科技(2718.HK)副總裁李夢(mèng)林將進(jìn)一步解讀AI Agent的行業(yè)影響及未來(lái)發(fā)展趨勢(shì)。
Q1:最近,谷歌、Anthropic等企業(yè)在不同程度上限制了 OpenClaw 接入。與此同時(shí),越來(lái)越多的中國(guó)模型廠商則主動(dòng)擁抱 OpenClaw,這對(duì)中國(guó) AI Agent 發(fā)展將產(chǎn)生怎樣的深遠(yuǎn)影響?
李夢(mèng)林:OpenClaw的”自帶代理”(Bring Your Own Agent)模式,本質(zhì)上觸發(fā)了AI產(chǎn)業(yè)鏈的一次利益再分配。海外模型廠商的限制舉措,核心原因是訂閱制定價(jià)模型與Agent高強(qiáng)度調(diào)用之間的經(jīng)濟(jì)矛盾。這一博弈對(duì)中國(guó)AI發(fā)展反而創(chuàng)造了獨(dú)特機(jī)遇。
一方面,中國(guó)市場(chǎng)正處于AI應(yīng)用的快速擴(kuò)張期,企業(yè)對(duì)能夠真正提升效率的AI Agent有強(qiáng)烈的落地需求。OpenClaw這樣的開(kāi)源工具讓大量企業(yè)第一次真切感受到AI Agent的實(shí)際價(jià)值,這種認(rèn)知普及本身就在加速整個(gè)市場(chǎng)的成熟。
另一方面,部分海外廠商的限制客觀上為中國(guó)模型廠商打開(kāi)了生態(tài)窗口。當(dāng)Anthropic和谷歌收緊接口時(shí),國(guó)產(chǎn)模型通過(guò)積極兼容OpenClaw等開(kāi)源框架,能夠快速服務(wù)于用戶的應(yīng)用場(chǎng)景,在實(shí)戰(zhàn)中打磨模型能力。
但我們也需要理性看到,當(dāng)前階段OpenClaw接入國(guó)產(chǎn)模型后的效果參差不齊,這恰恰說(shuō)明通用Agent框架的能力天花板受限于底層模型。對(duì)中國(guó)AI產(chǎn)業(yè)而言,更具戰(zhàn)略價(jià)值的方向不是單純做”更兼容OpenClaw的模型”,而是發(fā)展面向企業(yè)核心場(chǎng)景的專用模型能力,將通用模型的推理能力與行業(yè)知識(shí)深度融合,形成企業(yè)真正能用、敢用的解決方案。
Q2:OpenClaw雖然開(kāi)源,但核心開(kāi)發(fā)者在海外,對(duì)中國(guó)企業(yè)的特定需求理解有限。若想解決這一問(wèn)題,中國(guó)企業(yè)或服務(wù)商還需補(bǔ)足哪些能力?
李夢(mèng)林:OpenClaw的局限恰恰指向了中國(guó)企業(yè)的機(jī)會(huì)所在。作為通用框架,OpenClaw試圖用”一個(gè)Agent+工具調(diào)用”解決所有問(wèn)題,但企業(yè)級(jí)應(yīng)用的現(xiàn)實(shí)是不同行業(yè)、不同場(chǎng)景的知識(shí)壁壘和流程差異巨大,通用方案很難做到又穩(wěn)又準(zhǔn)。
第一是場(chǎng)景深度。以營(yíng)銷領(lǐng)域?yàn)槔瑥南M(fèi)者洞察、策略制定、內(nèi)容生成到效果歸因,每一環(huán)都需要行業(yè)專屬知識(shí),不是通用模型簡(jiǎn)單調(diào)用工具就能解決的。中國(guó)企業(yè)在這些垂直場(chǎng)景中積累的行業(yè)數(shù)據(jù)和業(yè)務(wù)理解,是構(gòu)建專用Agent最重要的壁壘。
第二是端到端的GUI自動(dòng)化能力。企業(yè)員工日常工作中大量時(shí)間花在各種軟件系統(tǒng)之間的切換操作上,這些工作機(jī)械重復(fù)卻不可或缺。通用框架通過(guò)Shell命令和API調(diào)用來(lái)執(zhí)行任務(wù),對(duì)于沒(méi)有開(kāi)放API的企業(yè)軟件系統(tǒng)力不從心。而專門針對(duì)GUI交互訓(xùn)練的模型,能像人一樣直接操作軟件界面,覆蓋更多真實(shí)企業(yè)場(chǎng)景。
第三是工程化和產(chǎn)品化能力。從技術(shù)原型到企業(yè)級(jí)產(chǎn)品,中間需要解決穩(wěn)定性、安全性、可管控性等一系列工程問(wèn)題。中國(guó)企業(yè)在ToB服務(wù)中積累的落地經(jīng)驗(yàn)本身就是核心競(jìng)爭(zhēng)力。
我們認(rèn)為,中國(guó)企業(yè)在AI Agent領(lǐng)域的機(jī)會(huì)不是做”中國(guó)版OpenClaw”,而是做OpenClaw做不到的事:更懂行業(yè)、更深場(chǎng)景、更穩(wěn)落地。
Q3:OpenClaw的出現(xiàn)預(yù)示了AI Agent發(fā)展的哪些新趨勢(shì)?未來(lái)的AI助手會(huì)朝什么樣的方向進(jìn)化?
李夢(mèng)林:OpenClaw的爆火不僅是一個(gè)開(kāi)源項(xiàng)目的成功,更是AI應(yīng)用范式轉(zhuǎn)變的標(biāo)志性事件,它預(yù)示了四個(gè)重要趨勢(shì)。
一是從”對(duì)話”到”執(zhí)行”的能力質(zhì)變。過(guò)去幾年AI應(yīng)用主要停留在信息處理層面。OpenClaw標(biāo)志著AI進(jìn)入了”任務(wù)執(zhí)行”階段:7×24小時(shí)后臺(tái)運(yùn)行,通過(guò)消息平臺(tái)遠(yuǎn)程控制,自主完成跨應(yīng)用、跨平臺(tái)的綜合任務(wù)。未來(lái)的AI助手將在主動(dòng)性(主動(dòng)發(fā)現(xiàn)問(wèn)題并提醒)、持續(xù)性(長(zhǎng)期記憶和行為一致性)和自主性(目標(biāo)驅(qū)動(dòng)的自主規(guī)劃執(zhí)行)上實(shí)現(xiàn)新的突破。
二是從”單一Agent”到”多智能體協(xié)同”的架構(gòu)演進(jìn)。值得注意的是,OpenClaw已經(jīng)支持多Agent架構(gòu)。一個(gè)Gateway管理多個(gè)獨(dú)立Agent,各自擁有獨(dú)立身份、記憶和工具,Agent之間可以互相通信協(xié)作。但當(dāng)前的多Agent協(xié)同更多停留在”同質(zhì)Agent的任務(wù)分發(fā)”層面。更深遠(yuǎn)的趨勢(shì)是”異構(gòu)Agent的專業(yè)化協(xié)同”:不同Agent在特定領(lǐng)域深度優(yōu)化,協(xié)同完成復(fù)雜任務(wù)。就像一個(gè)公司不是找一個(gè)”全能員工”,而是組建專業(yè)團(tuán)隊(duì)。
我們的實(shí)踐表明,基于明略科技DeepMiner平臺(tái)構(gòu)建面向企業(yè)場(chǎng)景的多智能體協(xié)同架構(gòu),每個(gè)Agent針對(duì)特定業(yè)務(wù)領(lǐng)域深度優(yōu)化,多Agent協(xié)同能夠產(chǎn)生超越個(gè)體的涌現(xiàn)能力。這種架構(gòu)的優(yōu)勢(shì)在于:專業(yè)Agent協(xié)同能力超越單一通用模型、不同任務(wù)匹配不同規(guī)模的模型使成本更可控、某個(gè)Agent失效不影響整個(gè)系統(tǒng)的穩(wěn)定性。
三是從”流程編排”到”智能涌現(xiàn)”的范式轉(zhuǎn)變。傳統(tǒng)的企業(yè)自動(dòng)化工具(如RPA)基于預(yù)設(shè)的固定流程執(zhí)行任務(wù),AI Agent則代表了一種全新范式,給定目標(biāo)和工具,AI自主規(guī)劃執(zhí)行路徑,其優(yōu)勢(shì)在于靈活性更強(qiáng)、可擴(kuò)展性更好,且具備進(jìn)化能力。
四是從”工具”到”同事”的人機(jī)關(guān)系重構(gòu)。OpenClaw的Workspace設(shè)計(jì)已經(jīng)展現(xiàn)了這種趨勢(shì)的雛形,AI有自己的人設(shè)、記憶、身份和行為規(guī)范,它不再是一個(gè)無(wú)狀態(tài)的工具,而更像一個(gè)有記憶、有個(gè)性的數(shù)字同事。這種轉(zhuǎn)變將深刻改變企業(yè)的組織形態(tài)和工作方式。
面對(duì)這些趨勢(shì),企業(yè)的務(wù)實(shí)策略是:一、邊試點(diǎn)邊學(xué)習(xí),而不是等待完美方案;二、投資于能力建設(shè)而非特定工具;三、關(guān)注架構(gòu)靈活性而非功能堆疊;四、建立進(jìn)化機(jī)制,讓AI系統(tǒng)在使用中不斷沉淀知識(shí)、提升能力。
OpenClaw的出現(xiàn)標(biāo)志著AI應(yīng)用進(jìn)入了新階段,但這只是開(kāi)始,真正的變革還在后面,企業(yè)需要在保持理性的同時(shí)積極擁抱變化。
AI Agent時(shí)代已經(jīng)來(lái)臨,企業(yè)需要的不僅是”能干活的AI”,更是”可信賴、可管控、可持續(xù)”的智能化解決方案。
明略科技(2718.HK)深耕AI領(lǐng)域二十年,在企業(yè)級(jí)大模型、智能體方向持續(xù)投入,多模態(tài)大模型、GUI智能體大模型技術(shù)居于全球領(lǐng)先地位,致力于打造真正適合中國(guó)企業(yè)的AI產(chǎn)品服務(wù)。
]]>