
GUI Agent 賽道正在加速成熟。Google 在 2024 年底推出 Project Mariner 內測,字節跳動在 2025 年初開源 UI-TARS 并迅速登上 GitHub 熱榜,Anthropic 的 Computer Use 持續迭代升級。幾乎所有模型廠商都在押注同一件事:讓 AI 從“陪你聊天”進化為“替你干活”。
但在這場競賽中,一個根本性矛盾正在浮出水面——而大多數報道都選擇性忽略了它。
這個矛盾是:用戶最想要的“主動幫忙”,恰恰是云端AI最給不起的東西。
想象兩種 AI 助手:
被動型(Reactive):你問它問題,它回答;你給它任務,它執行。你不說話,它就安靜等著。ChatGPT、Claude、豆包——所有你正在用的 AI 產品,都是這種模式。
主動型(Proactive):它自己發現你的日歷上 30 分鐘后有個重要會議,自動幫你拉出相關文件和上次的會議紀要;它注意到你的郵箱收到了一封客戶投訴,自動起草回復模板;它在后臺持續監控你關注的競品動態,有重大變化就提醒你。
用戶調研的答案很一致:80% 以上的企業用戶表示,他們需要的不是一個更聰明的聊天框,而是一個能主動幫忙的數字助理。
但這種主動性,恰恰是云端 AI 的經濟模型所無法支撐的。
為什么云端 AI 不可能真正主動?答案是一道簡單的算術題。
云端 AI 的成本結構:按調用收費。 無論是 OpenAI 的 GPT-4o、Anthropic 的 Claude,還是國內的大模型 API,定價邏輯都是按 token 計費——你每發一條消息、每上傳一張截圖、每讓它執行一次操作,平臺都在消耗算力,都在產生成本。
被動模式下,用戶一天可能調用 AI 幾十次。平臺的收費能覆蓋成本,甚至有利潤。
主動模式下,AI 需要持續運行:
粗略估算:一個主動型 AI 助手一天的調用量,是被動型的 20-50 倍。
更關鍵的是:這道數學題決定了云端平臺的產品策略。平臺不可能鼓勵用戶開啟高頻主動模式——越主動,平臺越虧。所以你會看到:
這不僅是技術限制,更是經濟模型的必然結果。
端側模型從根本上改變了這道經濟題的變量。
AI 跑在你自己的設備上,用的是你自己的芯片和電。 它主動檢查郵箱一萬次,也不花平臺一分錢。主動性不再是成本負擔,而是設備的固有能力——就像你的手機鬧鐘不需要為每次響鈴付費一樣。
這個架構變化帶來三個根本性的優勢:
端側 AI 可以真正做到 7×24 小時在后臺運行,持續感知、判斷、行動。不受平臺計費限制,不用擔心 token 消耗。你的 AI 助手終于可以像一個真正的助理一樣工作——主動發現問題、主動提醒你、主動幫你處理日常事務。
所有的感知和推理都在本地完成。AI 檢查你的郵箱?郵箱內容不出設備。AI 掃描你的文件?文件不出設備。AI 截取屏幕來理解界面?截圖不出設備。
這不是“加了一層加密”的安全,而是架構層面消除了數據外泄的可能性。對于金融、醫療、法律、政務等行業,這種架構級安全是合規的前提條件。
本地推理沒有網絡往返延遲。AI 發現異常→判斷→行動的整個鏈條在毫秒級完成。對于需要快速響應的場景(如交易監控、安全告警、實時質檢),這種延遲優勢是云端方案無法企及的。
很多人對端側模型的第一反應是:“小模型能行嗎?性能夠用嗎?”
這個懷疑在一年前是合理的。但2026年的端側模型已經用實測數據推翻了這個假設。
以端側 GUI 智能體為例。明略科技在4月13日發布的Mano-P 在 OSWorld 基準測試中以 58.2% 的成功率拿下專用模型全球第一,領先第二名(OpenCUA-72B,45.0%)超過 13 個百分點。其 4B 蒸餾版通過 GSPruning 視覺 Token 剪枝和 w4a16 混合精度量化,在 Apple M4 Pro 上實測:

專用模型 vs 通用模型的邏輯: 72B 蒸餾為 4B,不是簡單地“把模型變小”,而是把 72B 在 GUI 操作領域積累的專業知識,濃縮進一個更小的模型。就像一個在心臟外科領域做了 20 年的專家,診斷心臟問題的能力并不亞于一個什么都懂的全科醫生。因此,端側模型不等于弱模型。經過專項訓練和優化的專用模型,在特定任務上完全可以達到甚至超越通用大模型的水平。

從“云端越主動越虧”這個底層邏輯出發,可以推導出三個必然趨勢:
隨著 AI 從“聊天工具”進化為“工作助手”,主動性的需求會持續增長。云端的經濟模型無法支撐高頻主動調用,端側將成為真正可用的 AI 助手的基礎架構。微軟、蘋果、高通都在芯片層面布局 AI 推理能力——行業趨勢已經明確。
蘋果 M 系列芯片已經證明了消費級設備運行大模型的可行性。未來的芯片設計會進一步優化 AI 推理能力,端側可運行的模型規模會持續增大。
《數據安全法》《個人信息保護法》在國內的落地,GDPR 在歐盟的嚴格執行,加上各行業監管對 AI 使用的細化要求——越來越多的企業會發現:與其花費巨額合規成本確保云端數據安全,不如從架構上選擇數據不出設備的端側方案。
總結一下核心推理鏈:
1. 真正有用的 AI 助手必須是主動的(Proactive)
2. 主動意味著高頻運算——在云端,越主動越虧
3. 平臺的經濟模型決定了云端 AI 不可能真正主動
4. 端側模型跑在用戶設備上,主動性零邊際成本
5. 因此,端側是 AI 從“聊天工具”進化為“工作助手”的唯一可行架構
2026 年,AI 賽道最大的分水嶺不是“誰的模型更大”,而是“誰的 AI 真正能主動幫用戶干活”。而答案已經很清楚:能真正主動的 AI,只能跑在用戶自己的設備上。
Mano-P 是明略科技開源的端側 GUI 智能體,專為解決這個問題而生。72B 旗艦模型在 OSWorld 專用模型榜全球第一(58.2%),蒸餾為 4B 版本后可在 Apple M4 芯片 + 32GB 內存的 Mac 上流暢運行——預填充 476 tokens/s、峰值內存僅 4.3GB。完全本地推理,數據零上傳,7×24 小時主動運行零邊際成本。采用 Apache 2.0 開源協議,企業可自由使用和商用。
立即體驗:`brew install mano-cua`
技術論文:arXiv:2509.17336
GitHub:github.com/Mininglamp-AI/Mano-P
Mano-P 是一個開源的 GUI-VLA(Vision-Language-Action)智能體,設計用于在蘋果芯片邊緣設備上本地運行。它使用純視覺理解來跨平臺自動化桌面 GUI 操作。Mano 是西班牙語里”手”的意思,P 有兩重含義:Person(個體)與 Party(組織)——我們相信,無論個人還是企業,都能夠創造屬于自己的個性化 AI。核心理念:AI for Personal = 隱私 + 個性化。
| 對比維度 | Mano-P | Claude Computer Use |
| OSWorld(全部模型) | 58.2%(專用模型第一,全部模型前五) | 全部模型第一(千億參數級通用大模型) |
| WebRetriever Protocol I | 41.7 NavEval(領先) | 31.3(Claude 4.5) |
| 數據流向 | 完全本地,截圖不出設備 | 需上傳到云端 API |
| 離線運行 | ? 支持 | ? 不支持 |
| 主動性 | ? 7×24 無限制運行 | ?? 受平臺算力成本限制 |
| 開源 | ? Apache 2.0 協議 | ? 閉源 |
Mano-P 在專用模型中排名全球第一,在網頁檢索等任務上領先 Claude,且天然滿足數據安全要求。適合高安全需求場景。
可以! 在本地模式下,所有模型推理都在 Apple M4 設備上運行。? 不會向外部服務器發送任何截圖或任務描述。
最低要求:Mac mini 或 MacBook;Apple M4 芯片;32GB 內存
替代方案:任何 Mac + Mano-P 算力棒(通過 USB 4.0+ 連接)
我們計劃在未來支持更多設備。
了解更多:[GitHub – Mininglamp-AI/Mano-P] (https://github.com/Mininglamp-AI/Mano-P)
聯系我們:model@mininglamp.com
]]>一個新賽道正在以肉眼可見的速度成型:GUI 智能體——不是和你聊天的 AI,而是替你干活的 AI。
但一個被大多數報道忽略的問題是:當 AI 在幫你操作電腦時,你的屏幕截圖正在被上傳到云端。Anthropic 自己在官方文檔中警告:“當 Computer Use 激活時,Claude 能看到屏幕上顯示的一切,包括個人數據、敏感文檔或私人信息。”他們甚至建議用戶在虛擬機或容器中運行這項功能。
這不是一個小問題——對于處理客戶數據、財務信息、法律文件的企業來說,這可能是一個根本性的架構選擇問題。
有沒有一種 GUI 智能體,能像 Claude 一樣強大,但數據完全不出設備?
明略科技 Mano-P 已經給出了答案:圍繞隱私與個性化兩大支柱,72B 模型屠榜證明實力,4B 蒸餾版上機證明可用——在 OSWorld 專用模型榜以 58.2% 成功率拿下全球第一,領先第二名超過 13 個百分點,而這一切完全在你自己的 Mac 上本地運行。

過去兩年,大模型的能力主要體現在“說”——寫文章、回答問題、生成代碼。但企業真正需要的不是一個能說會道的聊天機器人,而是一個能真正干活的數字員工。
GUI 智能體(GUI Agent)就是這一步的關鍵跨越。它的核心能力是:通過理解圖形用戶界面(GUI),像人類一樣操作電腦完成任務。你告訴它“幫我在 CRM 系統里錄入今天的客戶拜訪記錄”,它就真的打開 CRM、找到對應字段、填寫內容、點擊保存——全程不需要你動手。
這和傳統的 RPA(機器人流程自動化)有本質區別:
RPA 依賴系統 API 和預設規則,界面一改版就得重配,維護成本高,靈活性差。
GUI 智能體 基于視覺理解,像人一樣“看”屏幕、“理解”界面、“決定”下一步操作。界面改了?它能自適應,因為它理解的是語義,不是像素坐標。
這個差異意味著什么?意味著 GUI 智能體可以操作任何人類能操作的軟件——不管是現代 SaaS 工具、老舊的 ERP 系統,還是只有圖形界面沒有 API 的專業軟件。它解鎖的不是某一個系統的自動化,而是通用的桌面自動化能力。
截至目前,GUI 智能體賽道的主流方案幾乎都走了同一條路:依賴云端大模型推理。底層邏輯都是“截屏→上傳云端→模型推理→返回操作指令”。
這條路有兩個根本性的問題:
第一個問題是數據安全。你的每一張屏幕截圖都在云端服務器上走了一遭。對于個人用戶操作瀏覽器這種場景,這或許可以接受。但當企業把 GUI 智能體用在審查合同、處理財務報表、錄入客戶數據等核心業務時,合規團隊會問:“這些截圖存在哪里?誰能看到?保留多久?”
第二個問題更根本:云端 AI 不可能真正“主動”幫你。 真正有用的 AI 助手應該是主動的——自己發現你有個會議快開了,自動幫你準備資料;看到重要郵件,自動提醒你。但這種主動性意味著 AI 要不停地自發運算。在云端,每一次運算都消耗平臺的算力和費用——AI 越主動,平臺越虧錢。所以云端平臺必然限制 AI 的主動性,這就是為什么你用 ChatGPT 從來不會看到它主動找你。
端側模型從根本上解決了這兩個問題:AI 跑在你自己的設備上,用的是你自己的芯片和電——它主動運行一萬次也不花平臺一分錢;同時數據一步都不出你的設備。
這就引出了一個關鍵問題:有沒有一種端側方案,性能也能達到頂級?
在上述格局中,明略科技近期開源的的 Mano-P 占據了一個獨特的位置:專用模型性能第一 + 端側本地運行。

| 基準測試 | Mano-P 成績 | 排名 | 說明 |
| OSWorld(專用模型) | 58.2% 成功率 | 全球第一 | 領先第二名(OpenCUA-72b, 45.0%)13.2個百分點 |
| OSWorld(全部模型) | 58.2% 成功率 | 前五 | 前四均為千億參數級通用大模型 |
| WebRetriever Protocol I | 41.7 NavEval | 全球第一 | 超越Gemini 2.5 Pro CU(40.9)和Claude 4.5 CU(31.3) |
| ScreenSpot-V2 | 93.5 | 領先 | GUI Grounding視覺定位 |
| MMBench | 87.5 | 領先 | 感知認知 |
| UI-Vision | 46.6 | 領先 | UI視覺理解 |
| OS-World-G | 69.5 | 領先 | OSWorld視覺定位子任務 |
| 端側推理(4B量化,M4 Pro) | 476 tokens/s預填充,76 tokens/s解碼 | — | 峰值內存僅4.356GB |
72B 模型屠榜證明技術實力,蒸餾為 4B 上機證明日常可用。對于Mano-P來說,能力和便捷不是二選一。經過專項訓練和優化的專用模型,完全可以在特定任務上達到甚至超越通用大模型的水平。端側模型不等于弱模型。

Mano-P 的本地模式不是在已有的云端架構上“加了一層加密”,而是從架構層面消除了數據外泄的可能性:
| 安全維度 | Mano-P 端側方案 | 典型云端方案 |
| 數據流向 | 所有推理在本地完成,截圖不出設備 | 截圖上傳到云端服務器處理 |
| 離線能力 | 支持完全離線運行,無需聯網 | 必須聯網才能使用 |
| 主動性 | 7×24 不間斷運行,無成本限制 | 平臺限制主動頻率,越主動越貴 |
| 代碼審計 | 完整源代碼開源,企業可自行審查 | 閉源黑盒,依賴服務商承諾 |
| 合規適配 | 天然滿足數據本地化要求 | 需額外合規評估和協議 |
對于金融機構審查合同、醫療機構處理病歷、政務系統錄入公民信息等場景,這種“架構級安全”不是加分項,而是準入門檻。
在一臺 Mac 上運行大參數模型做 GUI 操作,聽起來不太現實。Mano-P 靠三項核心技術解決了這個問題:
Mano-P 提供了三種使用形式,覆蓋從開發者到普通用戶的不同需求:
| 使用形式 | 適合誰 | 安裝方式 | 特點 |
| 命令行工具(mano-cua) | 開發者、高級用戶 | `brew install mano-cua` | 終端直接運行任務 |
| Python SDK(mano-client) | Python 開發者 | `pip install mano-client`(開發中) | 集成到現有項目,支持異步調用 |
| AI Agent Skill(mano-skill) | AI Agent 平臺用戶 | OpenClaw 插件安裝 | Agent 編排 + GUI 執行無縫銜接 |
其中 mano-skill 最值得關注。作為 OpenClaw 等 AI Agent 平臺的技能插件,Mano-P 賦予了 Agent “看屏幕、動鼠標”的能力。OpenClaw 是大腦,Mano-P 是雙手——全鏈路開源,全程端側運行,數據一步不出你的設備。
舉個例子:你在 OpenClaw 中對 Agent 說“幫我把這份報告的數據錄入到公司的 ERP 系統里”,Agent 自動規劃任務步驟,需要操作界面時調用 mano-skill,Mano-P 接管屏幕操作——整個過程在本地完成,Agent 編排和 GUI 執行無縫銜接。
運行時,屏幕右上角會顯示一個狀態面板,實時顯示任務進度,用戶可以隨時暫停或停止。每一步操作執行前,敏感或潛在危險的操作會要求用戶確認——AI 干活,人類監督。
GUI 智能體賽道正處于從“技術驗證”到“規模落地”的關鍵轉折點。
從技術趨勢看,兩個方向正在同步發展:一是通用大模型持續提升 GUI 操作能力,二是專用端側模型通過精巧的訓練和優化方法,在更小的參數規模上逼近甚至超越通用模型的任務表現。Mano-P 已經用實測數據證明了后一條路線的可行性——而這條路線天然兼容數據安全和合規要求。
Mano-P 代表的端側路線給出了一個清晰的回答:AI 最強大的能力,應該跑在每個人自己的設備上。 開源、本地、可審計——AI 最強大的能力,應該跑在每個人自己的設備上。這不是一句口號,而是一個正在被實現的技術路線。
| 階段 | 開放內容 | 目標用戶 | 狀態 |
| Phase 1(當前) | 開源 CUA Skills——GUI 操作的技能庫 | Agent愛好者,OpenClaw/Claude Code用戶 | 已發布 |
| Phase 2 | 開源本地模型 + Python SDK——完整的端側推理能力 | 高安全需求開發者,本地部署 | 即將開放 |
| Phase 3 | 開源訓練方法 + 剪枝量化技術 | 研究人員、模型訓練者 | 規劃中 |
立即體驗:`brew install mano-cua`

Mano-P 是一個開源的 GUI-VLA(Vision-Language-Action)智能體,設計用于在蘋果芯片邊緣設備上本地運行。它使用純視覺理解來跨平臺自動化桌面 GUI 操作。Mano 是西班牙語里”手”的意思,P 有兩重含義:Person(個體)與 Party(組織)——我們相信,無論個人還是企業,都能夠創造屬于自己的個性化 AI。核心理念:AI for Personal = 隱私 + 個性化。
| 對比維度 | Mano-P | Claude Computer Use |
| OSWorld(全部模型) | 58.2%(專用模型第一,全部模型前五) | 全部模型第一(千億參數級通用大模型) |
| WebRetriever Protocol I | 41.7 NavEval(領先) | 31.3(Claude 4.5) |
| 數據流向 | 完全本地,截圖不出設備 | 需上傳到云端 API |
| 離線運行 | ? 支持 | ? 不支持 |
| 主動性 | ? 7×24 無限制運行 | ?? 受平臺算力成本限制 |
| 開源 | ? Apache 2.0 協議 | ? 閉源 |
Mano-P 在專用模型中排名全球第一,在網頁檢索等任務上領先 Claude,且天然滿足數據安全要求。適合高安全需求場景。
可以! 在本地模式下,所有模型推理都在 Apple M4 設備上運行。? 不會向外部服務器發送任何截圖或任務描述。
最低要求:Mac mini 或 MacBook;Apple M4 芯片;32GB 內存
替代方案:任何 Mac + Mano-P 算力棒(通過 USB 4.0+ 連接)
我們計劃在未來支持更多設備。
了解更多:[GitHub – Mininglamp-AI/Mano-P] (https://github.com/Mininglamp-AI/Mano-P)
聯系我們:model@mininglamp.com
]]>
Mano-P 是明略科技推出的開源 GUI 智能體項目。Mano 是西班牙語里“手”的意思,P 有兩重含義:Person(個體)與 Party(組織)——我們相信,無論個人還是企業,都能夠創造屬于自己的個性化 AI。其三階段開源計劃正在逐步釋放完整的技術棧:Phase 1 開源 CUA Skills,Phase 2 開源本地模型 + Python SDK,Phase 3 開源訓練方法 + 剪枝量化技術。
一句話概括:Mano-P 是一雙 AI 的手,能像人類一樣看屏幕、理解界面、操作電腦,而且完全跑在你自己的設備上。

和傳統 RPA(機器人流程自動化)相比,Mano-P 有本質區別:
| 維度 | 傳統 RPA | Mano-P |
| 工作方式 | 依賴 API 和預設規則 | 純視覺理解,像人一樣“看”界面 |
| 界面變化 | 界面改版需重新配置 | 自適應,理解語義而非像素坐標 |
| 覆蓋范圍 | 僅支持有 API 的系統 | 能操作任何人類可操作的軟件 |
| 遺留系統 | 無法處理老舊系統 | 通過視覺交互,無需 API 接口 |
| 部署方式 | 通常需要服務器 | 本地設備即可運行 |
Mano-P 不是一個概念產品——它的能力經過了權威基準測試的嚴格驗證。
| 基準測試 | Mano-P 成績 | 排名 | 說明 |
| OSWorld(專用模型) | 58.2% | 全球第一 | 領先第二名 OpenCUA-72b(45.0%)13.2 個百分點 |
| OSWorld(全部模型) | 58.2% | 第五 | 前四均為千億參數級通用大模型 |
| WebRetriever Protocol I | 41.7 NavEval | 全球第一 | 超越 Gemini 2.5 Pro(40.9)和 Claude 4.5 CU(31.3) |
| ScreenSpot-V2 | 93.5 | SOTA | GUI 元素定位精度 |
| MMBench | 87.5 | SOTA | 多模態理解綜合評測 |
| UI-Vision | 46.6 | SOTA | UI 視覺理解 |
| OS-World-G | 69.5 | SOTA | GUI Grounding 定位能力 |
| 端側推理(4B, M4 Pro) | 476 tokens/s 預填充 | — | 峰值內存 4.3GB,解碼 76 tokens/s |
一句話總結:72B 模型屠榜證明技術實力,蒸餾為 4B 上機證明日常可用。對于Mano-P來說,能力和便捷不是二選一。 經過專項訓練和優化的專用模型,在特定任務上完全可以比“大塊頭”更強。端側模型不等于弱模型。

在消費級設備上運行大參數模型做 GUI 操作,靠的是三項關鍵技術突破。
處理高分辨率屏幕截圖時,Mano-P 智能識別關鍵信息——保留界面結構骨架和重要 UI 元素,將視覺 Token 壓縮至 12.57%。打個比方:看一張復雜的屏幕截圖,普通模型會逐像素地“讀”完整張圖,而 Mano-P 只看最重要的 13%——按鈕在哪、輸入框在哪、當前選中了什么。推理速度提升數倍,任務成功率幾乎不受影響。
用更緊湊的方式存儲模型——權重用 4bit 存儲,激活值保留 16bit。效果:
傳統模型只做單向學習——你告訴它“點擊登錄按鈕”,它學會去找登錄按鈕。Mano-P 同時訓練兩個方向:“描述→定位”和“定位→描述”,通過循環一致性互相驗證——既能根據指令找到按鈕,也能看到按鈕說出它是什么。配合三階段漸進訓練(SFT → 離線 RL → 在線 RL),模型從“背操作手冊”進化到“真正學會操作界面”。
大多數人以為端側模型的核心賣點是“數據安全”。這沒錯,但更根本的原因是:云端 AI 不可能真正“主動”幫你。
真正有用的 AI 助手應該是主動的——自己發現你有個會議快開了,自動幫你準備資料;看到你收到一封重要郵件,自動提醒你;發現常用的系統數據有異常,主動去核查。但這種“主動性”意味著 AI 要不停地自發運算——每隔幾分鐘檢查一次郵箱、日歷、文件。
在云端,每一次運算都消耗平臺的算力和費用。一個用戶一天可能產生上千次自發調用,乘以幾百萬用戶,服務器費用爆炸。所以云端平臺必然限制 AI 的主動性——不讓它太頻繁地自己動,因為每“主動”一次就是在燒平臺的錢。
端側模型從根本上解決了這個問題:AI 跑在你自己的設備上,用的是你自己的芯片和電。 它主動跑一萬次也不花平臺一分錢。這才是真正 7×24 貼身 AI 助手的唯一解。
Mano-P 提供本地模式和云端模式兩種推理方式。核心差異在于數據流向:
| 安全維度 | 本地模式 | 云端模式 |
| 推理位置 | Mac 本地 / 算力棒 | mano.mininglamp.com |
| 截圖數據 | ? 不出設備 | ?? 發送到云端分析 |
| 離線能力 | ? 完全離線可用 | ? 需要聯網 |
| 主動性 | ? 7×24 無限制運行 | ?? 受平臺成本限制 |
| 適用場景 | 高安全要求(金融/醫療/政務) | 一般場景 |
| 代碼審計 | ? 完整開源 | ? 完整開源 |
系統自動檢測本地模型配置:有本地模型用本地,沒有就自動切換云端,無縫銜接。對于金融、醫療、法律、政務等對數據安全有剛性要求的行業,本地模式不是可選項——是唯一選項。
| 使用形式 | 適合誰 | 安裝方式 | 特點 |
| mano-cua(命令行) | 開發者、高級用戶 | brew install mano-cua | 終端直接運行任務 |
| mano-client(Python SDK) | Python 開發者 | pip install mano-client(開發中) | 集成到現有項目,支持異步調用 |
| mano-skill(Agent 技能插件) | AI Agent 平臺用戶 | OpenClaw 插件安裝 | Agent 編排 + GUI 執行無縫銜接 |
運行時,屏幕右上角顯示狀態面板,實時顯示任務進度。敏感操作執行前會要求用戶確認——AI 干活,人類監督。
Mano-P 已經在多個場景中完成驗證:
場景 1:全自動化應用構建(Mano-afk)
系統接收自然語言需求后,自動完成需求澄清 → 技術架構設計 → 代碼生成 → 本地部署 → 多層測試(API 測試 + 視覺檢測 + 端到端 GUI 自動化測試)。測試不通過時自動定位根因、修復代碼、重新部署。全流程無需人工干預。
場景 2:商業視頻智能系統
從下發指令到視頻生成、上傳、分析、剪輯、二次評測的完整工作流。系統自主操作網頁與剪輯軟件,完成文件處理、字幕修改等精細操作,生成包含主客觀指標的分析報告。
場景 3:企業級長任務執行
支持 100+ 步驟的企業級業務流程自動化,包括跨應用數據錄入、系統間信息遷移、批量文檔處理等復雜任務,全程無需聯網。
Mano-P 采用 Apache 2.0 開源協議——寬松且附帶專利保護的開源協議,任何人和企業都可以自由使用、修改和商用,無傳染性限制,且自動授予專利許可——企業用了不會被專利訴訟。對投資人來說,這意味著生態壁壘不靠法律鎖定,而靠技術領先和社區信任。
分三個階段漸進開放完整技術棧。其三階段開源計劃正在逐步釋放完整的技術棧:
| 階段 | 開放內容 | 說明 | 狀態 |
| Phase 1(當前) | CUA Skills | GUI 操作的技能庫 | 已開源 |
| Phase 2 | 本地模型 + Python SDK | 完整的端側推理能力 | 即將開放 |
| Phase 3 | 訓練方法 + 剪枝量化技術 | 讓更多團隊訓練自己的端側模型 | 規劃中 |
技術論文已發布:arXiv:2509.17336 (https://arxiv.org/abs/2509.17336)
立即體驗:`brew install mano-cua`

Mano-P 是明略科技開源的 GUI-VLA(Vision-Language-Action)智能體,設計用于在蘋果芯片邊緣設備上本地運行。它使用純視覺理解來跨平臺自動化桌面 GUI 操作。P 代表 Person(個體)與 Party(組織)——無論個人還是企業,都能夠創造屬于自己的個性化 AI。
可以! 在本地模式下,所有模型推理都在 Apple M4 設備上運行。? 不會向外部服務器發送任何截圖或任務描述。
| 對比維度 | Mano-P | Claude Computer Use |
| OSWorld | 58.2%(專用模型第一,全模型前五) | 全部模型第一(千億參數級) |
| WebRetriever | 41.7 NavEval(領先) | 31.3(Claude 4.5) |
| 數據流向 | 完全本地,截圖不出設備 | 需上傳到云端 API |
| 離線運行 | ? 支持 | ? 不支持 |
| 主動性 | ? 7×24 無限制運行 | ?? 受平臺算力成本限制 |
| 開源 | ? Apache 2.0 | ? 閉源 |
Mano-P 在專用模型中排名全球第一,在網頁檢索等任務上領先 Claude,且天然滿足數據安全要求。適合高安全需求場景和需要 AI 主動服務的場景。
更多詳情請登錄GitHub了解
GitHub:[github.com/Mininglamp-AI/Mano-P] (https://github.com/Mininglamp-AI/Mano-P)
聯系我們:model@mininglamp.com
]]>在財務表現與經營質量持續向好的同時,明略科技已全面邁入 AI 原生運營時代。AI 正加速從輔助工具轉變為嵌入真實業務流的關鍵生產力,推動公司從“提供數據智能”進一步走向“交付可量化結果”。其中,Agentic Services(智能體化服務)業務模式已完成從能力驗證到商業化落地的關鍵突破,成為明略科技推動 AI 商業化演進的重要標志。
明略科技創始人、CEO 兼 CTO 吳明輝表示:“2025 年,明略科技完成了一次關鍵轉型——從幫助客戶‘看懂數據’,到幫助客戶‘拿到結果’。Agentic Services 的意義,正是在于推動 AI 的價值從工具交付走向結果交付。這不僅改變了客戶采購專業服務的邏輯,也正在重塑服務方式與商業模式,為明略未來打開更大的增長空間。”
2025 財年,明略科技繼續以 Data Intelligence(數據智能)為基礎盤,以 Agentic AI 為核心驅動力,推動業務結構持續優化。公司目前已賦能約 2,100 家知名品牌客戶以及逾 24 萬家企業用戶,持續幫助客戶優化決策、提升運營效率。報告期內,公司大客戶續約率達到 96%,核心客戶群保持穩定,整體業務展現出較強的韌性與黏性。
依托自研企業級可信商業智能體平臺 DeepMiner,公司已將 AI 系統性嵌入主要業務線,推動交付邏輯加速向“Agent 驅動”轉變,并在多個核心場景中取得明確成效,實現Data Intelligence業務板塊的運營效率提升,其中營銷智能業務交付提效最高可達4倍,營運智能業務實現單工單解決時間壓縮超過30%。
報告期內,秒針系統全面推進工作流的 Agentic AI 改造,歷時 60 天實現全鏈路貫通,系統性解決了社媒數據處理與AI應用的融合難題。在保留必要人機協作的前提下,全鏈路AI自動完成率達90%,深度復盤報告產出工作實現了 20 倍的人效提升,系統輸出在洞察穩定性、框架完整性、深層洞察能力及微趨勢識別新穎性等方面也均有顯著提升。
AI 正在從輔助工具逐步演進為業務流中的關鍵生產力,驅動公司從傳統人力主導的交付模式,邁向更高效率、更強復用能力的智能化運營體系。
基于長期沉淀的海量營銷數據、客戶場景理解及行業 Know-how,明略科技前瞻性布局 Agentic Services 模式,并正推動其加速落地。報告期內,公司Agentic Services 業務收入超過 1 億元。作為公司 AI 商業化的重要方向,Agentic Services 不再停留于工具輸出或單點能力交付,而是進一步面向客戶可量化的業務目標,提供更貼近結果的端到端服務。
報告期內,公司新增大客戶中超過 30% 來自 Agentic Services 業務板塊,表明這一模式已在多個行業的復雜需求中展現出較強的商業適配性和現實吸引力。圍繞營銷場景,明略科技已打通從數據洞察、內容生產與分發到營銷投放的端到端業務流,以近 3 倍的運營效率幫助客戶實現平均 20% 的營銷效果增長。
無論是核心業務效率提升,還是 Agentic Services 模式的加速落地,都離不開底層技術體系的持續支撐。作為明略科技自主研發的企業級可信 AI 智能體平臺,DeepMiner 已成為連接公司各項業務能力的統一基礎設施,并持續支撐業務從單點提效走向系統級協同。
DeepMiner 采用“調度—決策—執行”的多智能體分層協作架構,能夠在復雜商業場景中實現從理解任務、規劃路徑到執行落地的全鏈條協同。截至 2025 年 10 月,公司自研 GUI 模型 Mano 在 OS-World 榜單位列總榜第二、Mind2Web 榜單第一;推理模型 Cito 則在 BFCL 小尺寸模型領域排名第一,以持續創新、領先行業的技術實力,進一步夯實了明略科技在可信 AI 賽道上的長期壁壘。
值得一提的是,明略科技已將 AI 深度融入組織運行的日常肌理。報告期內,公司實現全體員工 100% 接入 DeepMiner 平臺。員工可結合具體業務場景,自主創建并部署專屬業務 Agent,推動內部標準操作路徑從單向人力執行,逐步演進為人機協同編排。通過這一持續深入的內部實踐,DeepMiner 已逐步沉淀為支撐公司日常運轉的組織級基礎設施。
明略科技將堅定圍繞“可信”這一核心方向,持續推進業務縱深發展。一方面,公司將推進軟硬一體化部署,進一步筑牢 Agentic AI 基礎設施;另一方面,將加速 Agentic Services 模式在更多場景中的復制,持續拓寬其在內容營銷、文娛生態及更多數字白領工作領域的應用邊界,并向人力與專家密集型行業滲透。
圍繞系統割裂、流程斷點、數據孤島等現實痛點,公司將通過可信 AI 勞動力的規模化輸出,推動更多行業實現 Agent 化改造。
與此同時,明略科技也將持續對外輸出端到端 AI 調度能力,系統性拓展全球化業務版圖,構建多智能體協作平臺,探索人機協同生產力的新范式。
從提供工具到交付結果,從局部提效到 AI 原生運營,明略科技正在通過一個個真實的業務閉環,持續驗證可信 Agentic AI 的產業價值,并致力于將“結果可驗證、過程可審計、知識可沉淀”的確定性標準,逐步沉淀為產業 AI 原生交付的通用準則。沿著“讓 AI 真正走進業務、走向結果、走向規模化”的方向,明略科技將繼續堅定前行。

]]>問卷調查用了半個多世紀,邏輯清晰但有個致命bug:消費者喜歡的廣告和刷手機時真正會看完的,往往不是同一條。
諾貝爾經濟學獎得主丹尼爾·卡尼曼曾指出,人的大多數日常決策是由無意識的”系統 1″驅動的。
問卷調研本質上是用理性的”系統 2″回答”系統 1″;腦電和眼動測量則直接捕捉大腦對廣告的真實反應。問題是:問卷便宜但不夠準,腦電準但太貴。
直到我們找到了第三條路——用 AI 來”問大腦”。
AdEff 是明略科技(2718.HK)于2025年推出的 AI 驅動的全球化廣告創意測試及優化平臺。基于自研超圖多模態大語言模型(HMLLM)+過去10+年積累的10萬+次神經科學測量經驗和數據”研發。用戶上傳一條廣告視頻,最快 15 分鐘即可拿到一份完整的測試報告,涵蓋受眾注意力曲線、情感波動分析、關鍵時刻診斷等多維度分析以及具體優化建議。

聽上去很簡單?值得拆解的是底層。
AdEff 的核心技術底座是我們自主研發的 HMLLM(超圖多模態大語言模型,Hypergraph Multimodal Large Language Model)。這個名字里最關鍵的一個詞是“超圖”。
先說”圖”。在數學中,圖是描述關系的結構:兩個節點之間畫一條邊,表示它們有關聯。社交網絡就是典型的圖,你和每個朋友之間各連一條線。但普通圖有一個局限:每條邊只能連接兩個節點,只能表達”A 和 B 有關系”這種兩兩之間的簡單關聯。
“超圖”突破了這一限制。一條超邊可以同時連接任意多個節點,描述的是”A、B、C、D 同時出現時才會產生的高階關聯”。
為什么廣告測試需要超圖?因為一條廣告的效果從來不是單一元素決定的。
舉個例子:一條 15 秒的品牌廣告中,第 3 秒的畫面切換、背景音樂從舒緩變激昂、字幕上閃過一句”限時特惠”。這三個元素單獨來看都平平無奇,但它們在同一時刻疊加,可能恰好觸發了一次注意力峰值。這種多因素的協同效應,普通圖結構捕捉不到,但超圖可以。
HMLLM 正是通過超圖結構來建模視覺元素、EEG 腦電信號與眼動追蹤數據之間的復雜關系。模型不僅能”看”到廣告里有什么畫面、”聽”到了什么聲音,更能捕捉這些多模態信息同時出現時,人類大腦產生了怎樣的反應——注意力是否被吸引、情緒是否波動、品牌信息是否被編碼進記憶。
這項技術代表了全球范圍內首次嘗試讓機器系統性地理解人類觀看視頻時的主觀感受,我們的相關研究成果在全球頂級多媒體會議 ACM Multimedia(ACMMM)2024 上獲得最佳論文提名。

一個模型的預測能力,取決于它見過多少”真題”。
HMLLM 的訓練數據既不是通用互聯網語料,也不是人工標注的廣告質量分類集。它來自一個更稀缺、更有價值的數據源:大規模真人受眾的腦電與眼動測量數據。
在 AdEff 問世之前,我們用了超過十年的時間積累這些數據。把真人受試者請進實驗室,戴上 EEG 腦電帽、坐在眼動儀前,觀看不同的廣告素材,全程采集他們的神經信號和視覺注意力數據。然后把這些主觀反應數據與廣告素材的多模態特征一一配對,形成訓練集。迄今為止,這個數據集已經積累了超過 10 萬人次的真實測量數據,覆蓋了跨行業、跨品類、跨文化的廣告素材。
在此基礎上,我們構建并開源了兩個原創數據集:
? Video-SME:大規模視頻主觀多模態評估數據集,收集了不同人群在觀看相同視頻內容時的腦電波和眼動區域的真實變化,為視頻內容的主觀體驗量化提供了標準化基準。
? SPA-ADV:大規模廣告注視點預測數據集,專注于捕捉個體差異對視覺注意力的影響。
這也是 AdEff 最核心的壁壘所在:不僅有海量廣告素材,更有海量廣告素材所對應的真實人類神經反應數據,也是我們推動整個行業建立更科學的廣告效果評估標準所貢獻的綿薄之力。
用戶上傳一條廣告素材后,HMLLM 經歷四個核心步驟:
第一步,內容解碼。 將廣告素材拆解為結構化的多模態特征向量,如畫面構成、文案語義、品牌元素的出現時機與位置,每一幀都被充分解析。
第二步,反饋預測。基于超圖結構,將多模態特征映射到腦電和眼動空間,預測真實受眾的注意力分配模式、情緒反應曲線等信息,輸出注意力曲線和情感波動圖,并自動識別出關鍵時刻。
第三步,基準對標。將預測結果與創意數據庫中同品類、同媒介形式的歷史數據進行比對。同樣一個注意力得分,對快消品和汽車行業的含義完全不同,需要在正確的參照系下解讀。
第四步,診斷推理。基于明略科技自研大模型的多智能體協作架構,不同的 Agent 分別負責歸因分析、優化建議生成和可視化呈現。最終輸出的報告不僅能告訴用戶哪一秒注意力下降了,還會指出為什么下降以及如何改進,讓優化有據可依。
經科學驗證,89% 的 AdEff 預測得分與真人樣本測試結果具有強相關性,76% 的測評結論與行業專家判斷一致。在絕大多數場景下,AI 預測的可靠性已經足以支撐商業決策。
回到最初的問題:一條廣告好不好,到底該問消費者還是問他的大腦?
我們的答案是:用AI來問大腦。當 Seedance 2.0、Sora 們讓每條素材的生產成本趨近于零,判斷”哪條值得投”的能力,反而成了最昂貴的環節。創意不再稀缺,判斷力才是。
AdEff 正在做的事,是把原本只有大品牌才負擔得起的專業判斷力,通過 AI 交付給每一個需要它的人。讓每一條創意,都值得被科學地評價。
目前,AdEff 已服務快消、醫藥保健、美妝個護、3C、互聯網零售等多個行業客戶。
圍繞企業廣告視頻創意場景,明略科技可信商業智能體DeepMiner、零壹貳叁還可提供視頻內容洞察、AIGC創意視頻生成等全方位解決方案。
隨著香港加速建設國際創新科技中心,AI技術正成為深化內地與香港經貿合作的重要引擎。
今年1月,憑借企業級大模型與智能體技術能力與實踐經驗,明略科技(2718.HK)正式加入香港中國企業協會(簡稱”中企協會”),成為協會會員單位,為協會生態注入前沿AI技術能力。
據介紹,香港中國企業協會(“中企協會”)成立于1991年,以“貫徹一國兩制方針,促進香港繁榮穩定”為創會宗旨,是全體在港中資企業的代表,也是團結引領中資企業全面參與香港各項事務的工作平臺,在香港工商界及社會各界具有較高知名度和重要影響力。中企協會現有會員企業超過1300家,涉及金融、航運、商貿、創科等各個行業領域,為香港的經濟發展、社會穩定、文化繁榮、民生保供等,做出了重要貢獻。
近日,明略科技高級副總裁孫方超、香港總經理張曉及AIGC業務(零壹貳叁)合伙人兼高級副總裁周昊一行拜訪中企協會,與中企協會副總裁曾燊典、中企協會會員事務部總監任鈦石進行友好會談,并現場接受會員證書頒發。

會談中,明略科技團隊重點展示了AI領域的技術積累與創新能力。近年來,公司已構建起從多模態數據智能到Agentic AI的完整技術棧,依托專有大模型能力與深厚的行業數據知識,持續為企業打造Agentic AI時代的可信生產力,并在多個行業積累了豐富的落地經驗,能夠為在港中資企業提供多場景的智能化解決方案,幫助企業解決實際業務痛點。
中企協會領導對明略科技的加入表示熱烈歡迎,高度認可明略科技在AI技術創新與應用落地方面的成就,并期待未來與協會其他成員企業開展更多交流合作。
雙方一致認為,明略科技的AI技術能力與協會會員企業的多元化需求高度契合,未來可通過技術分享會、專題研討等形式展開務實合作,為協會內廣大中資企業提供先進的AI賦能服務,助力企業智能化升級。

明略科技于2025年進駐香港,作為香港第五批重點企業,同年成功登陸港交所,成為”全球Agentic AI第一股”。目前已在香港建立本地化團隊,持續拓展在港業務。
此次加入中企協會,是明略科技深化香港布局的又一重要舉措。借助中企協會覆蓋廣泛的會員網絡,明略科技將進一步拓展在港業務版圖,推動AI技術在更多場景落地,為內地與香港經貿技術交流合作注入新動能。
2026年3月15日,第十七屆中國產學研合作創新大會在北京會議中心隆重舉行。全國人大常委會原副委員長陳至立,全國政協原副主席、中國科協主席萬鋼等領導,以及教育部黨組成員、副部長徐青森,國家知識產權局黨組成員、副局長胡文輝等部委領導發表致辭。中國產學研合作促進會會長王建華主持會議。來自全國產學研界的千余位代表共聚一堂,圍繞“科技創新 產業創新 深度融合”主題展開深度交流。
大會隆重頒發2025年中國產學研合作促進會科技創新獎。明略科技(2718.HK)創始人、CEO兼CTO吳明輝 憑借在人工智能技術與產業深度融合方面的卓越貢獻,從眾多候選人中脫穎而出,榮獲“2025年中國產學研合作促進會科技創新獎——創新人物獎”,并作為獲獎代表登臺領獎。

中國產學研合作促進會科技創新獎,由中國產學研合作促進會發起,2008年獲科技部、國家科技獎勵工作辦公室正式批準,是我國產學研協同創新領域的最高榮譽獎。該獎項分設:創新人物獎、創新成果獎,評選層次高、標準嚴、公信力強,旨在表彰在推進產學研用協同創新和實現高水平科技自立自強工作中做出突出貢獻的科技工作者和重要科技成果,被公認為產學研界的“風向標”。
當前,全球科技競爭加劇,人才作為科技創新的第一資源,是破解“卡脖子”技術難題,實現高水平科技自立自強、培育新質生產力的核心動力。
為進一步激發產學研界科技人才創新活力、推動更多科技成果轉化為現實生產力,在科技部和國家獎勵辦的指導下,中國產學研合作促進會于2025年組織開展創新人物獎評審。
經過專家評審、公示、終審多輪嚴格篩選,明略科技創始人、CEO兼CTO吳明輝、宇樹科技CEO王興興、海爾集團CEO周云杰等優秀企業家,以及兩院院士、杰青、長江學者、萬人領軍等頂尖人才共同入選,集中展現我國科技創新與產業融合領域的硬實力。
大會現場,全國人大常委會原副委員長陳至立,全國政協原副主席、中國科協主席萬鋼,教育部黨組成員、副部長徐青森,國家知識產權局黨組成員、副局長胡文輝等領導為獲獎者頒獎。明略科技吳明輝作為創新人物獎獲獎代表登臺領獎。


作為明略科技的領航者,吳明輝此次獲獎源于他二十年來深耕產學研一線的堅守與創新。2006年,他在北大讀研期間創立秒針系統,打造中國首個互聯網用戶行為與營銷數據分析平臺,填補國內市場空白。此后,他帶領團隊完成多次技術創新:

吳明輝的創新實踐始終圍繞“技術落地”展開,推動明略科技將AI技術深度融入營銷智能與營運智能場景,迄今已服務135家財富世界500強企業,賦能2000+國內外頭部企業,20萬+中小企業,惠及零售、快消、汽車、3C、美妝、母嬰等行業客戶。
此次榮膺創新人物獎,既是中國產學研界對吳明輝多年來堅守創新初心、深耕產業落地的充分肯定,更是對明略科技產學研一體化發展模式的高度贊譽。
站在新的榮譽起點上,明略科技將在吳明輝的帶領下,繼續以科技創新為核心驅動力,深化產學研協同創新合作,加速關鍵核心技術攻關與成果轉化,借人工智能之力解決復雜的商業問題,為實現高水平科技自立自強、推動高質量發展貢獻更多“明略力量”。
當生產端的瓶頸被打破,新的行業痛點正在以更隱蔽、更劇烈的方式出現。越來越多的品牌市場負責人、增長操盤手、企業決策者,都在面對同一個現實困境:
創意產出越快,試錯壓力越大;素材變體越多,決策成本越高;制作成本越低,投放浪費越嚴重。AIGC解決了”做不出”的問題,卻讓”測不起”成為全行業共同的新挑戰。
一個品牌單日通過AI生成數十支創意視頻,團隊卻陷入無從選擇的迷茫。依靠人工經驗篩選,難免主觀片面;開啟小流量實測,周期長、成本高;等到數據回收完成,熱點窗口期已過,競品早已占據用戶心智。最終,大量預算消耗在“證明素材無效”的過程中,真正能夠穩定貢獻轉化的創意,依舊屈指可數。
隨著創意生產實現普惠,行業的下一個核心命題是:讓創意投放回歸科學。
企業真正需要的,不再只是“更多創意”,而是“更對的創意”;不再只是“更快產出”,而是“更準決策”。
能不能在投放之前,就快速知道這條創意行不行?
能不能不用燒錢測試,就能篩掉大概率跑不出來的素材?
能不能讓幾十上百條創意,有個高效、低成本、靠譜的篩選方式?
在你把視頻廣告預算花出去之前,先用低成本、高效率的方式,幫你把高潛力創意找出來,把無效消耗攔在前面。
AdEff?是明略科技(2718.HK)基于“自研超圖多模態大語言模型(HMLLM)+過去10+年積累的10萬+次神經科學測量經驗和數據”研發的全球化AI創意測試產品。【即刻注冊】

? 分鐘級創意效果測試:最快15分鐘完成廣告測試
? 秒級優化建議:根據受眾注意力曲線、情感波動等維度變化,提供視頻關鍵片段(如廣告黃金3秒、品牌時刻、用戶興趣時刻等)優劣勢分析及優化建議
? 最優創意篩選:支持多種采買模式,低成本測試多個創意(不同版本、不同內容),結合DeepMiner,分析不同創意優劣勢
為了驗證 AdEff 的商業實用性,2025年我們對其進行了樣本一致性與專家一致性測試。
通過對真人樣本廣告創意測試的平均分,以及 AdEff 廣告創意預測得分進行回歸分析,89% 的 AdEff 的預測得分與真人樣本測試得分具有強相關性,實際應用中具有高度準確性及可靠性。
相較于普通的真人樣本,專家對廣告片中的專業表達理解更到位,對廣告創意測評的要求更高,對“好創意”也有更嚴苛的評判標準。綜合效果指數、反應曲線、指標分析、黃金3秒、結尾3秒、熱力圖及4項核心結果的測評結果,76% 的 AdEff 測評結果符合專家預期(所有結果均符合預期為100%)。

? 自研超大規模主觀個性化數據集支撐
利用明略科技(2718.HK)自研設備,采集海量真實受試者的腦電與注視點信號,構建 Video-SME 與 SPA-ADV 兩大原創數據集并發表開源,為主觀體驗的科學量化提供堅實基準。
? 多模態主觀指標建模
突破傳統依賴問卷與顯著性熱圖的方式,首次將眼動、腦電等多源信號與視頻、音頻內容深度融合,實現秒級粒度的注意力、情緒與認知建模。
? 全球領先自研超圖多模態大語言模型(HMLLM)
ACMMM 2024 最佳論文提名研究成果,通過超圖結構將視頻幀、音頻、人口特征與生理信號統一建模,彌合語義鴻溝,支持幀級邏輯推理與人群差異解讀。
? 多模態混合專家模型協同
采用明略科技(2718.HK)自研多模態混合專家模型協同架構(MoE),通過動態調度不同領域的專家模型,AdEff 能夠在主觀上理解人類感受,在客觀上洞察多模態數據之間的關聯,結合專家的判斷與分析,幫助企業快速制定科學決策。
隨著廣告的泛化、效果化,人們對于“什么是好廣告?”的認知逐漸模糊,這也將引發關乎投放成本、內容風險等一系列連鎖反應。
在AI盛行的時代,我們會失去判斷力嗎?AdEff 的答案是不會。我們希望通過“可信模型+可信數據”建立一套科學的標準,為企業生產更多用戶喜愛的“好內容”保駕護航。
在 OPC 成為新流行的當下,如果你是超級個體,AdEff 也能在“接單—制作—交付—復盤”等環節助你一臂之力:
? 接單:提前測試過往樣片效果,基于測試數據,展示專業能力,建立客戶信任;
? 制作:既可以測試未完稿創意,也可以在完稿后從多版創意中選出最優版本;
? 交付:基于 AdEff 測試結果進行交付,減少因主觀判斷不同造成的重復溝通;
? 復盤:建立個人創意素材庫,積累測試案例,基于測試數據,總結優秀創意方法論,提升個人創作能力和商業價值。
目前,AdEff 已服務快消、醫藥保健、美妝個護、3C、互聯網零售等多個行業客戶。
圍繞企業廣告視頻創意場景,明略科技(2718.HK)可信商業智能體DeepMiner、零壹貳叁還可提供視頻內容洞察、AIGC創意視頻生成等全方位解決方案。
如果你也在面臨創意量產帶來的試錯壓力
???點擊此處,進入?AdEff?官網
即刻鎖定AI時代的優質創意~~
]]>2026年2月,開源AI助手OpenClaw在全球科技圈引發熱議。這個被稱為”真正能干活的AI”以其獨特的”自主執行”能力,讓企業管理者既看到了效率提升的巨大潛力,也產生了諸多現實疑問:它能為企業帶來什么實際價值?如何在組織內部落地?安全風險如何控制?技術選型應該考慮哪些因素?
在上一期專家解讀中,我們介紹了OpenClaw的核心理念與企業應用。本期,明略科技(2718.HK)副總裁李夢林將進一步解讀AI Agent的行業影響及未來發展趨勢。
Q1:最近,谷歌、Anthropic等企業在不同程度上限制了 OpenClaw 接入。與此同時,越來越多的中國模型廠商則主動擁抱 OpenClaw,這對中國 AI Agent 發展將產生怎樣的深遠影響?
李夢林:OpenClaw的”自帶代理”(Bring Your Own Agent)模式,本質上觸發了AI產業鏈的一次利益再分配。海外模型廠商的限制舉措,核心原因是訂閱制定價模型與Agent高強度調用之間的經濟矛盾。這一博弈對中國AI發展反而創造了獨特機遇。
一方面,中國市場正處于AI應用的快速擴張期,企業對能夠真正提升效率的AI Agent有強烈的落地需求。OpenClaw這樣的開源工具讓大量企業第一次真切感受到AI Agent的實際價值,這種認知普及本身就在加速整個市場的成熟。
另一方面,部分海外廠商的限制客觀上為中國模型廠商打開了生態窗口。當Anthropic和谷歌收緊接口時,國產模型通過積極兼容OpenClaw等開源框架,能夠快速服務于用戶的應用場景,在實戰中打磨模型能力。
但我們也需要理性看到,當前階段OpenClaw接入國產模型后的效果參差不齊,這恰恰說明通用Agent框架的能力天花板受限于底層模型。對中國AI產業而言,更具戰略價值的方向不是單純做”更兼容OpenClaw的模型”,而是發展面向企業核心場景的專用模型能力,將通用模型的推理能力與行業知識深度融合,形成企業真正能用、敢用的解決方案。
Q2:OpenClaw雖然開源,但核心開發者在海外,對中國企業的特定需求理解有限。若想解決這一問題,中國企業或服務商還需補足哪些能力?
李夢林:OpenClaw的局限恰恰指向了中國企業的機會所在。作為通用框架,OpenClaw試圖用”一個Agent+工具調用”解決所有問題,但企業級應用的現實是不同行業、不同場景的知識壁壘和流程差異巨大,通用方案很難做到又穩又準。
第一是場景深度。以營銷領域為例,從消費者洞察、策略制定、內容生成到效果歸因,每一環都需要行業專屬知識,不是通用模型簡單調用工具就能解決的。中國企業在這些垂直場景中積累的行業數據和業務理解,是構建專用Agent最重要的壁壘。
第二是端到端的GUI自動化能力。企業員工日常工作中大量時間花在各種軟件系統之間的切換操作上,這些工作機械重復卻不可或缺。通用框架通過Shell命令和API調用來執行任務,對于沒有開放API的企業軟件系統力不從心。而專門針對GUI交互訓練的模型,能像人一樣直接操作軟件界面,覆蓋更多真實企業場景。
第三是工程化和產品化能力。從技術原型到企業級產品,中間需要解決穩定性、安全性、可管控性等一系列工程問題。中國企業在ToB服務中積累的落地經驗本身就是核心競爭力。
我們認為,中國企業在AI Agent領域的機會不是做”中國版OpenClaw”,而是做OpenClaw做不到的事:更懂行業、更深場景、更穩落地。
Q3:OpenClaw的出現預示了AI Agent發展的哪些新趨勢?未來的AI助手會朝什么樣的方向進化?
李夢林:OpenClaw的爆火不僅是一個開源項目的成功,更是AI應用范式轉變的標志性事件,它預示了四個重要趨勢。
一是從”對話”到”執行”的能力質變。過去幾年AI應用主要停留在信息處理層面。OpenClaw標志著AI進入了”任務執行”階段:7×24小時后臺運行,通過消息平臺遠程控制,自主完成跨應用、跨平臺的綜合任務。未來的AI助手將在主動性(主動發現問題并提醒)、持續性(長期記憶和行為一致性)和自主性(目標驅動的自主規劃執行)上實現新的突破。
二是從”單一Agent”到”多智能體協同”的架構演進。值得注意的是,OpenClaw已經支持多Agent架構。一個Gateway管理多個獨立Agent,各自擁有獨立身份、記憶和工具,Agent之間可以互相通信協作。但當前的多Agent協同更多停留在”同質Agent的任務分發”層面。更深遠的趨勢是”異構Agent的專業化協同”:不同Agent在特定領域深度優化,協同完成復雜任務。就像一個公司不是找一個”全能員工”,而是組建專業團隊。
我們的實踐表明,基于明略科技DeepMiner平臺構建面向企業場景的多智能體協同架構,每個Agent針對特定業務領域深度優化,多Agent協同能夠產生超越個體的涌現能力。這種架構的優勢在于:專業Agent協同能力超越單一通用模型、不同任務匹配不同規模的模型使成本更可控、某個Agent失效不影響整個系統的穩定性。
三是從”流程編排”到”智能涌現”的范式轉變。傳統的企業自動化工具(如RPA)基于預設的固定流程執行任務,AI Agent則代表了一種全新范式,給定目標和工具,AI自主規劃執行路徑,其優勢在于靈活性更強、可擴展性更好,且具備進化能力。
四是從”工具”到”同事”的人機關系重構。OpenClaw的Workspace設計已經展現了這種趨勢的雛形,AI有自己的人設、記憶、身份和行為規范,它不再是一個無狀態的工具,而更像一個有記憶、有個性的數字同事。這種轉變將深刻改變企業的組織形態和工作方式。
面對這些趨勢,企業的務實策略是:一、邊試點邊學習,而不是等待完美方案;二、投資于能力建設而非特定工具;三、關注架構靈活性而非功能堆疊;四、建立進化機制,讓AI系統在使用中不斷沉淀知識、提升能力。
OpenClaw的出現標志著AI應用進入了新階段,但這只是開始,真正的變革還在后面,企業需要在保持理性的同時積極擁抱變化。
AI Agent時代已經來臨,企業需要的不僅是”能干活的AI”,更是”可信賴、可管控、可持續”的智能化解決方案。
明略科技(2718.HK)深耕AI領域二十年,在企業級大模型、智能體方向持續投入,多模態大模型、GUI智能體大模型技術居于全球領先地位,致力于打造真正適合中國企業的AI產品服務。
]]>