11月25日下午,金山辦公舉辦AI協同辦公大會,旗下WPS 365不僅對智能文檔庫AI Docs、數字員工兩大AI核心產品進行煥新升級,更推出AI中臺、團隊空間等新產品。與此同時,金山辦公聯合華科發布的MonkeyOCR v1.5在全球權威文檔解析評測榜單OmniDocBench V1.5中拿下93.01分的成績,獲得綜合性能全球第一。

MonkeyOCR v1.5再次突破多模態文檔解析性能上限
經過多年技術積累,WPS 365的自研算法已具備國內領先的文檔解析能力,能夠精準識別PDF文檔中的圖片、表格等信息,大幅提升問答精度。特別是在表格解析方面,該算法的表格結構還原的準確率高達95%,顯著領先于業界水平。
在上述國際權威測評榜單中,金山辦公與華中科技大學聯合發布多模態文檔解析模型 MonkeyOCR v1.5在通用文檔解析能力上全面超越 PaddleOCR-VL、MinerU2.5、DeepseekOCR 等主流方案,復雜表格解析準確率首次突破90%,標志著我國智能文檔處理技術邁入新階段。
“90%的復雜表格解析率不是終點,而是行業標準的新起點。” 金山辦公AI研發總監劉強表示,該模型已實現文本、表格、公式、圖像的全類型解析,輸出格式支持 Markdown、HTML、Json文本等多種形態,可直接對接企業OA系統與科研工具。在實際應用中,高校科研人員借助其批量解析論文,將20篇文獻的數據整理時間從2天壓縮至5分鐘。
作為協同辦公的核心支撐技術,文檔解析長期面臨復雜表格識別、跨頁結構重建、嵌入式圖像干擾等行業痛點。傳統OCR系統在處理多層嵌套表格、跨頁單元格時精度不足,而端到端模型又存在效率瓶頸。MonkeyOCR v1.5通過創新的兩階段架構以及針對嵌入圖像、跨頁表格的專用模塊,成功破解這一難題。

金山詞霸VS國內外產品
此外,翻譯能力在協同辦公中是打破語言壁壘、保障協作效率的關鍵支撐,直接影響信息傳遞與團隊配合質量。金山辦公在“圖片翻譯”方面迎來新的突破。例如,當用戶在金山詞霸中使用“拍照翻譯”功能,無論是手寫文稿、印刷文件,還是異形排版文件,小詞都能夠快速掃描識別,并精準翻譯。
據悉,“圖片翻譯”功能將在金山辦公的各類產品中陸續上線,其底層技術依托于金山辦公自主研發的翻譯模型。該模型在中英翻譯質量方面超越了國內外的頭部產品,處于領先地位。此外,金山辦公已將翻譯模型接入到WPS 365產品中,借助“國際化”戰略,金山辦公正著力將服務中國組織級用戶的產品及定制化能力推向全球市場。
