在线亚洲激情校园|无码久久精品国产亚洲AV牛牛|曰韩A级黄毛片草久伊人|av岛国在线精品国产99|久久黄片免费看视频|五月婷婷成人动漫|亚洲中文字幕性爱电影|日韩成人激情在线免费视频|成人一级片高清AV在线观看|中文动漫av在线观看

首頁(yè) > 新聞中心 > 科技

AI技術(shù)為協(xié)同辦公打開(kāi)新空間 金山辦公自研OCR模型獲權(quán)威認(rèn)證

來(lái)源: 紫牛新聞

2025-11-07 17:27:00

近日,第六屆CSIG圖像圖形技術(shù)挑戰(zhàn)賽總決賽在第十三屆國(guó)際圖象圖形學(xué)學(xué)術(shù)會(huì)議(ICIG 2025)期間舉行。挑戰(zhàn)賽共設(shè)七個(gè)賽道,吸引了國(guó)內(nèi)外高校、科研機(jī)構(gòu)及企業(yè)的2879支隊(duì)伍參賽,金山辦公支持的“2025算法挑戰(zhàn)賽-多模態(tài)文檔解析大賽”是其中的重要賽道。

現(xiàn)場(chǎng),以個(gè)人身份參賽的“復(fù)興-Team”以0.8735分的成績(jī)奪得一等獎(jiǎng),來(lái)自南京大學(xué)的“好好好”團(tuán)隊(duì)以0.8658分的成績(jī)獲得二等獎(jiǎng),來(lái)自華南理工大學(xué)的“超新星”團(tuán)隊(duì)和以個(gè)人身份參賽的“Decalogue”并列三等獎(jiǎng)。

“金山辦公希望通過(guò)支持此類(lèi)高水平技術(shù)賽事,推動(dòng)多模態(tài)文檔理解技術(shù)的發(fā)展,挖掘和培養(yǎng)更多優(yōu)秀人才,推動(dòng)協(xié)同辦公行業(yè)向更高效、更智能的方向發(fā)展,加速技術(shù)創(chuàng)新與應(yīng)用落地?!苯鹕睫k公副總裁姚冬表示。

以賽事聚焦關(guān)鍵研究,產(chǎn)學(xué)研共促文檔解析技術(shù)應(yīng)用落地

隨著人工智能技術(shù)持續(xù)賦能百業(yè)千行,文檔中信息的解析、切片和召回能力,已成為激活組織和個(gè)人知識(shí)的基礎(chǔ),這也讓文檔解析技術(shù)(包含OCR技術(shù),光學(xué)字符識(shí)別)成為協(xié)同辦公乃至人工智能賽道關(guān)注的焦點(diǎn)。

“本次大賽專注于文檔解析賽道,要求參賽者開(kāi)發(fā)出能夠同時(shí)處理文本、圖像、公式、表格等多種元素類(lèi)型的算法模型,考驗(yàn)其在布局檢測(cè)、文字識(shí)別、公式還原、表格結(jié)構(gòu)重建以及閱讀理解等多個(gè)維度的能力。比賽采用六項(xiàng)核心指標(biāo)加權(quán)匯總的評(píng)審機(jī)制,確保了最終結(jié)果的公平、客觀和可信?!苯鹕睫k公算法總監(jiān)段紀(jì)偉在現(xiàn)場(chǎng)介紹了賽事情況。

金山辦公支持的文檔解析大賽成功吸引了97所高校的215支隊(duì)伍參加,參賽高校數(shù)量較上年增長(zhǎng)44.8%。最終,以個(gè)人身份參賽的“復(fù)興-Team”以0.8735分的優(yōu)異成績(jī)榮獲一等獎(jiǎng),來(lái)自南京大學(xué)的“好好好”團(tuán)隊(duì)以0.8658分緊隨其后,獲得二等獎(jiǎng),來(lái)自華南理工大學(xué)的“超新星”團(tuán)隊(duì)和以個(gè)人身份參賽的“Decalogue”并列三等獎(jiǎng)。這些團(tuán)隊(duì)將獲得大賽頒發(fā)的一、二、三等獎(jiǎng)獎(jiǎng)金,及WPS AI會(huì)員資格、阿里云服務(wù)器資源等獎(jiǎng)勵(lì)。

挑戰(zhàn)賽總決賽由中國(guó)圖象圖形學(xué)學(xué)會(huì)理事、競(jìng)賽與培訓(xùn)工作委員會(huì)主任、華中科技大學(xué)教授桑農(nóng)主持??倹Q賽評(píng)委團(tuán)由安徽大學(xué)教授湯進(jìn)、中國(guó)科學(xué)院空天信息創(chuàng)新研究院研究員王超、云南大學(xué)教授錢(qián)文華、中山大學(xué)教授謝曉華以及中國(guó)礦業(yè)大學(xué)教授姚睿等專家組成。

WPS 365自研文檔解析算法、表格信息召回準(zhǔn)確率業(yè)界領(lǐng)先

從最初的簡(jiǎn)單字符提取,到近年來(lái)興起的多模態(tài)大模型,文檔解析技術(shù)已逐步融入版面理解、語(yǔ)義識(shí)別與結(jié)構(gòu)還原等多項(xiàng)任務(wù)。該技術(shù)在文檔和字幕識(shí)別、物流分揀、資料檢索等領(lǐng)域得到廣泛應(yīng)用,并持續(xù)推動(dòng)大模型訓(xùn)練語(yǔ)料的積累。

金山辦公算法總監(jiān)段紀(jì)偉在現(xiàn)場(chǎng)指出,當(dāng)前文檔解析技術(shù)正逐步從基于深度學(xué)習(xí)的方法向基于多模態(tài)大模型的方法過(guò)渡,同時(shí)從單任務(wù)單模型范式向端到端多模態(tài)大模型范式轉(zhuǎn)變。然而,該領(lǐng)域仍面臨諸多挑戰(zhàn),包括文檔復(fù)雜解析難度較大、稀缺數(shù)據(jù)適配性較差以及性能與效率要求較高等問(wèn)題。因此,產(chǎn)學(xué)研各界應(yīng)緊密合作,共同推動(dòng)技術(shù)轉(zhuǎn)化與應(yīng)用落地。

經(jīng)過(guò)多年技術(shù)積累,WPS 365的自研算法已具備國(guó)內(nèi)領(lǐng)先的文檔解析能力,能夠精準(zhǔn)識(shí)別PDF文檔中的圖片、表格等信息,大幅提升問(wèn)答精度。特別是在表格信息召回方面,該算法的召回準(zhǔn)確率高達(dá)95%,顯著領(lǐng)先于業(yè)界水平。

今年6月,金山辦公攜手華中科技大學(xué)共同推出了名為Monkey OCR的文檔解析模型。據(jù)研究團(tuán)隊(duì)提供的數(shù)據(jù),Monkey OCR在處理復(fù)雜文檔(如包含公式和表格的文檔)時(shí)表現(xiàn)尤為出色,其性能相較于行業(yè)平均水平分別提升了15.0%和8.6%。在英文文檔解析任務(wù)中,其3B參數(shù)模型更是超越了主流的72B模型,平均性能達(dá)到了SOTA級(jí)別(即在基準(zhǔn)測(cè)試中表現(xiàn)最優(yōu))。盡管發(fā)布尚不足一個(gè)月,該模型的GitHub Stars數(shù)量已攀升至2.6k,目前已突破6.2k。

基于技術(shù)帶來(lái)的范式轉(zhuǎn)變,金山辦公近年來(lái)在人工智能領(lǐng)域動(dòng)作頻頻。2023年,金山辦公推出WPS AI 1.0聚焦“工具賦能”,將AI能力嵌入WPS組件,奠定了超6億月活設(shè)備的用戶基礎(chǔ);2024年,推出WPS AI 2.0,基于此WPS 365構(gòu)建“企業(yè)大腦”,促進(jìn)“組織知識(shí)激活與挖掘”;2025年,推出WPS AI 3.0版本,打造“人與AI助理多輪對(duì)話、持續(xù)修改”的全新交互范式。截至6月30日,WPS AI月活躍用戶數(shù)已突破2951萬(wàn)。

為支撐人工智能、協(xié)同辦公等戰(zhàn)略落地,金山辦公選擇真金白銀地投入。2025上半年研發(fā)投入達(dá)9.59億元,同比增長(zhǎng)18.70%,研發(fā)費(fèi)用率約36%,研發(fā)費(fèi)率相比2024上半年提高2至3個(gè)點(diǎn)。同時(shí),金山辦公重視與高校、學(xué)會(huì)的共建合作,將持續(xù)探索更多的“產(chǎn)學(xué)研”合作機(jī)制,為推動(dòng)人工智能產(chǎn)學(xué)研一體化發(fā)展貢獻(xiàn)力量。


校對(duì) 陶善工