金山办公率先在 4 月展示了基于轻文档的 AI 技术,WPS AI 已可以在办公领域发挥生成内容创作的能力。
这种速度已让人耳目一新,实际上金山办公的轻文档 AI 能力还是国内首个大语言模型 ( LLM ) 在应用层的落地,但是在技术沟通会上金山办公格外强调了这一点:演示的不是什么虚无缥缈的 PPT,而是真实体验。
(资料图片仅供参考)
当时没有特意宣扬的是,这家拥有 35 年历史的国内办公软件巨头实际上已借大模型的突破进展而 all in AI。一个月之后,金山办公向我们展示了 all in 的最新阶段性成果:最为知名的 WPS 三件套,无论 PC 版还是移动端,都借助大模型实现了颠覆性的 AI 能力升级。
比如,你现在可以 " 询问 " 一张表格了。
打开海外版 WPS 表格后,呼出位于菜单栏最右边的 WPS AI 按钮,你就可以像网络聊天一样与 AI 助手对话,你的问题可以非常笼统,比如让 AI 帮你分析整张表格中的数据变化趋势,并据此匹配适合的图表。
问题也可以非常具体,比如要求 WPS AI 理解并计算某些具体的数据并给出答案。
WPS AI 会直接把结果生成在表格的对应位置,展开单元格你会发现,实际上 WPS AI 是生成了一段表格公式。而拥有这种能力,WPS AI 甚至可以轻松帮你生成各种数据透视表,这意味着金山办公的 AI 能力已经能够全面理解表格数据,并且能自如运用表格的各种复杂功能,从数据到计算再到交互,用户现在需要做的只有提出问题。
除了数据分析,大语言模型在文本上的理解能力也让人印象深刻——金山办公在这一点上本来就有传统优势。早在大语言模型之前,金山办公就已经深耕 AI 领域多年,相关项目由金山办公副总裁姚冬领队,涉及随手拍、PDF 等内容识别领域。根据金山办公自己的说法,在 CV 模型上金山办公的各项技术指标均位于行业第一梯队。
有了大模型理解能力的加持,金山办公走通了这条文档内容理解链路:从识别、理解到内容分析与转化。
一篇 42 页的英文论文可以在 10 秒内完成分析,只需要 1 分钟,WPS AI 就可以生成基于文章内容的关键要点。
用户还可以和 WPS AI 用聊天方式互动,内容问答既可以是概括性问题,也可以针对细节提问。
和金山办公原有的内容识别技术结合后,WPS AI 的随手拍功能可以说已经成为完全体,抓拍之后,移动端生成了洞察和探寻两个模块内容,一个包含随手拍内容的关键要点,另一个则可以基于内容进行概括归纳,并回答用户的问题。
金山办公的 " 快 " 意味着什么
就在一年前,前面提到的这些功能还是不可设想的。在 WPS AI 技术交流会上,金山办公 CEO 章庆元直言,去年他们内部总结时一度认为,AI 的能力似乎已经到了一个极限。
某种程度上,办公软件的进化停滞了。" 只能等待新的 AI 技术出现。" 这让所有人陷入一种焦虑。
然而大模型猝不及防地来了,程序员出身的章庆元在看到 ChatGPT 代码方面的能力后,几乎立刻意识到这一切意味着什么。
过去金山办公的战略概括起来是五个词:多屏、内容、云、AI 和协作,但用金山办公高级副总裁毕晓存的话说,其它四项如今已经成为了 AI 的一个基座,"AI 是我们最重要的战略,没有‘之一’了。" 这种战略上的迅速转向在金山办公只用了短短几个月。
制定战略的能力是一家公司的核心基因之一,35 年前金山办公成立的时候,人们的电脑还是用着 DOS 代码界面。一路走来金山办公见证了许多次技术革命,图形界面,PC 互联网、移动互联网浪潮都是如此,金山办公曾在图形界面出现时掉过队,因此对技术浪潮拥有着更为敏锐的嗅觉,更何况,大模型的革命性几乎一望而知。用章庆元的话说,"AI 比以往任何一次来的要凶猛得多 ",因为它有彻底颠覆整个软件的潜力。
试想一下,用户不再需要去仔细从头到尾地阅读所有的文档数据,借助 AI 就能大幅提升阅读理解效率。隐藏在办公软件菜单最深处的功能——甚至菜单本身,都随着 AI 交互而失去了存在的必要性,复杂的公式、代码乃至内容理解本身都可以由 AI 代劳。
办公软件将因为大模型而完全改头换面,金山办公更不会错过这次浪潮。
当然,仅仅有清晰战略是不足以支撑产品的,大模型的产品化落地不是靠钱堆砌就能解决问题,这背后涉及到一个公司的工程化能力。
这是金山办公的优势。all in AI 的清晰战略能够奏效,整个公司的组织程度和速度能够围绕大模型战略持续迭代升级,这背后要有强大的工程化能力做支撑。金山办公之所以能做到这一点,和它长久以来对 AI 领域持续投入有密不可分的关系。
早在 2017 年,姚冬就带领技术团队投入 AI 领域," 加起来应该有几十项 AI 内容。" 这让大模型同 OCR 技术的对接变得十分高效——金山办公原本就已在拍照扫描、文档识别理解等功能的技术上有深厚积累,特别是在移动端。因此,WPS AI 的随手拍功能实际上已经实现了对几乎所有非结构化数据的内容处理,也就是说只要能用手机摄像头的地方,金山办公的大模型能力就能实现对内容的识别。
这种能力的快速推出是金山办公在办公赛道领先地位的一个侧证——目前尚没有竞品推出类似功能,而金山办公的更新甚至是全版本的,也就是说,按照金山办公目前的规划,无论海内外,无论移动还是 PC 端,WPS AI 的新功能是全线、全端上线的。目前,WPS AI 正在积极推进合规工作,正式上线时间还要等待官方消息。
这几乎产生了一个反直觉的效果,不少人认为大模型颠覆赛道的能力在于让进行玩家的重新大洗牌,然而金山办公实际上却凭借 AI 能力巩固甚至强化了自己的优势。
" 我们不革自己的命,就等着被革命。" 毕晓存在谈到 all in AI 战略的时候这样说。一方面这当然体现了金山办公对整个大模型战略趋势的精准把握,另一方面,也体现了一家走过 35 年历程的国产科技公司对自己技术和能力积累的充分自信。