如何在另一个表格中抓取数据(怎么从另一个表格中提取数据)

网友投稿 908 2022-10-10

如何在另一个表格中抓取数据(怎么从另一个表格中提取数据)

金山办公的开放日,给出了其中一个答案。

7 月 22 日,是科创板开市两周年的纪念日。得益于在科创板的上市,金山办公以近 1800 亿规模成为 A 股市值最高的软件公司,

在国产软件的历史中,金山办公核心产品 WPS 是个较为特殊的存在。

诞生于 1989 年的 WPC,在 PC 时代曾有着较大的先发优势,但很快被微软用 Windows 系统 +Office 软件所冲击。而在移动互联网时代,WPS 又逐渐从微软 Office 手中抢回了部分个人办公与政企市场的份额。

如此 " 复仇者 " 般的故事,WPS 怎么做到的?这个问题的答案不一定就只是商业大佬的纵横捭阖、大刀阔斧,或许也藏在一些微小的积累及改变中。

同样在 7 月 22 日,金山办公举办了技术开放日,让多位程序员走向了台前,展示 WPS 在提升工作效率上的各类功能创新。

金山办公这场开放日活动,或许便是从微观层面展示另一种解答。

"我们这些功能,Office 没有"

技术开放日的一个重要环节,是由金山办公的程序员们详细演示自研 AI 框架和能力,在产品功能应用上的一些微创新成果。

如何在另一个表格中抓取数据(怎么从另一个表格中提取数据)

例如在 PPT 制作方面,WPS 推出了通过 AI 算法将思维导图或文字大纲进行识别、拆分、转化等流程,实现 " 一键转化 " 为分页式 PPT 的功能。

还有通过 AI 算法,智能识别 PPT 中的文字、内容、格式,再通过算力从数据库中调用匹配的素材,实现智能配图、智能排版等功能。

在表格场景的应用中,WPS 通过 AI 算法的识别、校正等能力,推出了一键表格整理美化、一键表格数据校对等功能,省去了用户逐个数据修改的复杂过程,提升了办公效率。

记者在采访中问及这些功能 Office 是否也能做到时,得到最多的一句回答便是," 我们这些功能,Office 没有。"

相关技术人员对 记者表示,他们会根据底层 AI 能力的特点进行头脑风暴,寻找在 WPS 各个功能中落地应用的可能性。开放日所展示的众多微创新成果,均来自于此。

这个过程其实并不轻松。例如传统的文档翻译,往往只能做到文字信息的翻译,原文件的排版格式难以同步进行复制。WPS 团队希望通过 AI 算法来解决这一用户使用中的痛点。

最终解决思路是采用 " 双轨制 " 并行的逻辑,即通过 AI 算法将原文档的文字与排版格式同步抓取识别,再将文字翻译,排版格式转化和复刻后,组合成一个新的文档。这样便实现了文字翻译的同时,保持排版格式的还原。

不过有技术人员坦言,研发过程中最大的难点便是如何实现排版格式的识别及转化复刻,项目团队死磕了两年多的时间,才最终取得了突破。

有趣的是,2010 年彼时的微软大中华区高层曾公开表示," 建议国内其他 Office 厂商不要做了,如果坚持要做,就得像微软一样来创新自己的产品。"

在后续 10 年的时间里,这番话一语成谶,只是在移动互联网时代通过创新产品实现突围的并非微软 Office,而是当年微软所称 " 其他 Office 厂商 " 中的金山办公。

"专注一款产品 30 多年,国内 IT 业仅此一家 "

在这种微观层面的视角上,金山办公高级副总裁庄湧补充了更为丰富的内容。

例如在移动互联网时代,兼容适配便是 WPS 需要面临和解决的一个十分核心的问题。不同的终端设备、手机品牌、手机型号、操作系统等等,都需要做好兼容适配的覆盖。

不仅如此,在政企服务场景中,还会涉及到用户需要通过 OA 等不同的系统平台来打开和使用 WPS 软件,这又涉及到更大工作量的二次开发接口体系的兼容。

为了确保政企客户不需要改动任何代码就能运行使用,WPS 团队需要做大量的开发梳理工作。例如接口的每个名称、参数的涵义等都需要保持一致,任何一个细节出错都会影响使用体验。

兼容适配体系的搭建,需要时间的积累,不能想着速成。庄湧分享称,曾经 PPT 文本框代码中有个字段,大部分情况下都是 0,偶尔会看到 1。

起初庄湧并不知道这里 0 和 1 的区别及涵义,只知道如果不写的话文件的兼容性就会出现问题。在一次对阿拉伯文的适配工作中,庄湧才真正发现 0 或 1 代表的是文字顺序从左往右,还是从右往左。

从发现到真正弄懂这个适配字段的功能意义,庄湧前后经历了快八年。

" 兼容适配不仅有技术门槛,也是需要时间积累和磨炼的。"庄湧坦言,兼容适配难就难在怎么做到和对方保持一致,这需要不断地观察、猜测、摸索和实践。

在这方面,金山办公高级总监黄传通精炼地总结了 WPS 的优势:" 国内 IT 公司里面,一款产品(WPS)持续深耕了超过 30 年,除了金山办公可能再找不出第二家。"

从结果上来看,金山办公在移动互联网时代的崛起,做好兼容适配这一点功不可没。

金山办公财报数据显示,今年一季度,实现营业总收入 7.7 亿,同比增长 107.7%;实现归母净利润 3.07 亿,同比增长 178.7%。

截至今年 3 月底,金山办公主要产品月度活跃用户(MAU)为 4.94 亿,较上年同期增长 10.51%。其中 WPS office PC 版月度活跃用户数 1.94 亿,移动版月度活跃用户数 2.94 亿。

另一方面,在数据安全问题越来越重要,也越来越为市场、用户所聚焦的背景下,金山办公也分享了其在数据安全方面的一套完整处理机制。

黄传通介绍称,金山办公在数据安全方面采用的是三段加密的密钥保护机制。

具体而言,公司相关人员要想进入数据库需要通过各部门的层层审批;进入数据库后实际上看到的也是经过加密保护后的数据;即使调用和取走了加密后的数据,也无法完成最终的解密读取,因为解密的三段密钥分别由三位核心高管进行保管。

黄传通也表示,公司近年来不断完善数据安全机制,甚至在每个部门都设置了安全工程师岗位,进行业务规范、数据安全等方面的监督。

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:数据分析工具(数据分析工具的作用)
下一篇:甘特图wps(甘特图wps对某个调整)
相关文章