产品
解决方案
客户案例
资源中心
活动中心
关于我们
免费资源包
HOT

架构极简主义实践:经典CRM报表场景下的全链路实时化与提效升级

导读

作为国内领先的全链路智能营销管理服务商,螳螂科技为新东方、沪江网校等5000余家企业提供从推广获客到客户运营的完整解决方案。随着服务客户数量持续增长,原有基于阿里云MaxCompute + DataWorks + ADB的“三件套”架构面临组件割裂、成本高、运维复杂等多重挑战。

借助从阿里云迁移至腾讯云的契机,螳螂科技选择了云器Lakehouse作为新一代数据平台核心,实现了对原有三套组件的统一替代和架构升级。

迁移后,螳螂科技技术团队将数万张源表的数据实时写入湖仓,数据可见延迟从天级别压缩至10秒级别,P99查询响应控制在1秒内,同时提升所有性能指标,整体成本下降30%,运维负担降低30%。为高效产出分析决策报告提供有力的性能支撑。

接下来,本文将详细分享这次架构升级背后的技术决策与落地实践。

背景:全链路智能营销的领跑者

北京螳螂科技有限公司成立于2016年,是国内领先的全链路智能营销管理服务商。螳螂科技的核心产品体系涵盖营销云、AI在线客服、CRM客户关系管理系统、SCRM私域直播运营管理系统等。

作为一家以数据驱动业务增长的SaaS服务商,螳螂科技的核心竞争力之一在于为客户提供精准、及时的业务洞察。在CRM报表场景中 ,平台需要为不同角色的业务人员——主管、销售、坐席、推广人员——提供个性化的数据报表服务。

迁移背景与痛点:跨云迁移中的"架构难题"

随着服务客户数量的持续增长和数据体量的急剧膨胀,如何在保障高并发查询性能的同时实现数据的实时可见,成为摆在技术团队面前的关键挑战。

战略迁移的刚性需求

基于一个契机,出于整体成本优化和战略布局的考量,螳螂科技决定将部分业务从阿里云迁移至腾讯云。这是一次涉及全业务链条的系统性迁移工程,其中CRM数据和报表业务作为数据密集型应用,面临的迁移复杂度尤为突出。原有架构深度绑定阿里云的大数据生态 ,如何在腾讯云上找到等效甚至更优的替代方案,成为迁移成功与否的关键。

原有架构的三重困境

在阿里云时期,螳螂科技的CRM报表业务依赖典型的大数据"三件套"组合:MaxCompute负责海量数据的存储与离线计算,DataWorks承担数据开发与任务调度,ADB for MySQL则作为分析型数据库支撑最终的报表查询服务。这套架构在业务初期能够满足基本需求,但随着数据规模和业务复杂度的提升,其固有的结构性问题逐渐显现。

image.png

组件割裂,链路冗长。  数据从业务库到最终报表呈现,需要经历多次抽取、转换和加载过程。首先通过DataWorks集成的DataX工具将数据从业务库抽取至MaxCompute,在MaxCompute中完成数据清洗和中间层计算后,再将结果数据导出至ADB for MySQL,最后由报表系统从ADB中查询数据。整条链路涉及三个独立组件之间的数据搬运,不仅增加了数据时效性的损耗,也带来了大量的链路维护工作。

成本高企,资源冗余。  多套组件意味着多份存储和计算开销。MaxCompute存储一份完整的数仓数据,ADB中又需要冗余存储一份供查询使用的结果数据,存储成本被显著放大。更为关键的是,ADB作为专用的分析型数据库,其实例成本相对较高,即使在业务低峰期也需要维持固定的资源配置。

运维压力,风险累积。  维护三套异构系统的稳定运行,对运维团队是持续的负担。各组件间的数据同步可能因网络波动、任务调度冲突等原因出现延迟或失败,任何一个环节的故障都可能导致下游报表数据不可用。多系统联动的复杂性使得问题定位和故障恢复变得困难。

为什么选择云器

面对跨云迁移的刚性需求,螳螂科技技术团队明确了新架构的选型标准:在腾讯云上找到一个能同时具备离线数据处理能力、高性能分析查询能力,且能直接支撑报表服务的统一平台,实现对原有“三件套”架构的平替甚至超越。

选型决策主要依据三个主要考量因素

在评估多个候选方案后,螳螂科技最终选择了云器Lakehouse作为新一代数据平台的核心。这一决策基于三个关键考量。

功能对标的完整性。  云器Lakehouse完整对标并替代了MaxCompute与DataWorks的核心能力。在存储层面,基于开放的Lakehouse架构实现海量数据的统一存储;在计算层面,提供强大的离线批处理和交互式查询能力;在开发层面,云器Studio提供了功能完备的数据开发与任务调度环境,能够平滑承接原有DataWorks上的业务逻辑。

服务能力的关键突破。  与传统数仓方案相比,云器Lakehouse最具差异化的优势在于其强大的数据服务能力。平台原生支持MySQL JDBC协议,意味着下游报表系统可以直接通过标准数据库连接方式访问Lakehouse中的数据,无需再部署独立的ADB实例作为对外服务层。这一能力直接解决了原有架构中ADB这一“最后一公里”的痛点。

多云部署的天然适配。  云器Lakehouse原生支持多云部署架构,能够无缝运行于腾讯云环境之上。这意味着螳螂科技既可以充分利用腾讯云的基础设施红利,又不必担心新的云厂商锁定风险,为未来的架构演进保留了充分的灵活性。

总结这次选择,一方面考虑这是一次适配多云的基础设施的迁移,另一方面也是架构理念的升级——从Lambda架构走向一体化Kappa架构。

解决方案:云器 Lakehouse 的"一体化"替代方案

场景落地:CRM报表系统的重构

基于云器Lakehouse,螳螂科技完成了CRM报表系统的整体迁移,实现了从数据接入、存储计算到对外服务的全链路升级。

去ADB化的架构简化。 在新架构中,ADB这一独立组件被彻底移除。报表系统通过MySQL JDBC协议直接连接云器Lakehouse,所有查询请求在Lakehouse内部完成计算并返回结果。数据不再需要从数仓导出到专用的分析数据库,既消除了数据冗余存储,也去除了数据同步延迟。

云器Studio的统一开发体验。 原有在DataWorks上的数据开发与调度任务,平滑迁移至云器Studio环境。开发人员在统一的IDE中完成数据建模、ETL逻辑编写和任务调度配置,不再需要在多个平台间切换。Studio提供的可视化任务监控和日志分析能力,也显著提升了开发运维效率。

数万张源表的实时写入。 借助云器Lakehouse的实时数据接入能力,业务系统的数万张源表数据能够以近实时的方式写入湖仓。数据从产生到可查询可见的延迟被压缩至10秒级别,业务人员得以在报表中看到最新鲜的CRM状态数据,为及时的业务决策提供支撑。

架构演进对比

螳螂科技CRM报表业务的这次架构升级,可以概括为从"组件堆砌"到"平台一体化"的一步。下图直观展示了迁移前后的架构变化。

image.png

迁移前:阿里云时期的“组装式”架构

MC+DW+ADB拼装的方式,将数据平台和数据报表系统之间做数据搬运,存在多份数据的存储,依赖ADB做“最后一公里”的查询加速。每一次数据搬运都意味着额外的计算开销和同步延迟,整条链路的数据时效性受制于最慢的环节。

迁移后:腾讯云 + 云器的一体化湖仓架构

新架构部署于腾讯云上海区域,底层运行于腾讯云基础设施之上。相比原有架构,最直观的变化是组件数量的大幅精简和数据链路的显著缩短。

优势一:一体化湖仓架构 云器Lakehouse基于SingleEngine技术实现了实时数仓和离线数仓的一体化设计。在存储与计算层,云器Lakehouse作为统一的数据平台,同时承担原有MaxCompute的数仓存储与离线计算职能,以及ADB的即席查询与对外服务职能,真正实现了"一套架构支撑全场景"。开发人员在云器Studio中完成全部的数据开发与调度任务,替代了原有的DataWorks。

优势二:万张源表实时写入能力 在数据接入层,业务库通过PrivateLink私网连接与云器Lakehouse建立安全通道。云器Lakehouse具备强大的实时写入能力,支持数万张源表的数据以实时方式直接写入湖仓,无需经过中间的同步组件,大幅简化了数据链路。

兼容性优势:零改造对接 在数据服务层,报表系统通过PrivateLink构建的全链路内网通道,使用标准MySQL JDBC协议直接连接云器Lakehouse。这种设计无需对现有业务系统进行语言兼容改造,只需通过原有的MySQL协议即可完成连接。这种"全内网访问"模式不仅保障了数据安全——整条链路不暴露公网,也进一步降低了网络延迟,提升了报表的响应速度。

从架构视角来看,这是从复杂的“多组件流程”到简洁架构的蜕变。原有的DataWorks、MaxCompute、ADB三个独立组件,被云器Studio与Lakehouse两个紧密集成的模块所替代,对外只需暴露一个统一的服务端点。

业务价值与成效数据

经过平稳的迁移上线和持续的生产运行,云器Lakehouse为螳螂科技带来了多个维度的量化收益。

运维降本:从繁到简的减负

运维负担降低30%。 从维护多组件变为直接使用一个统一平台,故障点显著减少。原有架构中,DataWorks的任务调度、MaxCompute的计算资源、ADB的实例状态都需要独立监控和运维,任何一个环节的异常都可能导致下游链路中断。新架构下,运维团队只需关注云器Lakehouse一个平台的健康状态,问题定位和故障恢复的效率大幅提升。

架构彻底解耦。 数据不再需要在不同系统间反复搬运和同步,消除了系统间数据一致性校验的工作量,也规避了同步任务失败导致的数据不一致风险。

财务降本:真金白银的节省

整体成本下降30%。 成本节约来自三个方面:其一,资源成本从预留转为按量付费,且能保持比原来查询延迟更优的性能;其二,数据不再需要在MaxCompute和ADB中冗余存储,存储成本显著下降;其三,免去了维护多个系统的组件,软硬件的成本和人力成本都省下来了。

性能提升:快与鲜的兼得

查询响应更快。 P99的查询都能在1秒内返回。这得益于云器Lakehouse在存储布局和查询优化上的技术积累,以及数据无需跨系统搬运带来的链路优化。

数据更加新鲜。 数万张源表的数据实时写入湖仓,从数据产生到报表可见的延迟被压缩至10秒级别。业务人员在CRM报表中看到的,是近乎实时的客户状态和销售进展,能够据此做出更及时的业务决策。

结语

这次架构升级,是一个“借迁移而优化”的实践。跨云迁移的刚性需求,成为螳螂科技技术团队重新审视既有架构、寻求更优解决方案的契机。云器Lakehouse以其存储、计算、服务一体化的产品能力,以及对多云环境的原生支持,完美承接了原有阿里云大数据“三件套”的全部职能,同时带来了架构简化、成本下降和性能提升的多重收益。

希望这个实践对面临类似挑战的企业——无论是正在规划跨云迁移,还是苦于多套数据组件的维护复杂性——提供一个值得借鉴的参考。


🎁 新用户专享福利

✅  1 TB 存储 · 1 CRU时/天计算 · 1 年全托管体验

➤ 即刻访问云器官网领取:https://www.yunqi.tech/product/one-year-package

image.png

云器Lakehouse现已开放注册
欢迎申请体验,每个账号开通会获赠一定金额的代金券,助您快速试用体验。如需更多代金券额度,请您联系商务获取。
预约咨询
微信咨询
电话咨询