在数字时代,数据犹如一颗珍贵的宝石。对于像快手这样的短视频平台而言,探索和构建短视频领域的数据是至关重要的。这是一段充满挑战与机遇的旅程,而今天,让我们一同深入了解快手短视频领域数据建设的方方面面。
一、快手早期数据建设的曲折历程
- 起步探索阶段(2016 - 2017)
- 在这个时期,快手的数据建设宛如一个蹒跚学步的幼儿,面临着诸多困难。数仓初始化的过程中,随着 APP 层业务形态的不断拓展,分析重点也发生了转变。用户域、设备域、生产域和消费域等各个板块都在发展,恰似一棵幼苗逐渐长出繁多的枝叶。
- 然而,这一发展也带来了一系列问题。DWS 聚合层和 DWD 明细层的数据需求急剧增加,ODS 贴源层的建设压力陡然增大,并且模型归属不清晰,就像一群迷失方向的候鸟,找不到自己的栖息地。
- 调整改进阶段(2018 - 2019)
- 为了解决前期出现的问题,快手进行了一系列调整。通过扩展主题域、新增主题层以及构建核心业务过程宽表和核心实体宽表等措施,仿佛为迷失的候鸟重新找到了归巢,有效地解决了模型归属不清的问题。
- 同时,大量冗余维度和相关指标的出现,使得使用者自助分析成本降低,需求也发生了转移。但新的问题随之而来,供需矛盾依然突出,数据建设始终滞后于业务需求,就像一辆缓慢行驶的马车,难以跟上业务发展这匹飞驰的骏马。此外,烟囱式数据建设加剧了人力和资源的紧张状况,“找数难” 成为了普遍存在的问题。
二、快手领域建设探索的方向与策略剖析
- 明确的目标设定
- 快手在领域建设探索过程中,确立了清晰的目标。这就好比一艘航行在茫茫大海上的船只,有了明确的目的地。其目标包括满足业务使用需求、提高数据复用性以及合理控制成本。
- 多元化的策略实施
- 提前规划与建设策略:快手如同一位高瞻远瞩的规划师,提前开展数据建设工作,预留数据能力,以提升业务满足率。例如,对 APP 层进行快速个性化支持的升级,扩大数据能力覆盖范围,合理安排主题层的 “需求转移”,并适当延迟公共模型下沉的时间。
- 用户场景聚焦策略:将用户场景进行细致拆解,如同拆解一台精密的仪器。注重阐述资产的场景服务能力,以此缩短用户获取路径,降低使用成本。
- 复用性强化策略:从业务场景阶段就强调相似性,促使相关资产能够相互引用,就像搭建积木一样,通过寻求复用,增强资产复用性。
- 领域驱动设计(DDD)策略:构建领域知识体系,识别领域问题,进而驱动业务建模。这就像一位指挥家,统一通用语言,使得建模师和使用者能够顺畅沟通,实现领域模型的复用,扩大数据能力覆盖范围。
- 动作拆解策略:在冷启动阶段建立领域知识,在日常阶段进行知识迭代。确定场景作为通用语言,基于场景进行沟通,由场景驱动模型,同时开展场景拆解、合并以及相关资产引用等操作。
- 建设流程与方法策略:涵盖申报阶段、建设阶段和运营阶段。在申报阶段,要明确领域名称、描述、目标和拆解等关键要素。建设阶段要延续之前有效的方法,如主题域划分和分层建设思想,对业务场景进行细化,提炼业务过程。运营阶段则要注重领域沉淀,提升资产易用性。
三、快手短视频领域建设实践的详细步骤
- 申报阶段:奠定基础
- 申报阶段是数据建设的基石,如同建造高楼大厦需要稳固的地基。在领域申报时,必须确保领域名称准确无误,描述清晰明了且语义连贯。以短视频领域为例,它涉及视频生产、审核、推荐等多个业务环节,领域描述应详细说明业务所涉及的工作内容、角色以及价值等。领域目标要明确数据能够解决的问题,领域拆解则要涵盖子领域拆解以及关键业务场景规划。
- 领域公示同样至关重要,它能够拉齐内外认知,促进合作。对外,要与业务方协调建设节奏;对内,要让团队成员了解规划内容、操作方法以及接口人信息,避免出现烟囱式建设的情况。
- 建设阶段:精心打造
- 在建设阶段,需要新增场景推导,维持现有的模型建设技术,并延续主题域划分和分层建设思想。这就像一位技艺精湛的工匠,精心雕琢一件艺术品。要对领域和子领域进行细致拆分,实施领域驱动设计,将细节拆解到位,对业务场景进行细化,提炼业务过程,同时还要提炼粒度、指标和维度等关键要素。
- 运营阶段:持续优化
- 运营阶段的核心是让领域沉淀,形成领域资产沉淀,目标是实现知识更新和能力盘点。这类似于对一台运行中的机器进行定期维护和升级,要对领域进行沉淀和审查,确保资产易用,使用户场景和分析诉求相匹配。
四、快手短视频领域建设的显著收益与总结展望
- 可观的收益呈现
- 通过快手短视频领域数据建设,实现了全场景覆盖,研发效率显著提高,资产复用性也大幅增强。这就好比为一支军队配备了先进的武器装备,无论是创作者、平台还是消费者,在视频生产、审核、推荐等各个环节都从中受益。创作者能够更高效地创作和发布视频,平台能够更精准地推荐视频,消费者能够更便捷地获取感兴趣的视频。
- 总结与未来展望
- 数据建设是一个持续不断的过程,犹如一场没有终点的马拉松比赛。它涵盖了数据技术和数据治理两个方面,随着后续分析场景的增多和复杂度的提高,需要持续通过数据技术手段和治理措施在成本和效率上取得平衡。对于像快手这样的短视频平台来说,要继续深入探索短视频、活动、直播等十大明星数据领域建设,不断开拓创新,以适应不断变化的市场需求。