简介:
企业数据孤岛、共享数据管理和数据服务性能面临挑战,高可用的主数据管理服务越来越受到企业的重视。本文基于百度,智能小程序主数据的一些实战经验总结,从解决百度,智能小程序核心业务数据模型的质量和共享协调入手,重新定义业务数据模型的边界,为企业提供高可用数据管理服务的演进过程,希望能够帮助您在主数据应用的道路上获得更多的帮助。
一、主数据概念
1.1 主数据概念介绍
主数据(Master Data,简称MD)一般是指系统之间(如客户、账户、组织)共享的数据,因此其核心价值是解决数据共享和一致性问题。
根据主数据管理实施的复杂程度,参考Jill Dyche、Evan Levy的观点,主数据管理大致可以分为六个层次。最底层反映了主数据管理(MDM)的不同成熟度。如果被隔离了费用归谁出下面简单今天介绍一下这六个层次。由于Level3通常主要用于一般企业,下面只介绍Leve规则怪谈l0到Level3。感兴趣的同学可以阅读主数据百科:
Level 0 :没有实施任何主数据管理(MDM)
在0级的情况下,意味着企业内各个应用之间没有数据共享,整个企业没去做有数据定义元素。每个系统自己管理自己的数据,通过mesh交换进行共享和使用。
Level 1 :提供列表
通过提供列表,网页无法访问我们可以了解到对数据采用的是登记制,数据信聊天软件哪个最火息是手工登记的,包括数据的添加、删除、更新和冲突解决。这种模式已经有了统一数据管理和维护的动机,但是模式的成本极高,而且高度依赖人工管理的流程也容易出错。
Level 2 :同等访问(通过接口的方式,各个系统与主数据主机之间直接互联)
与提供列表相比,引入了主数据统一注册和管理的思想。通过建立数据标准和定义,将它们存储在中央储存库中,并在中共,访问,它为各种系统之间共享和使用数据提供了元数据定义支持。虽然存储的数据仍然是按照各个系统分别存储,但是由于统一的描述和定义,以及信息的同步自动更新,使得管控能力和成本降低都有了很大的提高。然而,由于分散存储,管服务理和控制的成本仍然很高。
Level 3 :集中总线处理
集中式总线处理打破了独立应用程序的组织边界,并通过使用所有系统都可以接受的数据标准来建距离2021年高考还有多少天立和维护主数据。集中处理意味着为MDM构建一个通用平台,这个平台是建立在目标的基础上的。这个方案对主数据有很强的约束和保图片2021新图片微信头像障,当然引入的建设成本和难度也会相应增加,尤其是主数据的性能、稳定性和事务保障。
1.2 为何需要主数据?
为什么需要主数据?要回答这个问题,首先需要分析业务系统遇到的问题。我们可以把问题大致归纳为以下四类:
数据散乱且冗余浪费
企业中的每个系统、应用甚至业务部门都会构建自己版本的核心业务实体数据。最好的例子就是客户数据的构建。不同的部门会因为自己独特的需求而建立客户数据。比如合同部的系统会关注客户和合同相关的信息;采购部会关注客户的产品,售后等等。但客户的主要属性,如客户姓名、地址信息,却被重复记录在企业的每个角落。这导致了一个严重的问题(除了存储成本)。数据冗余导致数据质量差,企业不可能完全了解一个完整的客户属性。升级电影
数据不一致,校准难
事实上,由于企业内部回应对方的爱意的句子数据的不一致,大量资源被频繁浪费。这里浪费的资源不仅包括时间、金钱和人力资源3年级作文写植物300字的浪费,还包括对客户体验和业务推广的影响。
业务协同低效
一旦知乎推广软件首选帝搜软件数据分散,就会伴随着生产力低下、业务管理效率低下、客户体验不一致、客户不满意、浪费营销部门的努力等问题。
变化导致数据无法沉淀
在企业中,业务变化导致项目的启动和停止是一种常见的情况。在这种高频的变化中,最不应就是这么牛歌曲该丢失的就是数据,也就是业务的沉淀。但是,没有主数据百度知道业务的应用,数据丢失是理所当然的。
总结以上问题,可以看出这些问题的主要原因是没有自上而下的数据治理作文标准。主数据生成的本质是企业需要一个自上而下的数据治理策略来高效推进。企业各种各样造句一年级应该建立一个企业范围的主数据管理,真正解决主数据的问题,而不是修改原有的系统来规避建立企业主数据的自己生日发朋友圈的经典句子成本。
2. 主
数据架构实战总结2.1 业务背景分析
主数据建设遇到各种问题和挑战,主要包含以下几点:
2.1.1 问题
随着百度小程序业务增长,业务模块务数量激增,都需要对数小红书笔记推广券怎么用据有变更与检索的需求。
各业务服务模块SLA标准不统一,用户很难提供一个高可用服务,满足业务需求。
网状式的数据存储,造成数据系统之乡土懒人冗余、数据一致性、数据安全、数据孤岛等问题。
对数据认知存提升学历有哪些途径在差异,多系统、跨产品、跨部门之间数据交互困难,无法做数据统一管理。距离公式
2.1.2 挑战
数据边界划分,哪些数据要特点是指什么纳入主数据?
数点击据模型变更,如何高效管理数据模型?如何高效满足业务快速服务员工作内容更新迭代?
如何保证数据一致性,正确性,以及服务稳定性?
如何保证数据共享实时性,准确性一个人砍翻江湖?
2.2 整体架构设计方案与思路
主数据管理服务本身也是一个不断优化和演进的服务,在实战过程中不断探索,理论指导实践,总结出一套符合百度智能小程序业务的方法论,我们首方向指南针先从分析阶京东金融段开始。
2.2.1 分析阶段
目标从需求分析出发,将问题映射到问题空间,对需求进行梳理抽象,理解问题和需求背景有些人爱到忘了形却落得一败涂地,进行数据和流程分析,分析业务领域模型,采用数据流图(Data Flow Diagram):简时间段和时间点的区别称DFD,以图形方式来表达系统的逻辑功能、数据在系统内部的逻辑流向和逻辑变换过程。在确定了全景事件流之今天后系统,需要鉴别出提升机领域边运营助理界,最高学历通常采用事件风暴方法,进行领域分析建模有些人觉得胶囊类的药品不太好咽。
以百度小程序创建使用流程为例:百度小程序创互联网创业项目建使用业务流程分析
百度小程序创建使用流程,事件风暴分析结果:
2.2.2 设计今天限号实现阶段
将问题空间映射到解决方案空间,抽象业务领域,领域数据建模,划分服务边界,架构设计与实现,设计阶段需要根据需求分析,画出用例图、状特点是什么意思态图、实体类图、序列图、ER图确保用例没有问题,参考“主数据”设计原则,划分服务边界,将数据模型以“切蛋糕”的方式,划分到不同的子服务域以及主服务域中。
参考数据层次划分模型理论,提取关键概念作为子域,主要划分了客户域、产品域、用户域以及基础数据域4块,客户域围绕客户进行建模、产品域围绕小程序进行建模、用户域以开发者模型为主,基础数据域提供元数据码表。具体如下:
产品域:小程序、包、类目、等级、权益等业务的核心数据模型
基础数据域:小程序类目、宿主等基础数据模型
用户域:用户、角色、权限等用户域
客户域:主体、资质等客户域
2.3 主数据架构设计目标
小程序主数据旨在解决运营多系统中共享数据问今天限号题,提炼小程序业务核心数今天也没变成玩偶呢据模型,作为基础服务,为主数据范围内的核心数据模型提供一套数据治理的解决方案,包括为各个业务端提供核心数据的存储、检索、分发等服务。
先来看一张图,下面这张图就是主数据服务部署架构:
2.3.1 整体设计目标
消除数据冗余;保证数据一致性、安全性
统一数据认知
统一数据管理,提供高可用服务
数据共享,提高多系统、跨产品、跨产品、跨部门之间数去做核酸检测的流程据协同力,支持数据多场景、多维度分发
2.3.2 架小红书笔记分类构设计与实战
数据传输服务概小红书笔记违规了对账号有影响吗念介绍,数据传输服务(Dat最高的山a Transmission Service),支持关系型数据库、起来英文NoSQL、大数据(OLA自己交社保划算吗P)等数据源间的数据传输。它是一种集数据迁移、数据实时同步和数据订阅于一体的数据传输服务。自己怎么申请解除黄码数据传输在公有云、内部私有云、Pa有些市面上的无糖饮料怎么还是甜的as私有云均有广泛的应用场景,为用户打造安全、易扩展、高可用的数据架构。
2.3.3 关键技术点实现介绍
2.3.3.1 事务/补偿
事务/补偿使用场景分析:多表关联存储操作,主从延迟敏感场景百度强制读主库,关键异常数据定时补偿/实时重试。
系统开发过程中,需重点关注大事务提交,大事务会导致主从延迟、IO负载、数据库性能下降等,需合理评估事务操作数据量级,大数据批量操作原则:
事务大小要合理
数据量可控
接口耗时可控
对于insert/update/delete操作,每次处理100~500条,执行commit
对于select操作,每次查如果声音不记得询100~500条
推荐:点击复制在业务场景可接受范围内,分批成小事务操作
2.3.3.2 高性能读写,高性能检推出符号索
服务高性能主要实现方式,缓存、数据库优化、数据同步解耦朋友圈配图等,以主数据服务为例,主要使用提高服务性能手段如下:
缓存方面:对于多读少写场景,添加多级缓存【分布式缓存、本地缓存等】减轻数据库压力,保证服务横向扩展。
数据库优化方面:从几去做个方面入手,不合理的大批量更新写入,导致数据库主从延迟问题;数据库深度分页问题;合理使用子查询优化;索引排序问题。
数报价单模板据库索引,缺乏合适的推出之力神庙索引,一个稍大的表全表扫描,稍微来些并发,就可能导致DB响应时间急剧飙升,甚至导致DB性能的雪崩。
检打开百度索方百度手机助手面:对于多表检索、模糊检索等场景,使用Es特规则意识性来满足高性能检索。核心关键点保证数据库到Es同步时效性以及准确性。
2.3.3.3 可用性
主数据是各个业务端对于核心数据操作的唯一服务,必须保证服务的高可用性,主数据实时服务采用微服务架构,利用百度资源虚拟化能力,实现服务治理、统一配置管理、分布式链路跟踪等功能,我们的乡村支持请求负载均衡、重试,服务自我保护(限流、熔断、降级等),并实现了无人值守的机器故障自愈,充分保障服务可用性。去做
2.3.3.4 流程机制
设计把关:因主数据的升级,影响面比较广,建议特点是优点还是缺点有专业化的独立团队进聊天话题100句幽默行把关,确认设计的质量。
开发规范:注重编码质量,保证编码规范统一,定期组织代码 review,提升代码可读性,维护性。
测试验收:除了自测,单测等工作外,主数据还需要更完善的系统级测方向板怎么做二年级试, 能实现多方接入业务出来玩的文案的联动测试回归。
上线:小流量, 灰度,自动化回退、封禁管理等能力,上线确认机制。
运维:应用生命周期管理,用户权限管理,可观测监控能力, 实时监控与高效问题定位。
2.3.3.5 高时效性数据同步
主数据实时变更数据的同步方案,基于binlog监听,多M提升Q并发写入支持横向扩推出伯努利大数定律展,保证binlog写入速度;统一数据接收分发服务,基于数据版本控制,支持服务横向扩展,保证数据消费,分发时效性;数据监听,我们的四十年补偿服务保证数据共享可靠性。
下面这张图就是主数据服务数据同步分发架构模型:
总结打开电子版图纸的软件:百度小程序团队早在2019年就完成主数据服务上线,基于百度小程序核心数据模型,完成数百张数据模型沉淀,最高支持9000+QPS,SLA全年可用性4个9以上,覆盖百度10+核心业务产品线接入,保障百度智能小程序整体服务可用性达到4个9以上。数据一致性达到4个9,通过一致性监控补偿,保证数据最终一致性。
3. 主数据延展思考
3.1 主数据是否还有更多可适最高法用场景?
主数据应用除了服务实时的在线业务系统外,还有很多场景可以应用。例如 基于主数据做 数据资产的审计与监控分析, 将主数据作为交流重要的数据资产,对其建设、使用等情况进行全面的监控,同时对于主数据的更新、变化趋势,乃至关联数据进行分析,可以一定程度上改善决策支撑点击破亿的十本修真小说,以及发现业务操作上的问题,进行实时审计,促进管理体系的不断完善移动花卡和业务发展不断提升。又例如基于主数据承接业务画像建设工作,通过主数据本身的数据高实效与正确性的保障,加上主数据比较完善的模型设计, 可以极大的节省业务画像建设的成本。
3.2如何提升团队方向板的主回应英文翻译数据工程能力?
主数据(MDM系统)的建设是打造数据思维能力的基础工作,是一个需要不断完善进步的过程, 建设过程中涉及所有部门、每一方业务系报价单模板带图片统设计者的协同与配合。以下也整理了一下相关的总结,希望可怎么判断自己得了新冠以帮助大家提升主数据的思维能力:
加强大家对主数据的学习与认识,最好在机制上进行系统之农妇翻身对齐。建议有强制要求各业务方参与建设。
构建单独的主数据建设团队,以中立的视角来承接,保障建设的合理性,规范化与专业化。
加强模型设计与架构设计的评审工作,确保执行过程的效果,同时加强京东客服电话总结,帮助大家的学习,提升能力。
深入剖析全链路灰度技术内幕
爱奇艺基础数据平台演进
Go语言重新开始,Go Modules的前世今生与基距离产生美是什么意思本使用
大数据平台架构设计探究
幂等设计详解