六安沧州西安三亚宝鸡菏泽
投稿投诉
菏泽德阳
山西湖州
宝鸡上海
茂名内江
三亚信阳
长春北海
西安安徽
黄石烟台
沧州湛江
肇庆鹤壁
六安韶关
成都钦州

你我他的中台从数据中台到中台

  本文先讲什么是数据中台、然后讲理想的数据中台的架构、再讲驾驭数据中台要懂的技术、并结合思维新地图判断数据中台会是下一个风口吗,最后讲从数据中台到AI中台是一种自然生长。
  拿着旧地图是不可能找到新大陆的!
  马云老师早些年在香港青年创业营上有公开说过DT,阿里巴巴也是较早构建数据中台的企业。但是马老师没说数据中台背后的目的和数据背后的力量。
  本文笔者先讲什么是数据中台、然后讲理想的数据中台的架构、再讲驾驭数据中台要懂的技术、并结合思维新地图判断数据中台会是下一个风口吗?最后讲从数据中台到AI中台是一种自然生长。
  一、什么是数据中台?
  1。中台概念的来源
  美军在二战时,以军来为单位作战;到了越战时,以营为单位作战;到了中东战斗的时候,以7人或者11人的极小班排去作战,这是今天最灵活的军事组织,也是核心竞争力和打击能力最强的一个组织。而美军之所以能灵活作战,敢放这么小的团队到前方,是因为有非常强的导弹指挥系统,有非常强大的中台能力,能支持这样的小团队快速做判断,并且引领整个打击。
  2。商业中台的演化
  随着阿里巴巴、华为的业务发展,平台业务线越来越多,例如:据笔者此前的一份调研,阿里巴巴旗下某中等BU(事业群),一年生产出来117款产品,顺利年终上线的有10几款,有社会知名度的有几款,被集团老板马老师记住的整个部门没有一款。
  分析产生这种问题的原因是,100多条产品线实际领到的任务均是为了大BU淘系服务,且针对淘系广告相关的服务,例如围绕直通车、钻展等服务的产品,并没有调动研发创造产品的团队积极性。
  所以阿里由美式中台演化到阿里组织中台,然后根据产品是长出来的而不是规划出来的随着阿里各个业务线数据的增长又由组织中台演化到数据中台,当然数据中台也不是阿里的最终目标。
  3。数据中台的广义定义
  数据中台是指通过数据技术,对海量数据进行采集、计算、存储、加工,同时统一标准和口径。数据中台把数据统一之后,会形成标准数据,再进行存储,形成大数据资产层,进而为客户提供高效服务。
  这些服务跟企业的业务有较强的关联性,是这个企业独有的且能复用的,它是企业业务和数据的沉淀,其不仅能降低重复建设、减少烟囱式协作的成本,上面的阿里巴巴100多个同系列产品同时服务一个淘系就属于烟囱式。
  广义的数据中台包括了数据技术,比如对海量数据进行采集、计算、存储、加工的一系列技术集合,时下我们谈到的数据中台包括数据模型,算法服务,数据产品,数据管理等等,和企业的业务有较强的关联性,是企业独有的且能复用的,比如企业自建的2000个基础模型,300个融合模型,5万个标签。
  数据中台广义上是企业业务和数据的沉淀,其不仅能降低重复建设,减少烟囱式协作的成本,也是差异化竞争优势所在。
  二、理想的数据中台架构
  我们都知道远洋运输中,不论什么合法货物都能装进集装箱里,集装箱就是很好的架构,类似理想的数据中台架构如下图:
  通过以上架构图,可以看出,数据中台模式有以下一些特点:
  首先是对全域数据的吸收与存储,实现对企业中各业务类别数据的整合和集中化管理。
  其次是按照规范化的数据架构(数据仓库规划、数据模型构建、指标定义规范等)统一研发数据,实现数据口径、数据模型标准化。
  再次是建立业务需求驱动的几大数据体系,深度萃取数据价值。
  最后是集成数据资产管理能力,从数据的运营、应用、管理、分析、可视化五方面统一管理数据资产。
  三、数据中台需要懂的技术
  1。技术切入点是从构建数据仓库各种数据平台的技术入手
  数据仓库的构建如下图:
  上图可见,最左侧数据源这点很好理解,但是很难办理实现。因为数据有个特点是每家的数据有每家的业务特征,但是这些特征难以团聚,即数据孤岛!
  ETL:ETL分别代表:抽取extraction、转换transformation、加载load。抽取(Extract)是从数据来源提取指定数据,数据是需要指定的。转换(Transform)是将数据转换为指定格式并进行数据清洗保证数据质量。加载(Load)是将转换过后的数据加载到目标数据仓库。
  DM:数据集市可以理解为是一种小型数据仓库,一般面向部门、单个主题或特定应用,且之间互不影响。
  ODS:全称是OperationalDataStore,操作数据存储。存储各大业务型数据库ETL后的数据,是最接近数据源中数据的一层,主要目的是为了数据集中。总体上大多是按照源业务系统的分类方式而分类的,因此会具有鲜明的业务数据库的特征,甚至还具有一定的关系数据库中的数据范式的组织形式。但是不等同于原始数据,数据格式按照数仓要求统一,并经过简单的清洗。
  2。技术实操点
  (1)实操数据存储
  起源数据治理平台管理的数据存储范围包括:数据仓库中的Topic层和数据应用层,存储方式包括:Hive、MySQL、Kylin、Palo、ES、Druid。
  如下图所示:
  上图所示的这些数据存储中的数据的加工过程,由数据开发工程师负责,具体采用哪种存储介质,由数据开发工程师综合所需数据存储空间、查询效率、模型的组织形式等因素决定。但后续的使用维护都由起源数据治理平台管理,管理方式是通过管理这些数据表的元数据信息和查询实现。
  数据存储托管之后,数据表元数据信息变更监控、表数据生产(存储空间、生产状态及完成时间)监控、表数据波动(同环比等)监控以及表的使用(模型的构建及查询效率等)监控及评估,都由起源数据治理平台自动完成,所有信息的变动都会自动周知对应的负责人,保证数据应用的安全和稳定。
  (2)实操元数据管理
  元数据信息宏观上包括两大部分:业务元数据信息和数据元数据信息。
  其中业务元数据信息包括:指标业务定义、维度的业务定义等;
  数据元数据信息包括:数据表元数据信息、模型元数据信息、维表与维度的绑定关系、数据模型字段与指标的绑定关系。
  起源平台为了实现元数据信息的管理,设计了四个模块实现,分别是:数据表管理模块、模型管理模块、指标管理模块、维度管理模块。元数据管理是起源数据治理平台的核心,起源平台就是通过控制好元数据,来驱动数据的生产和消费。
  (3)实操数据表管理模块
  数据表管理模块管理了数据库信息和数据表信息,其中数据库信息包括数据库链接信息,数据库信息维护后,起源数据治理平台自动获取对应库中表的元数据信息。
  数据表信息包括:表的元数据信息(引擎、字段等)、表类型(维表或事实表)、表的使用情况(是否被模型使用)、表对应的ETL、表的负责人、表的推荐度、描述信息、表的监控配置及报警历史、以及样例数据等。上述这些信息为业务用户提供指导,为模型管理提供数据支持,为数据表和数据的稳定提供监控和预警。
  (4)实操维度管理模块
  维度管理模块包括基础信息和技术信息,对应着不同人员维护。其中基础信息对应维度的业务信息,由业务管理人员维护,包括维度名称、业务定义、业务分类。技术信息对应维度的数据信息,由数据开发工程师维护,包括是否有维表(是枚举维度还是有独立的维表)、是否是日期维、对应code英文名称和中文名称、对应name英文名称和中文名称。
  如果维度有维表,则需要和对应的维度表绑定,设置code和name对应的字段;如果维度是枚举维,则需要填写对应的code和name。维度的统一管理,有利于以后数据表的标准化,也方便用户的查看。
  (5)指标管理模块
  指标管理模块核心包括基础信息和技术信息管理,衍生信息包括关联指标、关联应用管理。基础信息对应的就是指标的业务信息,由业务人员填写,主要包括指标名称、业务分类、统计频率、精度、单位、指标类型、指标定义、计算逻辑、分析方法、影响因素、分析维度等信息;基础信息中还有一个比较重要的部分是监控配置,主要是配置指标的有效波动范围区间、同环比波动区间等,监控指标数据的正常运行。
  技术信息构成比较复杂,包括数据类型、指标代码,但是核心部分是指标与模型的绑定关系,通过使用演进形成了当前系统两类绑定关系:绑定物理模型和构建虚拟模型。
  绑定物理模型是指标与模型管理中的物理模型字段绑定,并配置对应的计算公式,或还包含一些额外的高级配置,如二次计算、模型过滤条件等;
  创建虚拟模型是通过已有指标和其对应的物理模型,具体步骤首先配置已有指标的计算方式或指标维度的过滤,然后选择指标已绑定的物理模型,形成一个虚拟模型,虚拟模型的分析维度就是所选指标基础模型的公共维度。
  从以上实操来看,产品、运营、技术、业务人员是相互配合完成数据中台的实操,当然了在这里如果某一个岗位人员的技能和经验丰富一些,不排除以人身兼多职的可能。更多相关实操知识点可以参考笔者的书籍《AI赋能:AI重新定义产品经理》。
  四、数据中台会成为下一个风口吗?
  数据中台会不会成为下一个风口,首先笔者本人不赞成风口轮,更支持一个事物长期的价格是由其本质的价值决定的观点。其次目前的数据中台从产品上看是融合了各种数据源,经过ETL技术处理供给给有限的纯商业变现目的。再则数据中台的各个技术模块日趋成熟,稀缺的是数据的吸取和数据的资产变现模式。
  所以,一方面看数据中台是刚刚兴起,这股兴起即使是技术团队也是兴起不久,例如:笔者早些时候在一所名校的CS技术群里讨论过数据中台,然后再过一段时间是产品开始讨论,然后就会是运营讨论,随后市场销售也会跟上。
  下图为笔者早期在技术群里讨论数据中台技术图:
  数据中台的技术有原来的,也有创新的,但是整体比较成熟,剩下的是在业务切入方式上,例如:架构齐全,但是数据值缺失、数据孤岛等等情况才是现实问题。不论数据中台是不是下一个风口,数据中台的产品都将运行下去,尤其是数据中台的思维理念是:数据共享。这样美好的理念值得人人都需要一个数据中台。
  五、数据中台与AI中台
  AI中台是一个用来构建大规模智能服务的基础设施,对企业需要的算法模型提供了分步构建和全生命周期管理的服务,让企业可以将自己的业务不断下沉为一个个算法模型,以达到复用、组合创新、规模化构建智能服务的目的。
  从数据中台演进到AI中台!
  从AI中台落地实施的方式来看,AI中台可以是数据中台的进一步延伸,从数据中台一步一步演进过去。
  首先,从基础设施角度,可以将数据中台智能化所谓的智能化,是指将在数据中台进行的一系列的数据服务构建操作进行智能化实现,让数据的接入、存储、分析展现、训练、到构建管道(pipeline)都更加自动化。
  例如:对于通用的CICD来说,测试不过则会构建失败,那对于AI中台下,就要考虑一个推荐模型构建失败的条件是什么?
  答案可能是本次模型的准确率低于上一次构建的准确率的时候,CI应该被构建失败。
  在实践中,这可能是CI构建过程的维度之一,还会有很多其他指标和维度。我们就需要在现有的数据平台的CI中,实现并自动化这些指标和维度,使之更加智能化。更多AI应用案例可见笔者新书《AI赋能:AI重新定义产品经理》。
  其次,对于我们可想而知数据中台使从来不是目的,数据中台的目的是将数据变成数字资产。这种资产如果仅仅用来租赁,肯定不如智能的应用价值更高,这也是从数据中台到AI中台的第二点原因。
  第三、目前的数据中台的终端应用以直接2C以产生刚性的订单为主。而我们并不确定这个推荐是否由数据中台的引擎发挥了人性的作用,而智能应用层直接面向终端,怎么利用元数据等功能,组合各自不同模型提供的服务,构建出组合效应的创新服务才能更懂用户的人性。
  总结
  不论数据中台会不会是下一个风口!不论业务、运营、技术和产品,如何讨论的中台多么热门,也不用管多少大佬提及过。你只需要懂中台中该掌握的思维、技术、实操。然后明白我们开头的那句话:拿着旧地图是不可能找到新大陆的!你就能做出智能中台。
  下次继续分享智能中台实操案例。
  如果你想系统化入门AI产品经理,掌握AI产品经理的落地工作方法,戳这里amp;gt;http:996。pm7bjab

恶搞名词地震:地球生气了,大地也吓得心惊肉跳。灰尘:不要看我小,往你眼睛里吹进一粒,你就受不了;但你的肺可能宽容一些,但时间长了也会受不了。责任:任务重,干不好要问责,干好……别样红楼之宝玉之子话说宝玉与宝钗大婚两年之后,宝钗生下一个男娃;宝玉一开始喜不自胜,但后来又很不高兴了,因为这孩子怎么看怎么都不像自己!于是,宝玉抱着孩子来找大观园医院的医生咨询。医生:宝……人工心脏可以活多久换人工心脏需要多少钱在人的身体构造中最重要的部分除了大脑就是心脏了,心脏是推动全身血液的循环的关键,整个人体的发动机,目前来说人工心脏的移植手术不是那么完善,移植之后人工心脏的成活率也不高而且价格……世界上最记仇的动物大象报仇十年不晚小时候听村里的老人们讲过一个故事,有户人家家里的鸡被黄鼠狼偷走了。于是设置陷阱用夹子夹死了黄鼠狼,结果麻烦了。从那之后,这户农民家里天天晚上都黄鼠狼来作怪,把农民家小时候……中国最神秘的古书青囊书揭秘青囊书被毁之谜华佗之死导语:中国文化源远流长,留下了很多瑰宝和财富。其中书籍是十分重大的财富,但是可惜的是有很多书籍都已经失传了,今天探秘志小编就给大家讲讲一本十分神秘的书籍青囊书,看看这本书的特别……红茶情诗闲人爱茶作品红茶情诗晚秋,繁华渐谢,红肥绿瘦。山坡上,那一片片火红的枫林,婀娜柔美,娇艳瑰丽。微风中摇曳的枫叶,那一抹抹明妍的酒红,迷眼醉心,将整个秋天点缀的华丽绝伦,让……国产手机集体攻入欧洲能否复制印度市场的成功日前,在收割完印度市场之后,国产手机有了新的战略目标地欧洲。国产手机在过去几年的时间,在欧洲市场似乎并没有多少身影,但在今天,国产手机目前正在筹谋大举进军欧洲市场。viv……为什么你的产品卖不动营销是艺术的,执行是有流程的。每家企业所处的背景不同,拥有的资源不同,因此在营销进程中,相同的品类产品可能会出现不同的销售结果。成功的规律虽可以总结,但成功的经验无法复制。尤其……鲜芦荟的美容方法鲜aclasstaghrefwiki10343IadRHIs。html芦荟a具有美容、养颜的作用。下面,我们来看看鲜芦荟的美容方法吧。操作方法01:hr直接涂抹……身体上出现个信号就说明你的血液黏稠操作方法01:hr血液粘稠度增高简单说来就是血液不容易流动了,不仅仅会造成器官的供血不足而影响器官的生理功能,而且血管内容易出现血栓。因此,出现了以下的状况,一定要警惕了……体育兴校文化立人2016年均衡创建中,学校按照国家标准,建设了体育室、音乐室、美术室、图书室等9室。各室设备精良,管理规范,满足了师生上课的需求,促进了素质教育的发展。2018年,我校在……达克效应越外行越自信生活中,我们常常听到这样的言论:公司年会上,你的同事作为优秀员工上台领奖发表感言时,旁边总有人会发出酸味的言论,他能力也没那么强,我要是稍微努力一点,做得比她更好,他是和领导关……
勤劳节俭倡议书尊敬的各位家长、亲爱的小朋友们:你们好!在这春暖花开、万物复苏的时节,我们即将迎来4月23日的世界读书日暨第三届读书节活动。歌里唱得好,读书好像蜜蜂采蜜,那就让我们做一只……熟悉的地方也有风景爸爸妈妈是我们最熟悉的人,最熟悉的人组成了让我留恋感动的风景。风景中的爸爸严厉但又不缺少慈祥。风景中的妈妈温柔但又不缺少细致。爸爸妈妈就是我永远都不厌其烦地欣……春天的气息春天悄悄地来到了我的身边。你会发现,大树长出了绿叶,花儿开始绽放自己美丽的容貌。乌龟结束了冬眠之旅,开始了新的游戏。春天的公园,充满了青草的气息,花的清香。走进去,冬天那……春游毛州岛在桂林漓江这条华丽的锦缎上,镶着一块美丽的明珠。它以秀丽如画的山水,纯朴的风土人情,绚丽的花卉,闻名于全中国。我和爱跳舞的春姑娘来到了著名的毛州岛。来到小岛,首先迎进我眼……善良使生活更精彩生而为人,具备高尚的品德才有更大的机会让生命绽放光彩,令人尊敬喜爱。就像绽开的花朵,香远益清,令蜜蜂去留恋向往。高尚的品德,其中很重要的一点就是善良。因此,我们也要学会将……冬天和我有个约会冬天,雪花飞舞,顿时白茫茫的一片。在这大学纷飞的日子里,我和冬天还曾有个约会。寒假,我坐车去乡下,路上那美丽的雪景,让我陶醉。不知不觉中,便到了乡下。一到乡下,我找来小伙……我是大自然的一员我是一棵小树,被人们种在这片肥沃的草地上,充沛的雨姐姐沐浴着我,大地妈妈用身躯滋养着我,我的身边有花妹妹还有草弟弟,我快乐地生活着。岁月悠悠,我从小树苗长成了枝繁叶茂的参……一支笔的自述我是一支笔,我的主人是覃老师,一到星期六、星期天我就很繁忙。不信的话我就告诉你吧!星期六又到了,该是我上场的时候了。刚开始我的主人在黑板上画了一个滑稽的小丑。主人在黑板上……写给妈妈的一封信【写给妈妈的一封信】灵溪六小三年级张明泽亲爱的妈妈:您好!您现在累吗?累的话赶紧去休息,谢谢您给我这么富裕的生活,还让我有了无忧无虑的生活。但是,……奶奶我想对您说亲爱的奶奶:您好!奶奶,其实我一直有一句话想跟您说,每次我都吃好了熊心豹子胆想跟您说,可是又怕您生气,说我是一个不听话的孩子。所以每次快从口中跑出的话,又快速地滑入……有趣的淘书会【篇一:有趣的淘书会】张亦珂时光飞逝,光阴似箭。不知不觉一年一度的读书节到来了,这已经是我们城南小学的第五届读书节了。其中,最令最我向往的就是淘书会这个活动。……一本珍贵的书窗外,火红的太阳照耀着大地,放射出万道金光;悠悠白云在空中飘动,如羽毛般轻盈。教室里,老师正津津有味地讲着他的课。刚开始我们都听得很认真,渐渐地,我感到非常无聊,便看起了抽屉里……
友情链接:易事利快生活快传网聚热点七猫云快好知快百科中准网快好找文好找中准网快软网