elt 虚拟货币
这是大数据技术扫盲系列的第四篇【什么是ELT】
全文1000字,阅读需要5分钟
一、什么是ELT?
ELT是抽取(Extract)、加载(Load)、转换(Transform)的缩写。
数据抽取:ELT pipeline的起始端,字面含义不做解释,在架构数据抽取方案时,有两个关注点,第一个要对多数据源类型、多种数据结构保持一定的灵活性和适配,比如关系型数据库的结构化数据、XML、JSON、文本文件、API、消息流等;第二个是对增全量模式的支持,支持通过SQL查询的方式对增量数据进行抓取(物理删除无法捕获的风险)、通过变更日志的CDC增量抓取、全量抓取。
数据加载:ELT pipeline的目标端,可以是一个集中的数据库、数据仓库、数据湖。在这部分,需要关注,第一个注意数据写入的模式是追加还是覆盖,这个取决于约定的同步模式。尽量支持流程的幂等执行。第二个注意加载的数据和源端保持一致,作为贴源层。第三是方案需要考虑支持多点加载,即一次抽取分发多个目标端。
数据转换:将加载后的数据做加工,一般包括数据清洗和结构化处理、数据校验、数据关联、数据增强。
二、为什么不是ETL?
我们所熟知的是ETL,抽取、转换、加载,即数据在落地到目标端前做数据的转换操作。在现代数据技术栈中,提倡更多的是ELT,主要的原因有两个:
第一个是ELT比ETL有更广的适用范围:在当下数据平民化的趋势下,一份数据往往要应对更灵活的需求,意味着数据要尽量保证原汁原味。在抽取过程中转换,原始数据中有信息丢失,也意味着这个数据所能应用的场景已经被提前设计,在需求发生变化时,需要做调整。
第二个是存储和计算成本的不断降低,ETL自1970年出现后,在转换中裁剪数据,以减少下游在数据处理中对存储和计算资源的损耗。但当下存储成本和计算成本逐步降低,对海量数据的存储和计算不再昂贵,也使ELT成为更优选择.
相关内容
相关资讯
-
用友财务报表生成(如何用用友软件生成财务报表)
这是在线使用的云会计财务软件,财务报表自动生成,只需录入凭证后,资产负债表、利润表、现金流量表就会自动计算,实时生成,还有总账、明细账、科目余额表等各类账簿也会实时生成,对于广大会计人员和小企业来说,
-
证券投资中的数学(证券投资中的数学结题报告ppt)
经济学:重理论轻实践,本科很难就业,适合性情沉稳、爱研究、数学、英语功底较好的同学,未来就业方向对院校层次有较高的要求
-
ASD币是哪个交易所的平台币?一文了解AscendEX
被称为「2020最火」的AscendEX不断取得突破,相继为机构启动专线接入服务、上线Staking产品和DeFi挖矿产品、开启BitMax「大航海计划」与100多个头部全球加密社区建立合作关系,并上
-
正规虚拟币平台?正规虚拟币平台排名
虚拟货币投资交易正规平台,国内都有哪些中国最大的虚拟货币交易平台是比特币交易平台,知名度最高的三家是比特币中国、okcoin、火币网
-
方正中期期货if合约多少钱,方正中期期货app下载
方正言文祥E356开机总要按F1怎么办开机需要按下F1键才能进入,主要是因为BIOS中设置与真实硬件数据不符引起的,可以分为以下几种情况:1、实际上没有软驱或者软驱坏了,而BIOS里却设置有软驱,这样
实时快讯
-
2023-09-08虚拟货币差别太大(有什么本质区别吗?)
-
2023-09-08社保基金投资哪些股票了(社保基金投资的股票有哪些)
-
2023-09-08黄金强支撑位(黄金支撑线和压力线的确定)
-
2023-09-08虚拟货币2022牛市行情 什么方向最挣钱?
-
2023-09-08用友代理商 安徽(代理用友软件太难了吧)
-
2023-09-08广西社保年审软件(广西社保认证一年认证几回)
-
2023-09-08庞庄(庞庄小学)
-
2023-09-08北京万达信息股份有限公司(北京万达集团股份有限公司)