20
2021
01

列存储的特点

 因为每个字段的数据聚集存储,在查询只需要少数几个字段的时候,能大大减少读取的数据量;每个字段的数据类型一定是相同的,列式存储可以针对性的设计更好的设计压缩算法。 select 某些字段效率更高


TEXTFILE和SEQUENCEFILE的存储格式都是基于行存储的;


ORC和PARQUET是基于列式存储的。

« 上一篇 下一篇 »

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。