Pinot实时分布式的OLAP数据存储和分析系统
Pinot 是一个实时分布式的 OLAP 数据存储和分析系统。LinkedIn 使用它实现低延迟可伸缩的实时分析。Pinot 从离线数据源(包括 Hadoop 和各类文件)和在线数据源(如 Kafka)中攫取数据进行分析。Pinot 被设计是可以进行水平扩展的。
Pinot 特别适合这样的数据分析场景:分析模型固定,数据只追加以及低延迟,以及分析结果可查询。
关键特性:
面向列的数据库,提供多种压缩模式,如运行长度、固定比特长度
可插入式的索引技术,包括可排序索引、Bitmap 索引和反向索引
可根据查询和段元数据对查询和执行进行优化
近乎实时的从 Kafka 获取数据,以及批量从 Hadoop 获取数据
类 SQL 的语言支持查询、聚合、过滤、分组、排序和去重
支持多值字段
水平伸缩以及容错
Pinot 非常使用用来查询时许数据以及大维度的数组。
Pinot 的组件架构:
Pinot 核心概念:
示例查询:
/*Total number of documents in the table*/select count(*) from baseballStats limit 0/*Top 5 run scorers of all time*/ select sum('runs') from baseballStats group by playerName top 5 limit 0/*Top 5 run scorers of the year 2000*/select sum('runs') from baseballStats where yearID=2000 group by playerName top 5 limit 0/*Top 10 run scorers after 2000*/select sum('runs') from baseballStats where yearID>=2000 group by playerName limit 0/*Select playerName,runs,homeRuns for 10 records from the table and order them by yearID*/select playerName,runs,homeRuns from baseballStats order by yearID limit 1
关注公众号:拾黑(shiheibook)了解更多
赞助链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

随时掌握互联网精彩
- Win11通知系统已成广告位:微软频繁推广《使命召唤》、Microsoft 365等
- iPhone能通话录音了:iOS 18.1已更新
- Flat一款开源的在线协作白板软件
- 卢布汇率人民币2023年8月1日
- 中国联通唐永博:加速5G应用从样板间到商品房转变
- 投行警告:美国5G投入巨大作用有限,未能刺激用户转换运营商和升级资费
- 苹果独占全球手机市场 75% 利润;微信测试深度清理功能;Ubuntu 21.10 正式发布 | 思否周刊
- 超导量子优越性指日可待!62比特量子计算原型机“祖冲之号”问世
- 地铁禁用充电宝?一则意见稿让网友炸锅了
- 元宵 | 信创人专属灯谜,你猜对几个?
- 【大公司创新情报】华为发布首款商用台式机
- 环球晶圆拟45亿美元并购德国Siltronic AG,半导体领域大型并购再起