字节跳动开源BitSail,助力企业走好数字化“第一步”

10月26日,字节跳动宣布开源BitSail数据集成引擎。BitSail意为“数据航行”,可支持二十余种异构数据源间的数据同步,提供离线、实时、全量、增量场景下的全域数据集成解决方案,从而打通困扰企业数字化转型的“数据孤岛”,帮助企业用户更有效地发挥数据资产价值。
BitSail开源地址:https://github.com/bytedance/bitsail
据悉,BitSail起源于2018年。当时字节跳动的业务场景日益复杂,数据源越来越多,数据量更是呈爆发式增长。为了支撑公司业务快速发展,字节跳动数据平台团队开始自研数据集成引擎。

数据集成引擎技术架构图
新引擎最初基于Apache Flink实现,历经多年持续改进和创新,现已具备批式集成、流式集成和增量集成三类同步模式,并支持分布式水平扩展和流批一体架构,在各种数据量和各种场景下,一个框架即可解决数据集成需求。此外,BitSail采用插件式架构,支持运行时解耦,从而具备极强的灵活性,企业可以很方便地接入新的数据源。
目前,BitSail不仅服务于抖音、今日头条等字节跳动内部业务,也服务了火山引擎多家企业客户,其稳定性、数据传输质量和运维成本等方面经过“千锤百炼”,已经具备较高的产品成熟度。
数据显示,BitSail在字节跳动内部每天的任务量超过20万,传输的数据行数超过百万亿行,其中单批任务达到千亿行、单流任务达到千万QPS,支持10分钟级延迟SLA。通过在火山引擎的云原生环境和客户专有云环境等不同场景的打磨,在确保数据传输安全性的同时,BitSail的功能细节和性能得到进一步优化,可以满足企业绝大部分使用需求。
自2015年至今,字节跳动已开源了50多个项目,早期大多为工程师个人兴趣驱动。今年5月,字节跳动宣布成立开源委员会,为技术开源引入公司级的策略、规范与流程机制。BitSail项目负责人表示,做好开源的“北极星指标”,在于真实落地,帮助开发者在生产环境或实际业务中创造价值。BitSail会持续夯实基础能力,并结合内外部业务实践输出更多创新的特性,帮助企业用户走好数字化“第一步”。
— 推荐阅读 —
☞汇编语言创始人 Kathleen Booth 去世,享年 100 岁! ☞华为前三季研发费用超1100亿;微软CEO纳德拉获得10%的加薪,年薪近4亿元;PHP 8.1.12 发布|极客头条 ☞蚂蚁规模化平台工程实践一年多,我们学到了什么?

-
TikTok将在美国成立合资公司维持运营!我国商务部回应
据央视新闻报道,在今日商务部举行的例行新闻发布会上,有记者问:据报道,TikTok已与三家投资者签署协议,并将成立新的TikTok美国合资公司,确保其继续在美运营。请问发言人对此有何评论?商务部新闻发
-
VeOmni – 字节跳动开源的全模态PyTorch原生训练框架
VeOmni 是字节跳动 Seed 团队开源的全模态分布式训练框架,基于 PyTorch 设计。VeOmni 以模型为中心,将分布式并行逻辑与模型计算解耦,支持灵活组合多种并行策略(如 FSDP、SP
-
字节跳动静态资源公共库因黑产原因下线 此前部分资源已经中断数月
从 2025 年 6 月份开始就有诸多站长发现字节跳动旗下的静态资源公共库(https://cdn.bytedance.com/)存在调用问题,包括部分资源连接超时或者直接 HTTP 404,这导致网
关注公众号:拾黑(shiheibook)了解更多
赞助链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
关注网络尖刀微信公众号随时掌握互联网精彩
- MonkeyOCR:最快1秒狂扫1000页
- 【有料视频】到底都是什么人在换新手机?
- 学习了,女子通过WiFi名称跨60公里寻回手机
- 欧元人民币汇率2023年8月24日
- 哈啰顺风车:全年完单1.5亿次 四年来累计碳减排660万吨
- moto razr 2022全面评测:竖折如何做到体验拉满?
- 抑制锂电池涨价:一个系统工程
- 20 年的 Debian 开发者被排挤出项目;操作系统 “火龙” 被质疑抄袭;Swift 5.6 发布 | 思否周刊
- 顺丰董事长王卫因预亏致歉;徐直军新任华为云董事长;滴滴出行据悉已在美国秘密提交IPO申请|Do早报
- 中欣晶圆启动12英寸硅片产能扩充计划
- 京东健康港交所上市,募资265亿港元;华为发布首款商用台式机;小米11正式入网 支持最高55W快充全球首发骁龙888【DO说】
- 长盈科技与统信UOS完成互认证



微信扫码关注公众号