最新最快科技资讯
太阳能光伏网

Apache Doris 从 Apache 孵化器毕业,正式成为 Apache 顶级项目!

全球最大的开源软件基金会Apache软件基金会(以下简称Apache)于美国时间2022年6月16日宣布,Apache Doris成功从Apache孵化器毕业,正式成为Apache顶级项目(Top-Level Project,TLP)。

Apache Doris是一个基于MPP的现代化、高性能、实时的分析型数据库,以极速易用的特点被人们所熟知,仅需亚秒级响应时间即可返回海量数据下的查询结果,不仅可以支持高并发的点查询场景,也能支持高吞吐的复杂分析场景。基于此,Apache Doris在多维报表、用户画像、即席查询、实时大屏等诸多业务领域都能得到很好应用。

Apache Doris最早是诞生于百度内部广告报表业务的Palo项目,2017年正式对外开源,2018年7月由百度捐赠给Apache基金会进行孵化,之后在Apache导师的指导下由孵化器项目管理委员会成员进行孵化和运营。

“我们很自豪Doris能够顺利从Apache孵化器毕业,这是一个重要的里程碑。在整个孵化阶段,依靠Apache理念的指导和孵化器导师的帮助,我们学会了如何以Apache的方式去发展我们的项目与社区,也在这一进程中获得了巨大的成长。” Apache Doris VP陈明雨说道。

目前Apache Doris社区已经聚集了来自不同行业近百家企业的300余位贡献者,并且每月活跃贡献者人数也接近100位。在孵化期间,Apache Doris一共发布了8个重要版本,完成了包括存储引擎升级、向量化执行引擎等诸多重大功能,并正式发布了1.0版本。正是依靠这些来自开源贡献者的力量,才使得Apache Doris取得了今天的成绩。

与此同时,Apache Doris如今在中国乃至全球范围内都拥有着广泛的用户群体,截止目前,Apache Doris已经在全球超过500家企业的生产环境中得到应用,在中国市值或估值排行前50的互联网公司中,有超过80%的公司长期使用Apache Doris,包括百度、美团、小米、京东、字节跳动、腾讯、快手、网易、微博、新浪、360等知名公司。同时在一些传统行业如金融、能源、制造、电信等领域也有着丰富的应用。

“你可以基于Apache Doris快速构建一个简单易用并且性能强大的数据分析平台,非常易于上手,所需要付出的学习成本非常低。并且Apache Doris的分布式架构非常简洁,可以极大降低系统运维的工作量,这也是越来越多用户选择Apache Doris的关键因素。”

作为一款成熟的分析型数据库项目,Apache Doris有以下优势:

-性能优异:自带高效的列式存储引擎,减少数据扫描量的同时还实现了超高的数据压缩比。同时Doris还提供了丰富的索引结构来加速数据读取与过滤,利用分区分桶裁剪功能,Doris可以支持在线服务业务的超高并发,单节点最高可支持上千QPS。更进一步,Apache Doris结合了向量化执行引擎来充分发挥现代化CPU并行计算能力,辅以智能物化视图技术实现预聚合加速,并可以通过查询优化器同时进行基于规划和基于代价的查询优化。通过上述多种方式,实现了极致的查询性能。

-简单易用:支持标准ANSI SQL语法,包括单表聚合、排序、过滤和多表Join、子查询等,还支持窗口函数、Grouping Set等复杂SQL语法,同时用户可以通过UDF和UDAF等自定义函数来拓展系统功能。除此以外,Apache Doris还实现了MySQL协议兼容,用户可以通过各类客户端工具来访问Doris,并支持与BI工具的无缝对接。

-架构精简:系统只有两个Frontend(FE)和Backend(BE)两个模块,其中FE节点负责用户请求的接入、查询计划的解析、元数据存储及集群管理等工作,BE节点负责数据存储和查询计划的执行,自身就是一个完备的分布式数据库管理系统,用户无需安装任何第三方管控组件即可运行起Apache Doris集群,并且部署和升级过程都非常简易。同时,任一模块都可以支持横向拓展,集群最高可以拓展到数百个节点,支持存储超过10PB的超大规模数据。

-稳定可靠:支持数据多副本存储,集群具备自愈功能,自身的分布式管理框架可以自动管理数据副本的分布、修复和均衡,副本损坏时系统可以自动感知并进行修复。节点扩容时,仅需一条SQL命令即可完成,数据分片会自动在节点间均衡,无需人工干预或操作。无论是扩容、缩容、单节点故障还是在升级过程中,系统都无需停止运行,可正常提供稳定可靠的在线服务。

-生态丰富:提供丰富的数据同步方式,支持快速加载来自本地、Hadoop、Flink、Spark、Kafka、SeaTunnel等系统中的数据,也可以直接访问MySQL、PostgreSQL、Oracle、S3、Hive、Iceberg、Elasticsearch等系统中的数据而无需数据复制。同时存储在Doris中的数据也可以被Spark、Flink读取,并且可以输出给上游数据应用进行展示分析。

“‍毕业不是最终目标,它是新征程的起点。”陈明雨说到。“在过去,我们发起Doris的目标是为更多人提供体验更佳的数据分析工具、解决他们数据分析的难题。成为Apache顶级项目一方面是对Apache Doris社区过去所有贡献者一直以来辛勤工作的肯定,另一方面也意味着我们在Apache Way的指引下建立了一个强大的、繁荣的、可持续发展的开源社区。未来我们将会继续以Apache方式运作社区,相信会吸引到更多优秀的开源贡献者参与社区中来,社区也会在所有贡献者的帮助下得到进一步成长。”

“Apache Doris后续将开展更多富有挑战且有意义的工作,包括新的查询优化器、对湖仓一体化的支持,以及面向云上基础设施的架构演进等等。欢迎更多的开源技术爱好者加入Apache Doris的社区,携手共成长。”

“我们再次由衷地感谢所有参与建设Apache Doris社区的贡献者们,以及所有使用Apache Doris并不断提出改进建议的用户们。同时也感谢一路走来,不断鼓励、支持和帮助过我们的孵化器导师、IPMC成员以及各个开源项目社区的朋友们。”

关于SelectDB

SelectDB是一家开源技术公司,致力于为Apache Doris社区提供一个由全职工程师、产品经理和支持工程师组成的团队,繁荣开源社区生态,打造实时分析型数据库领域的国际工业界标准。基于Apache Doris研发的新一代云原生实时数仓SelectDB,运行于多家云上,为用户和客户提供开箱即用的能力。

最新相关

礼来与普渡大学扩大合作拟投资2.5亿美元

礼来公司与普渡大学今日宣布深化长期合作关系,礼来计划未来8年投资2.5亿美元。此合作或成美国最大产学研协议,推动医药创新与技术研发。免责声明: 本文内容由开放的智能模型自动生成,仅供参考。

白宫贸易顾问纳瓦罗发表最新贸易观点

5月9日,白宫贸易顾问纳瓦罗表示市场将面临不确定性,并称日本在保护自身市场方面表现突出。同时透露美国计划增加对英国的牛肉、家禽和乳制品出口,强调欧盟在贸易谈判中具有高优先级。此番言论...

润欣科技控股股东计划减持不超过3%股份

5月9日,润欣科技发布公告称,公司控股股东计划在未来六个月内减持不超过公司总股本3%的股份。此次减持旨在优化股权结构,满足股东自身资金需求。具体减持方式和时间将根据市场情况决定。此举有...

波罗的海干散货指数下跌1.29%至1299点

5月9日,波罗的海干散货指数(BDI)下跌1.29%,收于1299点。该指数反映全球干散货航运市场的运价水平,此次下跌主要受海运需求波动影响,显示出近期市场活跃度有所下降。免责声明: 本文内容由开放的...

智元主办机器人比赛奖金池达6万美元

5月9日,智元机器人与OpenDriveLab联合主办的AgiBot World Challenge赛事开启报名,比赛定于5月26日启动。本次赛事面向全球开发者,聚焦机器人在复杂环境下的精细操作能力及具身场景下世界模型生...

山东墨龙股东智梦控股减持2881万股H股

5月9日,山东墨龙股东智梦控股通过证券交易系统以集中竞价方式减持2881万股H股股份,占公司总股本3.61%。此次减持后,智梦控股持有山东墨龙1600万股,占总股本2.01%。此举或为优化资产配置,具体原...

迈为股份股东拟转让556.7万股

9日晚间,迈为股份发布公告称,股东苏州迈拓创业投资合伙企业计划转让556.7万股,占公司总股本2.00%。本次转让将通过询价方式进行,受让方为机构投资者,且受让后6个月内不得转让。此举旨在优化股...