文档数据库已成为生成式AI时代日益重要的技术类型。
文档数据库是一种NoSQL数据库,它不像传统关系型数据库那样依赖行列结构,而是采用JSON(JavaScript对象表示法)格式。当前市场存在多个文档数据库供应商,包括采用闭源专有技术的MongoDB。为打破市场垄断,微软今年1月将其自主研发的DocumentDB数据库开源,本周该项目正式移交Linux基金会,并获得了微软云竞争对手AWS和谷歌的联合支持。
此举创建了首个厂商中立、可替代MongoDB的开源方案,既能降低企业成本,又能规避供应商锁定风险。文档数据库对AI应用的聊天、上下文记忆等功能至关重要。
"AI应用的核心是半结构化数据处理,这正是文档数据库的专长所在,"微软副总裁兼DocumentDB首席架构师Kirill Gavrylyuk向VentureBeat表示,"但当前文档数据库领域缺乏像PostgreSQL之于关系型数据库那样的开源标准引擎。"
在Linux基金会兑现开源文档数据库的承诺
微软于2025年1月首次开源DocumentDB项目。
该项目托管在GitHub的微软组织下,一年来持续引发行业广泛关注。开源项目不仅关乎代码许可,更关乎社区共建。
"在Linux基金会的治理下,DocumentDB将获得厂商中立性和更广泛的协作优势,"Gavrylyuk表示。
微软并非简单移交代码。Gavrylyuk强调微软将持续投入项目资源,并在技术指导委员会保持重要席位以主导项目愿景。
"通过加入中立的Linux基金会,我们希望吸引更多开发者共同塑造项目方向,"Gavrylyuk说,"更重要的是向开发者社区证明:这是长期存续的真正开源项目。"
DocumentDB的技术内核与企业价值
除开源特性外,其技术基底对企业极具吸引力:该数据库基于开源PostgreSQL构建,而非全新研发。
PostgreSQL作为史上最广泛部署的开源数据库,在AI时代焕发新生。DocumentDB通过PostgreSQL扩展实现了原生BSON数据类型支持,并新增文档查询和索引管理功能。企业可复用PostgreSQL成熟的工具生态、监控系统和备份方案,同时获得ACID合规性和久经验证的复制能力,确保数据一致性。
DocumentDB还包含网关组件,使其兼容所有语言的MongoDB开源驱动。Gavrylyuk坦言目前尚未实现完全兼容,但"与MongoDB驱动的全面兼容是Linux基金会DocumentDB章程的核心目标,配合真正开源中立的治理模式,将推动整个文档数据库生态繁荣,最终使包括MongoDB公司在内的所有参与者受益。"
注意区分:Amazon DocumentDB是不同产品
尽管亚马逊支持Linux基金会的DocumentDB项目,但其早在2019年就推出了同名数据库服务。
AWS高级产品经理Rashim Gupta向VentureBeat澄清:"Amazon DocumentDB是AWS构建的MongoDB兼容数据库,而Linux基金会项目是基于PostgreSQL扩展的开源引擎。两者技术架构不同。"
Gupta表示AWS将采用双轨策略:既持续投资自有服务,也会将Amazon DocumentDB的创新反哺开源项目,并逐步将开源引擎的特性整合到托管服务中。
AI工作负载催生数据库替代需求
项目启动恰逢企业急需文档数据库支持AI应用。DocumentDB已集成微软研究院的DiskANN向量索引算法和为PostgreSQL开发的语义算子,在AI场景具备即时竞争优势,同时规避了专有方案的高昂授权成本。
"微软正全面投入开源AI建设,"Gavrylyuk强调,"我们优先发展DocumentDB的AI能力,同时推动整个PostgreSQL生态进化。"
对企业数据团队的影响
对希望降低供应商依赖的企业,DocumentDB构成了对抗闭源技术的战略缓冲。IT决策者应开始在开发环境评估迁移复杂度。
新建AI应用的企业可采用DocumentDB作为基础架构,既规避供应商锁定风险,又能获得PostgreSQL久经考验的企业级可靠性。
对AI领军企业而言,这意味着无需再为规避供应商锁定而妥协,直接获得最前沿的文档数据库能力。