首页
科技
VexDB迈向DB4AI:探索首个成功实践的关键路径

VexDB迈向DB4AI:探索首个成功实践的关键路径

热心网友
转载
2025-10-30

Oracle 将其数据库版本从 23C 更名为 23AI,这个变动恰恰说明公司在 AI 浪潮兴起之初,其实并没有做好充分准备。当数据库融合技术才刚刚起步,他们就匆忙转向了AI领域。值得庆幸的是,数据融合与AI发展的大方向是一致的,所以这段转型并没有走太多弯路。

最近不少国内数据库厂商也在探讨 DB4AI 的发展路径,前段时间我还专门梳理了 Oracle 在 DB4AI 方向上的最新动态。从这些进展中,我深刻体会到 DB4AI 在传统关系型数据库中的演进轨迹。

图片图片

Oracle 的 23AI 源自 23C 的更名,反映出公司面对AI爆发点的准备不足。在数据库融合技术刚起步时,他们就匆匆转向了AI方向。幸运的是,融合与AI的大方向是一致的,所以并没有走什么弯路。

和大多数关系型数据库类似,Oracle 的 DB4AI 也是从向量类型支持起步的。他们首先集成了数据库的AI应用支持能力,再根据用户需求逐步完善功能模块,借助大量 UTL* 工具为AI应用开发提供所需支持。在最新版本中,Oracle 已经发展到能够为大规模 AI 应用提供强大能力支撑的阶段,比如 IVF 索引的在线重定义(解决大量更新后索引失效的问题)、外表支持(降低AI数据导入复杂度)、VECTOR_MEMORY_SIZE(自动优化性能)、HNSW 图的快照更新(针对修改量大的表进行性能优化)、JSON 能力融合(更方便地构建应用)、向量索引中的覆盖字段(提升应用性能)等,这些都是为了解决AI应用开发中的难点和痛点。

我不禁感慨,在 DB4AI 这条路上,Oracle 又在孤独前行了,真心希望国产数据库也能尽快赶上。前几天 VexDB 的发布会让我眼前一亮,从中感受到了国产数据库追赶先进技术的身影。

在这次发布会上,国良老师作为数智引航的技术顾问,代表技术团队发布了一款为AI而生的向量数据库产品——VexDB。我花了两天时间研究了这款数据库,虽然还没有亲自使用 VexDB 做些小项目来验证,不过在探索过程中还是收获了一些惊喜。

与国内其他 DB4AI 产品相比,VexDB 在技术理念上有较大差异。它的产品定位和技术路线与 Oracle 十分相似,我个人认为目前 Oracle 的路线应该是比较合理的。

DB4AI 的起点必然是关系型数据库中的向量支持,或者是向量数据库中的 OLTP 支持,纯粹的向量数据库应用场景会受到很大限制。虽然 DB4AI 应该从向量入手,但不能像目前绝大多数 DB4AI 功能那样只围绕向量来做,而是应该围绕AI应用的实际需求来设计。下面我们来看看 VexDB 在 DB4AI 方向上的一些值得称道的亮点。

首先 VexDB 在初期版本就构建了完善的应用程序生态,在组件编排上支持了目前最流行的AI应用框架,包括 LangChain、Dify、MaxKB、RagFlow、OpenWebUI 等。目前大量的AI应用都采用了这些框架,因此 VexDB 很容易将这些框架上开发的AI应用从其他专用向量数据库中迁移过来,这为 VexDB 的快速发展提供了有力支撑。Oracle 在 23AI 的第一个版本中也通过与 CoHere 等厂商的集成,打通了数据库与AI应用之间的管道。

p>既然 DB4AI 是为AI应用而生的,那么数据库厂商就需要了解目前用户都在开发什么样的应用。其实很多企业的第一个AI应用大多都是知识库、知识问答之类的系统。围绕向量数据类型来提供知识库开发能力是向量数据库必须具备的,不过想要做好这一点并不容易。目前绝大多数国产数据库具有的向量数据库支持不外乎向量标量混合检索的能力,似乎大家努力方向都差不多,但如果仔细看看内部细节,却差别很大。

VexDB 在这个方向上做了一些微创新,比如在向量索引上,VexDB 支持多种基于磁盘的向量索引结构,提供了 IVFFLAT/IVFPQ/Graph_index/DiskANN 索引,其中后三种索引是目前绝大多数国产数据库没有涉及的。

与传统索引不同,向量索引不仅仅是为了提高检索速度,更能够提高向量检索的能力。支持的索引种类越多,就能支持更多的应用场景。

除了向量索引之外,VexDB 在索引上还有很多令人惊喜的能力,比如向量标量联合索引 HybridANN。Oracle 在 23.6 上开始支持向量标量混合索引,当时我看到这个功能后感觉到这是一个可以大大简化知识库多路召回效率的功能,没想到 VexDB 现在也提供了类似的解决方案。

传统向量检索的召回准确性不足的问题,其实完全可以通过向量标量混合检索来解决,不过如果没有向量标量混合索引的支持,这种检索就会被割裂为向量检索、标量检索和重排三个工作,把提升准确性的工作交给了应用开发人员去做,大大增加了知识库开发的难度。

VexDB 在索引上的工作还不止如此,BM25 索引的支持让我感到非常贴心。最近我们有一个项目想通过 BM25 来提高知识库召回的准确性。BM25(Best Matching 25)是一种广泛应用于信息检索领域的概率相关性模型,用于衡量查询与文档之间的匹配程度,正好是对症下药的,但是目前我们使用的数据库中没有 BM25 索引的支持,所以做起来很纠结。

初步研究了 VexDB 的功能,从一些设计上可以看出,产品的研发人员是懂AI应用的,并没有闭门造车,而是真正在做一些帮助AI应用开发者解决现实问题的事情。我觉得在 DB4AI 的道路上,VexDB 迈出的第一步似乎是对的。

来源:https://www.51cto.com/article/826608.html

免责声明

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章

腾讯《荒野起源》拒绝让步:坚称游戏未抄袭地平线引法务交锋

腾讯在面对索尼对其游戏荒野起源涉嫌抄袭地平线系列的指控时,持续采取强硬立场,未作出让步。双方围绕此事已多次展开法律交锋。索尼方面曾明确将这款游戏称为“明目张胆的模仿”,并要求立即终止开发,认为其高度

2025-10-31.

小鹏MONA M03第20万辆下线,14个月刷新产量纪录

小鹏汽车近日宣布,旗下紧凑型纯电轿车MONA M03第20万辆已正式下线。自2024年8月首批车辆投产以来,仅用14个月便达成这一产量里程碑,反映出市场对这款车型的积极反馈,同时也展现出企业不断提升

2025-10-31.

2028年萌动全球!凯蒂猫首登好莱坞大银幕全解析

三丽鸥旗下的经典萌宠凯蒂猫即将首次登陆好莱坞大银幕。其首部主题电影定于2028年7月21日正式上映,由华纳兄弟影业动画部门负责制作与发行。这部全新电影标志着凯蒂猫首次以主角身份亮相好莱坞动画长片。影

2025-10-31.

一加15发布:旗舰性能与体验革新的完美平衡

一、前言:性能回归,理念革新一年之后,一加再次推出其年度旗舰机型——一加15。在如今高度内卷的智能手机市场,高端定位与性价比之间的张力日益突出,如何在这两者之间取得平衡,成为各大品牌必须应对的关键课

2025-10-31.

高通发布3nm旗舰芯片:多品牌新机即将搭载

多位热心网友为本文提供了宝贵线索,在此表示感谢。10月30日,有博主披露了关于新一代高端移动平台的技术细节与性能预测。该芯片将采用台积电N3p制程工艺,搭载基于Oryon架构的定制CPU,具体配置为

2025-10-31.

热门教程

更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程

最新下载

更多
海岛奇兵腾讯
海岛奇兵腾讯 棋牌策略 2025-10-31更新
查看
Melon Sandbox国际
Melon Sandbox国际 休闲益智 2025-10-31更新
查看
愤怒的小鸟2国际服
愤怒的小鸟2国际服 休闲益智 2025-10-31更新
查看
海岛奇兵应用宝
海岛奇兵应用宝 棋牌策略 2025-10-31更新
查看
进击的巨人Brave Order正
进击的巨人Brave Order正 角色扮演 2025-10-31更新
查看
死亡扳机手游
死亡扳机手游 飞行射击 2025-10-31更新
查看
海岛奇兵昆仑
海岛奇兵昆仑 棋牌策略 2025-10-31更新
查看
西奥小镇正
西奥小镇正 休闲益智 2025-10-31更新
查看
拳击大作战
拳击大作战 体育竞技 2025-10-31更新
查看
小黄人快跑国际
小黄人快跑国际 休闲益智 2025-10-31更新
查看