1. 首页>>分享

MongoDB股价暴跌近27%遇最黑暗一天,不久前刚完成2.2亿美元收购案

图片

作者丨刘杨楠

编辑丨海腰

图源丨CNBC

3 月 6 日,开源数据库领域的龙头 MongoDB 经历了上市之后最为黑暗的一天。

较 195 亿美元的最高值跌去了 50 亿美元。

华尔街的分析师们开始纷纷下调目标价格,然而评级依旧保持在“买入”或“持有”状态。分析师们对 MongoDB 保持相对积极的态度,或许是因为前不久发生了一桩收购案。

2 月 24 日,MongoDB 宣布用 2.2 亿美元将 Voyage AI 收购。这家成立仅 17 个月的明星 AI 公司,由此被写下了一个暂时的句号。

Voyage AI 的故事具有短暂且辉煌的特点。该公司于 2023 年 9 月成立。它由毕业于清华姚班的天才学者掌控。还获得了“AI 教母”李飞飞的支持。一共融到了 2800 万美元。其发布的模型曾得到数位 AI 大牛的称赞。

这笔收购让外界猝不及防,正因如此。人们不禁好奇,这样一家技术过硬的明星初创企业,为什么会在成立仅 17 个月的时间选择被收购?这样一家团队顶尖的明星初创企业,为什么会在成立仅 17 个月的时间选择被收购?这样一家不缺投资者关注的明星初创企业,为什么会在成立仅 17 个月的时间选择被收购?

从 MongoDB 现今的状况来看,在这场收购中,Voyage AI 或许是更为需要的那一方。

戛然而止的天才创业故事

Voyage AI的17个月可谓轰轰烈烈。

2023 年 9 月,斯坦福大学有一位计算机科学家,他是清华大学 2012 届的姚班校友,名叫马腾宇(Tengyu Ma)。他创办了 Voyage AI,这样的全明星阵容着实让人眼前一亮。

马腾宇自己的履历就足够惹眼。

2008 年,马腾宇从清华姚班毕业。之后,他前往普林斯顿大学攻读博士学位。在博士二年级时,他获得了理论计算机方向的西蒙斯奖、IBM 博士奖学金、NIPS 最佳学生论文奖、COLT 最佳论文奖等诸多奖项。博士毕业后,马腾宇去到斯坦福担任助理教授,并且正式开始对 AI 进行研究。

与马腾宇有过交往的人都称赞他为天才。他的博导教授曾说,若他创业,未来定会给全球科技开创崭新的一页。2021 年,马腾宇获得有“诺贝尔奖风向标”之称的斯隆奖后,“AI 教母”李飞飞毫不掩饰自己的赞叹,称真正的天才不应被埋没在实验室。

于是,马腾宇创办了Voyage AI。

公司成立之后,马腾宇组建了一支研究团队,这支团队的成员来自斯坦福、MIT、加州大学伯克利分校和普林斯顿大学,且都是世界级的 AI 研究人才。同时,他还邀请了李飞飞来担任学术顾问。

Voyage AI 的一个重要优势在于它拥有先进的嵌入和重排序模型,凭借此模型能够实现高精度的检索能力,进而可以解决 AI 的幻觉问题。

嵌入模型是 RAG 系统的重要组成部分之一。它能够把文本数据转化为向量嵌入,这样就能在向量数据库中进行高效的语义搜索。重排序模型在 RAG 系统里是用来优化检索结果的相关性的。

嵌入模型和生成模型很相似,它依靠强大的神经网络(一般基于 Transformer)架构,以此来捕获并压缩语义上下文,将文字、图片、音频等背后各种概念之间的复杂关系进行封装。早期如果在嵌入模型中封装更多的知识,并且把生成的信息反馈到下一代模型的训练中,就会让下游的 RAG、搜索、推理系统更强大。

嵌入模型的训练存在很大难度,在模型架构方面需要考虑,在数据收集方面需要考虑,在函数选择方面也需要考虑。

马腾宇在创业前,带领团队在斯坦福人工智能实验室进行了 5 年以上的研究,收集了海量数据集。同时,还在麻省理工学院 NLP 小组进行了 5 年以上的研究,进行了预处理和后处理实验。并且开发了专有方法,将对比学习应用于文本。

创业之后,Voyage AI 发布了多个系列的模型。其中有通用嵌入模型,还有代码检索嵌入模型以及多模态嵌入模型。在过去的三个月里,这些模型都已经升级到了最新的 3.0 版本。

这些模型具备从高度专业化的文本以及非结构化数据里提取语义信息的能力,像法律文档、金融报告、企业知识库等这类数据,通过这种方式能显著提升 AI 模型的准确性与可靠性。

Voyage AI 要让应用侧的企业直观感受到 voyage 系列模型的实力,所以决定免费为每个组织嵌入前 5000 个文档/查询。

Voyage AI的工作也受到很多技术大牛的认可。

Spot AI 的 CEO Tanuj Thapliyal 在 Linkedin 上发文称,他对马腾宇团队的工作成果感到兴奋。他表示,在他们 AGI 的旅程中,不论上下文窗口的大小如何,嵌入模型和重排序器都是组织世界上非结构化数据并保持其有序性的最为关键的内核。

种种buff叠加,也让Voyage AI颇受资本欢迎。

2024 年 10 月,Voyage AI 宣告已完成 2000 万美元的 A 轮融资。同时,其总融资额达到了 2800 万美元。风投公司 CRV 参与了本轮融资并担任领投方。Snowflake、Databricks、Pear VC、Tectonic Ventures 等也参与了本轮融资。CRV 的普通合伙人 Murat Bicer 加入了 Voyage AI 的董事会。

Voyage AI 官网的博客中提到:我们进行这笔投资,目的是扩大我们的产品范围。并且,我们会继续为您提供最先进的非结构化数据搜索和检索模型。

所有人都在期待 Voyage AI 的下一个里程碑,然而,却突然宣布了它被 MongoDB 收购的消息。

意料之外,情理之中

2 月 24 日,开源数据库领域的龙头 MongoDB 宣布进行一项收购行动,即收购 Voyage AI,此次收购的估值为 2.2 亿美元。

这时距离 Voyage AI 的 A 轮融资过去了仅 6 个月,距离公司成立也才 17 个月。从历史经验方面来讲,AI 公司这么快就退出的案例不是常见的情况。

去年,乔治城大学安全与新兴技术中心开展了一项研究。这项研究分析了 2014 年到 2023 年期间的人工智能并购事件。研究表明,大型科技平台在人工智能公司成立后,平均 4.8 年就会收购它们。而其他公司收购的人工智能公司,平均成立时间为 7.4 年。由此可见,Voyage AI 是“反常”的。

Voyage AI 进行 A 轮融资,其领投方 CRV 也流露出遗憾。CRV 合伙人 Murat Bicer 称,“这对我们而言是较为短暂的结局之一”。毕竟在业务更为成熟时被收购,Voyage AI 或许能够获得远高于 2.2 亿美元的估值。

从 CRV 的公开态度能够察觉到,他们对 Voyage AI 持有看好的态度。

Bicer 曾明确表示,CRV 看重 Voyage AI 是因为它拥有一支极为强大的技术团队。他补充说,在目前的生成式 AI 领域,真正具备数十年而非数年专业知识和经验的人是非常少的。当这些人在从事某件事情时,我们能够知晓他们会以一种能够推动整个市场前进的方式进行创新。

CRV 在被收购之前,就已经在业务方面对 Voyage AI 提供辅助。它帮助 Voyage AI 组建了管理团队,还帮助其制定了上市战略,并且能更好地协调定价。

然而,Voyage AI 退出得较为迅速,CRV 投入的许多努力还处于早期阶段。不过即便如此,Bicer 还是将 Voyage AI 此次被收购称作是一个“十分圆满的结局”。

事实上,这次收购也是情理之中。

仔细翻看 Voyage AI 成立时的官宣博客,能够发现,在公司成立之初,团队就指出,在实际的应用场景里,嵌入模型的性能与行业的专有数据存在着强关联。

具体而言,在模型训练这个环节,高质量数据集是必备的;在性能评测这个环节,高质量数据集也是必备的。

并且它支持超过 112 种语言。

博客指出,MTEB 被“过度使用”了。有人会利用评测集中的数据集直接对模型进行训练,通过这种方式使模型在评测时能有更好的表现。这在一定程度上降低了 MTEB 的公信力。Voyage AI 为进行更全面的评估,构建了九个额外的数据集,这些数据都来自“真实世界的行业领域 (RWID)”,其中包括技术文档、餐厅评论和新闻报道等多种数据。

博客接着写道:现实世界的场景比学术基准更具挑战性。因为每个行业都有独特的术语和知识库,就如同每个企业一样。以 Voyage AI 的模型 voyage - 01 为例,Voyage 01 本身是开箱即用的。但通过真实的业务数据进行微调,它就能够以更低的成本变得更好。

Voyage AI 目前已针对编码和金融场景专门定制了嵌入模型,并且正在将其扩展到更多的领域。我们能够在小型的、未标记的公司特定数据集中对嵌入进行微调,从而为 LangChain、OneSignal、Druva 和 Galpha 等试点客户实现 10%至 20%的准确率提升。

可见,若要使嵌入模型在真实场景中具备更好的准确性和相关性,很大程度上需要与真实的运营数据进行深度集成。然而,对于医疗、金融等对数据安全要求极高的场景,企业通常不愿意随意将业务数据提供给第三方厂商。马腾宇也表明:“要让 AI 应用充分发挥其潜力,企业必须信任其输出,所以检索需要与运营数据深度集成,以此来确保准确性和相关性。”

因此,与拥有大量企业真实业务数据的企业如 MongoDB 合作,对于 Voyage AI 来说,无疑是一种能收到事半功倍效果的选择。

但数据库企业那么多,为什么是MongoDB?

MongoDB或许更需要Voyage AI

MongoDB 在 NoSQL 数据库中属于文档型数据库。它可以被视为文档型数据库的先驱。

从大约 1970 年开始,在之后的二十多年时间里,关系型数据库一直占据主导地位。然而,传统的关系型数据库在面对高并发读写、海量数据存储以及非结构化数据处理等方面,存在着相当大的局限性。

直到2007年,关系型数据库来到转折前夜。

Dwight Merriman、Kevin Ryan 和 Eliot Horowitz 这三位工程师一起创办了 10gen。他们创办的初衷是打造一款面向开发者的 PaaS 产品。并且他们还拿到了超过 8000 万美元的投资。

资金到位之后,三人原本打算寻找一个能够支撑他们的 PaaS 产品的海量数据库。然而,当时较为成熟的数据库大多是基于单机架构的传统关系型数据库,像 Oracle 以及 MS SQLServer 等。即便 Oracle 可以支持一些集群部署,但其扩展性也仅仅局限在 2 到 4 台服务器。

10gen 的创始团队决定自行开发一个数据存储服务,以便能够存储所有数据。同时,还提供易于使用的 API,使开发者能够对数据进行常见的增、删、改、查操作。

为了让开发者操作起来更方便,Eliot 做出了一个决定,那就是使用 JSON 当作数据格式来进行存储。在英文中,JSON 的数据被称作“JSON Document”,而“文档数据库”这个名字也是因为这个而得来的。

2009 年 2 月,这是两年之后。10gen 在这个时候正式发布了开源数据库 MongoDB 1.0。此次发布首次打破了关系型数据库的统治地位。

10gen 之后在数据库领域不断前行。2013 年 8 月,10gen 改名为 MongoDB,开始以 NoSQL 数据库作为主要业务。2014 年,MongoDB 收购了 WiredTiger 存储引擎,从而使 MongoDB 的写入性能得到大幅提升。

2017 年 10 月,MongoDB 成立已有十年,并且在纳斯达克上市。上市之后,MongoDB 的市场表现超出了预期,其市值最高曾达到 335.6 亿美元。

MongoDB 势头正盛之时,开源的特点给公司带来了麻烦,灵活的技术特色也给公司带来了麻烦。

2017 年初,MongoDB 数据库在默认配置下无需用户名和密码便可访问。这一情况导致大量黑客入侵了全球数万个 MongoDB 数据库,他们勒索用户交赎金才能恢复数据。

2018 年 10 月,MongoDB 宣布将其开源许可证进行切换。从 GNU AGPLv3 切换到了服务器端公共许可证(SSPL)。这一举措引起了巨大的反响。许多开发者和企业用户都认为 SSPL 对商业用户不够友好。并且限制了软件的自由使用和分发。Linux 发行版,像 Debian 和 Fedora 等,甚至拒绝使用在 SSPL 协议下的 MongoDB。

开源许可证变更之后,AWS 推出了兼容 MongoDB 的产品,IBM 也推出了兼容 MongoDB 的产品,微软同样推出了兼容 MongoDB 的产品,这些云服务商们纷纷如此,以应对 MongoDB 的竞争。

不过,接连不断的风波并没有伤及 MongoDB 的根基。他们依旧按照自己的节奏在持续地优化产品。在 2018 年 6 月,MongoDB 推出了多文档 ACID 强事务机制。这意味着 MongoDB 具备了支撑更复杂数据操作的能力,也能够适用于更广泛的业务需求。

深圳钛铂数据的创始人及 CTO 唐建法,他同时也是 MongoDB 中文社区主席,曾撰写文章总结了 MongoDB 的三条核心优势。

基于JSON的数据模型最接近开发者的面向对象的设计思维;

灵活动态的模型有这样的作用,即在需求频繁变化的时候,能够极大地简化数据库设计的流程。

跨中心能力也能够支持各种现代化复杂部署需求。

目前,MongoDB 在全球范围内是最受欢迎的文档型数据库。它在 100 多个国家和地区都有分布。并且拥有超过 50000 个客户。所以,对于 Voyage AI 来说,MongoDB 的确是一个理想的合作伙伴。

然而,MongoDB今天的处境却并不乐观。

疫情过后,全球经济呈现出放缓的态势。各企业的 IT 支出随之相应地进行了缩减。与此同时,受到 AI 的冲击,MongoDB 以往所具有的差异化优势逐渐被 AI 的光芒所遮掩。并且,Atlas 的新工作负载增长情况未达到预期。

3 月 6 日,在 2026 财年业绩报告里。MongoDB 的全年预期情况不佳。预计全年收入处于 22.4 亿至 22.8 亿美元之间。这个收入低于分析师预期的 23.2 亿美元。同时,MongoDB 预计全年调整后的每股收益在 2.44 至 2.62 美元之间。此每股收益远低于分析师预期的 3.34 美元。业绩预告发布之后,MongoDB 的股价出现了下跌,下跌幅度接近 27%。同时,它与去年 509 美元的最高点相比,差距也很大。目前,其估值已经缩水到了 143 亿美元。

尽管如此,收购 Voyage AI 对市场信心的激励作用已经开始有所体现。在面对较为悲观的全年预期时,多位高评级的分析师依然给予 MongoDB“买入”或“持有”的评级。

接下来,MongoDB将陆续与Voyage AI深度集成。

MongoDB 的 CEO Dev Ittycheria 在其博客里提及,Voyage AI 与 MongoDB 进行集成之后,能够让开发人员无需再对外部嵌入 API、独立的向量存储或者复杂的搜索管道进行管理。

AI 检索会被内置在数据库自身当中,这样一来,语义搜索、矢量检索以及排名等操作能够像传统查询那样流畅地进行。Ittycheria 对此进行了解释。集成本身的实施将分为三个阶段:

第一阶段,Voyage AI 的重新排名模型将通过 Voyage AI 当前的 API 以及 AWS 和 Azure 市场广泛提供。

在第二阶段,MongoDB 会把 Voyage AI 的功能整合到 MongoDB Atlas 里。首先是针对 Vector Search 的自动嵌入服务,此服务会自行处理嵌入生成的工作。接着会进行本机重新排名,这样能让开发人员迅速提升检索的准确性。Ittycheria 这样写道。

MongoDB在第三阶段会添加先进的 AI 检索功能,同时也会增强多模态能力。

Ittycheria 解释道,我们还打算引入指令调整模型。这样一来,开发人员就可以通过使用简单的提示,而不是进行复杂的微调,来对搜索行为进行优化。同时,Ittycheria 还补充说,它将通过在 MongoDB Atlas 优化 AI 应用程序时嵌入生命周期管理来提供补充。

AI 是时代的巨轮。MongoDB 不是最早登上这巨轮的,但它找到了最有经验的船员。未来它能否跑上快航道,得由时间来决定。

创业邦原创此篇文章,不允许未经授权就进行转载。若有未经授权的转载行为,创业邦将有权追究其法律责任。如果需要转载或者有任何疑问,可联系 editor@cyzone.cn。

本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/274813.html

联系我们

在线咨询:点击这里给我发消息

微信号:13588888888

工作日:9:30-18:30,节假日休息