人工智能现在比风险投资更擅长预测初创企业的成功

发布时间：2025-09-20 02:00:37来源：发米下载作者：zhoucl

本站报道：

GPT-4 能否在专业人士之前在 2008 年发现 Airbnb，或在 2012 年发现 Figma？

一篇新论文牛津大学和 Vela Research 的研究人员的研究表明，大型语言模型在挑选优胜者方面已经比大多数早期投资者做得更好。在这个以模式匹配和热情介绍而闻名的领域，人工智能能够更早地发现有前途的创始人——甚至在不知道他们名字的情况下——这一前景可能会改变游戏规则。

如果像 GPT-4o 这样的模型能够稍微提高命中率，那么它们就可能成为每家公司交易采购堆栈中必备的工具，甚至可能使初创企业投资变得更加精英化。

该研究论文，“VCBench：风险投资法学硕士的基准测试”推出了 VCBench，这是首个旨在测试人工智能能否在初创企业成功之前预测其成功的开放式基准测试。该团队构建了一个包含 9,000 份匿名创始人资料的数据集，每份资料都与早期公司数据配对。其中约 810 份资料被标记为“成功”——定义为实现了重要的增长里程碑，例如退出或 IPO——这为模型提供了稀疏但有意义的训练信号。

至关重要的是，研究人员清理了数据集中的名称和直接标识符，这样模型就无法简单地记住 Crunchbase 的琐事。他们甚至进行了对抗性测试，以确保法学硕士 (LLM) 不会通过从公开数据中重新识别创始人来作弊，从而将重新识别风险降低了 92%，同时保留了预测特征。

经测试，这些模型的表现优于大多数人类基准。论文指出，“市场指数”（本质上是所有早期风险投资押注的基准表现）的准确率仅为1.9%，即50次尝试中只有一次成功。Y Combinator 的表现更好，达到了3.2%，大约是市场的1.7倍，而一级风险投资公司的准确率约为5.6%，大约是市场的两倍。

然而，大型语言模型却超越了这一基线。

例如，DeepSeek-V3其精度是市场指数的六倍多，同时GPT-4o以最高的 F0.5 分数位居排行榜榜首，平衡了准确率和召回率。克劳德 3.5 十四行诗和双子座 1.5 专业版也轻松击败了市场，与精英风险投资公司处于同一业绩水平。

换句话说，几乎所有接受测试的前沿法学硕士在识别可能的赢家方面都比平均风险投资做得更好——而且有几种模型的预测能力达到或超过了 Y Combinator 和顶级基金的预测能力。

研究人员已将 VCBench 作为公共资源发布于vcbench.com邀请社区运行自己的模型并发布结果。如果排行榜上充斥着表现优于市场的法学硕士，那么这可能会重塑早期投资。一个由人工智能代理在领英上搜索，而不是通过给合作伙伴发送冷邮件来发现创始人的世界，或许并不遥远。

上一篇：MetaMask 与 Hyperliquid 合作推出钱包内永续合约交易——这对 DeFi 用户意味着什么