英伟达 (NVDA) 、Alphabet 旗下 谷歌 (GOOGL) 和热门初创公司 OpenAI 正在转向“合成数据”工厂,以满足训练深度学习人工智能算法所需的大量数据需求。在本周的消费电子展上,这家芯片制造商的首席执行官吹捧了合成数据的能力,这可能对英伟达股票有利。
在有报道称 AI 公司正在耗尽训练强大 AI 模型所需的真实世界数据之际,转向合成数据的趋势正在出现。
“合成数据为解决稀缺或敏感数据需求提供了至关重要的解决方案。随着主要的 AI 公司耗尽可用于训练的可用互联网数据,这种趋势正在加速,”数据科学家 Ben Lorica 在 2025 年展望报告中表示。
“团队已经可以利用基础模型为特定用例生成合成数据,而更大的组织可能会将合成数据与他们的专有数据集相结合,”编辑 Gradient Flow AI 时事通讯的 Lorica 补充道。“期待主要的 AI 实验室出现改进的合成数据生成工具,使这项技术更容易为从业者所用。”
在 2025 年的 CES 上,英伟达首席执行官黄仁勋吹捧了人工智能在汽车和机器人应用中的未来作用。他说,合成数据将有所帮助。
英伟达股票:“数据工厂”
经济学家 Ed Yardeni 在一份关于 CES 进展的报告中说:“英伟达正在收集和组织传统数据,并利用它们来创建合成数据。”“传统数据和合成数据都将用于在英伟达的数据工厂中训练 AI 代理和机器人。”
Yardeni 补充说:“ (这家芯片制造商)通过让 Nvidia Cosmos 观看 2000 万小时关于自然、人类以及与物质世界相关的任何事物的视频,开发了 Nvidia Cosmos。基于这些真实场景,它还可以创建合成数据,以创建更多场景。然后,它可以使用其真实数据和合成数据来训练需要在世界中导航的机器人,无论是在仓库工作还是驾驶自动驾驶汽车。”
谷歌的云计算部门也在大力推动用于企业应用的合成数据。此外,OpenAI 最新的具有增强推理能力的基础模型使用了合成数据生成技术。
进入 2025 年,一个大的争论是,由于难以获取高质量、人工制作的训练数据,AI 模型是否已经开始趋于平稳。此外,像谷歌和 Meta Platforms (META) 这样的科技巨头拥有来自 YouTube、地图、Instagram 和 Facebook 的内部专有数据,可用于构建更大的模型。
与此同时,英伟达股票在 2025 年上涨了 4%。在 2023 年飙升 239% 之后,英伟达股票在 2024 年上涨了 171%。