2.4万个假账号!美AI巨头指控DeepSeek等中企窃取数据(图)

美国人工智能(AI)初创公司Anthropic指控,3家中国AI企业设立超过2万4000个假账号,使用其Claude模型,以协助自家系统追赶对手。(彭博档案照)
美国人工智能(AI)初创公司Anthropic指控,3家中国AI企业设立超过2万4000个假账号,使用其Claude模型,以协助自家系统追赶对手。
《华尔街日报》报道,Anthropic在23日的博客文章中指出,深度求索(DeepSeek)、月之暗面(Moonshot AI)及MiniMax这3家中国公司对Claude下达超过1600万次指令(prompts)。
该公司称,中企通过这些指令从Anthropic系统中吸取信息,以训练并改良自家产品。
本月稍早,Anthropic的竞争对手OpenAI也致函联邦众议员,指控DeepSeek使用被称为“蒸馏”(distillation)的相同策略,来模仿OpenAI的产品。
Anthropic表示,蒸馏技术有其正当用途,例如企业可用以打造自家产品的缩小版,但也能被用来“以极少的时间与成本”打造具竞争力的产品。
各家公司的蒸馏活动规模不一。Anthropic指出,DeepSeek与Claude进行15万次互动,而Moonshot与MiniMax则分别超过340万次及1300万次。
与此同时,DeepSeek、Moonshot与MiniMax的代表均未回应置评请求。
包括Moonshot与MiniMax在内的多家中国企业,近期发布最新AI模型,其中许多具备强化的推理与代码编写能力。DeepSeek也正准备于近期推出其下一代模型。
去年DeepSeek首度引起AI爱好者关注时,曾引发外界担忧,认为中国即使无法取得最强大的AI芯片,也可能迅速赶上美国AI企业。AI观察家当时便推测,DeepSeek可能使用蒸馏技术。
在去年9月更新的研究论文中,DeepSeek表示,在其旗舰V3模型预训练的后期阶段,仅使用一般的网页与电子书,并未纳入任何合成数据(synthetic data)。
然而,该公司表示部分网页包含“大量由OpenAI模型生成的答案”。DeepSeek声称,其基础模型可能是通过吸取这类网页,间接从其他强大模型中获取知识。
由于开发者面临高质量数据短缺,并专注于赋予模型所谓的“代理能力”(agentic capabilities,即允许模型主动采取行动,为用户完成任务),通常运用蒸馏技术的合成数据,正日益被用于训练大型基础模型。
此外,Moonshot在去年7月的一份技术报告中表示,使用合成数据来训练其Kimi K2模型。
Anthropic强调,中国开发者的这些活动引发了美国的国家安全疑虑。该公司指出:“蒸馏美国模型的外国实验室,随后能将这些未受保护的能力,输入至军事、情报与监控系统中。”



+61
+86
+886
+852
+853
+64
