斯坦福AI团队套壳清华面壁智能模型 实锤后承认抄袭
斯坦福AI团队套壳清华系AI公司面壁智能的AI模型,成果被全网声讨,三天后承认抄袭,这几天外网AI界属实魔幻。
事情的起因是斯坦福大学研究团队5月29日发布名为Llama 3B的AI模型,声称只需500美元就能训练出与GPT4水平相媲美的多模态模型,并且该团队人员来自斯坦福、特斯拉、SpaceX、亚马逊与牛津大学等机构,在网上引发热度,登上Hugging Face热门榜。
但没多久网上开始出现质疑,认为该模型套壳了面壁智能五月中旬发布的8B多模态小模型mini CPM-V2.5,且没有表达任何致敬和感谢。接着戏剧性一幕发生,斯坦福团队回复只使用了面壁智能模型的top lines,并且在mini CPM发布前就开始了这项工作。但网友在经过对比之后,列出了四项证据实锤,结果Llama 3B团队先是删帖,然后表示只是使用mini CPM的配置解决Llama 3B的推理问题。
愤怒的网友跑到面壁智能项目页面呼吁官方下场实锤,结果戏剧性的一幕再次发生,有网友解构完文件之后发现两个项目使用完全相同的模型结构和代码实现,只是变量名不同。最离谱的是,在面壁智能团队的测试中发现斯坦福的模型居然也能识别清华简,据AI科技评论向面壁团队了解,清华简是清华大学收藏的战国竹简,相关识别数据尚未对外公开。识别清华简这项能力相当于mini CPM的胎记,结果Llama 3B在识别清华简上,对的一样,错的也一样,主打一个百分百还原。
最后的结局就是在大量实锤下,其中一个作者出来道歉,表示抄袭是源于对队友的盲信。此外,网友齐齐刷屏感谢面壁智能开源。
很多刚入AI圈的朋友,都好奇怎么辨别AI模型是不是套壳抄袭,其实只要摸清楚几个关键的点,普通人也能快速看出端倪。
我做AI行业内容写了快十年,见过太多蹭热度的套壳项目,总结了几个好用的方法,今天分享给大家。
首先最直接的,就是看未公开的特有数据测试结果。就像这次AI抄袭事件里面壁智能用到的清华简,相关数据没对外放,是只有自家模型才训练过的特有内容,相当于胎记。如果另一个同类型模型,在这个测试上对的一样错的都一样,那基本跑不了就是抄了,这个方法百试百灵,普通人不用扒代码也能初步判断。
其次就是去看模型结构和核心代码,很多套壳团队嫌麻烦,只会改一改变量名,其他完全不动。你可以把两个项目的文件都拉下来,对比一下代码注释、文件结构,甚至是不合理的代码bug,如果连小错误都一模一样,那不用多说,肯定是套壳。
如果你不会看代码,也可以看项目发布时间和团队说法有没有矛盾。很多套壳项目会说自己早在对方发布前就做完了,那你可以去查团队的代码提交记录,有没有逐步开发的痕迹,要是突然一下子就出来一个完整模型,那多半有问题。
最后也可以看作者团队的回应,真的没抄袭的话,会大大方方放出自己的开发日志、训练记录自证,要是一被质疑就删帖,含糊其辞转移话题,那十有八九是心里有鬼。
其实现在AI开源越来越多,抄起来确实方便,但原创的价值从来都不会被掩盖,我们普通人多留个心眼,就能少被这种套壳项目忽悠,也能真正支持到认真做原创AI的团队。
AI抄袭,斯坦福AI,套壳AI,面壁智能,多模态模型,AI开源,Llama 3B,mini CPM,清华简,AI学术不端
[Q]:本次AI抄袭事件涉及哪两方?
[A]:本次事件涉及斯坦福大学AI研究团队,以及清华系AI公司面壁智能。
[Q]:斯坦福团队发布的抄袭模型叫什么名字?
[A]:斯坦福团队发布的*的模型名为Llama 3B。
[Q]:被抄袭的面壁智能模型是什么?
[A]:被抄袭的是面壁智能发布的8B多模态小模型mini CPM-V2.5。
[Q]:本次事件中实锤抄袭的关键证据是什么?
[A]:关键证据是未公开的清华简识别测试,斯坦福模型和被抄袭模型对错完全一致,且模型结构、代码仅修改了变量名。
[Q]:斯坦福团队最初是如何回应抄袭质疑的?
[A]:斯坦福团队最初回应称只使用了少量内容,且项目在mini CPM发布前就已经启动。
[Q]:事件最终的结局是什么?
[A]:在大量实锤证据下,斯坦福团队的一位作者出面道歉,承认抄袭。
[Q]:为什么识别清华简能成为实锤抄袭的胎记?
[A]:因为清华简的相关识别数据是面壁智能未公开的非公开数据,只有自家模型训练过相关内容。
[Q]:网友对这件事的态度是什么?
[A]:网友声讨斯坦福团队的抄袭行为,同时刷屏感谢面壁智能坚持开源。
事情的起因是斯坦福大学研究团队5月29日发布名为Llama 3B的AI模型,声称只需500美元就能训练出与GPT4水平相媲美的多模态模型,并且该团队人员来自斯坦福、特斯拉、SpaceX、亚马逊与牛津大学等机构,在网上引发热度,登上Hugging Face热门榜。
但没多久网上开始出现质疑,认为该模型套壳了面壁智能五月中旬发布的8B多模态小模型mini CPM-V2.5,且没有表达任何致敬和感谢。接着戏剧性一幕发生,斯坦福团队回复只使用了面壁智能模型的top lines,并且在mini CPM发布前就开始了这项工作。但网友在经过对比之后,列出了四项证据实锤,结果Llama 3B团队先是删帖,然后表示只是使用mini CPM的配置解决Llama 3B的推理问题。
愤怒的网友跑到面壁智能项目页面呼吁官方下场实锤,结果戏剧性的一幕再次发生,有网友解构完文件之后发现两个项目使用完全相同的模型结构和代码实现,只是变量名不同。最离谱的是,在面壁智能团队的测试中发现斯坦福的模型居然也能识别清华简,据AI科技评论向面壁团队了解,清华简是清华大学收藏的战国竹简,相关识别数据尚未对外公开。识别清华简这项能力相当于mini CPM的胎记,结果Llama 3B在识别清华简上,对的一样,错的也一样,主打一个百分百还原。
最后的结局就是在大量实锤下,其中一个作者出来道歉,表示抄袭是源于对队友的盲信。此外,网友齐齐刷屏感谢面壁智能开源。
很多刚入AI圈的朋友,都好奇怎么辨别AI模型是不是套壳抄袭,其实只要摸清楚几个关键的点,普通人也能快速看出端倪。
我做AI行业内容写了快十年,见过太多蹭热度的套壳项目,总结了几个好用的方法,今天分享给大家。
首先最直接的,就是看未公开的特有数据测试结果。就像这次AI抄袭事件里面壁智能用到的清华简,相关数据没对外放,是只有自家模型才训练过的特有内容,相当于胎记。如果另一个同类型模型,在这个测试上对的一样错的都一样,那基本跑不了就是抄了,这个方法百试百灵,普通人不用扒代码也能初步判断。
其次就是去看模型结构和核心代码,很多套壳团队嫌麻烦,只会改一改变量名,其他完全不动。你可以把两个项目的文件都拉下来,对比一下代码注释、文件结构,甚至是不合理的代码bug,如果连小错误都一模一样,那不用多说,肯定是套壳。
如果你不会看代码,也可以看项目发布时间和团队说法有没有矛盾。很多套壳项目会说自己早在对方发布前就做完了,那你可以去查团队的代码提交记录,有没有逐步开发的痕迹,要是突然一下子就出来一个完整模型,那多半有问题。
最后也可以看作者团队的回应,真的没抄袭的话,会大大方方放出自己的开发日志、训练记录自证,要是一被质疑就删帖,含糊其辞转移话题,那十有八九是心里有鬼。
其实现在AI开源越来越多,抄起来确实方便,但原创的价值从来都不会被掩盖,我们普通人多留个心眼,就能少被这种套壳项目忽悠,也能真正支持到认真做原创AI的团队。
AI抄袭,斯坦福AI,套壳AI,面壁智能,多模态模型,AI开源,Llama 3B,mini CPM,清华简,AI学术不端
[Q]:本次AI抄袭事件涉及哪两方?
[A]:本次事件涉及斯坦福大学AI研究团队,以及清华系AI公司面壁智能。
[Q]:斯坦福团队发布的抄袭模型叫什么名字?
[A]:斯坦福团队发布的*的模型名为Llama 3B。
[Q]:被抄袭的面壁智能模型是什么?
[A]:被抄袭的是面壁智能发布的8B多模态小模型mini CPM-V2.5。
[Q]:本次事件中实锤抄袭的关键证据是什么?
[A]:关键证据是未公开的清华简识别测试,斯坦福模型和被抄袭模型对错完全一致,且模型结构、代码仅修改了变量名。
[Q]:斯坦福团队最初是如何回应抄袭质疑的?
[A]:斯坦福团队最初回应称只使用了少量内容,且项目在mini CPM发布前就已经启动。
[Q]:事件最终的结局是什么?
[A]:在大量实锤证据下,斯坦福团队的一位作者出面道歉,承认抄袭。
[Q]:为什么识别清华简能成为实锤抄袭的胎记?
[A]:因为清华简的相关识别数据是面壁智能未公开的非公开数据,只有自家模型训练过相关内容。
[Q]:网友对这件事的态度是什么?
[A]:网友声讨斯坦福团队的抄袭行为,同时刷屏感谢面壁智能坚持开源。
评论 (0)
