当前位置:首页失误or作弊?百度图像识别人工智能遭遇刷分危机 举报文章

失误or作弊?百度图像识别人工智能遭遇刷分危机

作者:admin    来源:用户投稿    时间:2015.6.12   

  [摘要]在图像识别人工智能基准测试中,百度被指投机取巧。ImageNet对百度成绩予以否认并禁止其1年内不得参加该比赛。

  

失误or作弊?百度人工智能遭遇刷分危机

  腾讯科技 王根旺 张霁 6月6日报道

  这一周,百度因为在一个比赛中作弊被推到舆论的风头浪尖。

  2张彩票和200张彩票

  事情原委还要回到5月中旬,彼时百度宣称其在ImageNet(图像识别最大数据库)的图像识别测试挑战赛中击败了谷歌(微博)和微软,称其图像识别错误率低至4.58%,而微软是4.94%,谷歌为4.8%。而在这种测试中,人类辨识ImageNet照片的错误率为5%左右。

  ImageNet这项比赛的全称为Imagenet Large Scale Visual Recognition Challenge(ILSVRC),由来自斯坦福大学、密歇根大学以及北卡莱罗纳大学教堂山分校的学者举办,是目前最权威的图像识别测试。该测试主要衡量计算机识别图片中的物件的能力,其原理基本上和百度谷歌都有的识图应用一致,不过测试的数据集规模极大,标准更加严谨详细。

  

失误or作弊?百度人工智能遭遇刷分危机

  该比赛从2010年开始举办,至今已经是第六届,参与比赛的学术组织和机构达到了50余所,大多来自世界知名大学的人工智能研究所以及科技界巨头企业如谷歌、微软等。

  参与者需要扫描拥有100多张图片的数据库,将它们归到1000个不同的类别之中,并对通过识别自动给每张图片添加注释,最后将结果上传到ImageNet的评估服务器上。最终比赛排名结果及各项指标将由ImageNet在比赛结束后审核公布。

  然而本月初,ImageNet随后却发文指责百度在测试中存在违规作弊行为。因为按照测试的官方规定,参与者每周只能向服务器提交2次测试结果,而百度却在5天内提交了40次结果。此外,ImageNet表示,百度还使用了30个不同的账号,在过去6个月中提交了约200次测试结果。

  通俗的来讲,百度这种做法可以理解为在其他团队只购买2张彩票的情况下,它却购买了200张彩票以提高中奖概率。

  ImageNet将此情况通报给了所有参赛团队,对百度的成绩予以否认并禁止百度1年内不得参加该比赛。

  百度的不遗余力

  与谷歌类似,百度都是以互联网搜索为基础的技术导向型公司,手头握有大量的用户和数据积累,对于进行大数据挖掘,探索人工智能有着天然的优势。它也确实学着谷歌一样在各个领域加强自己的创新技术探索,人工智能就是其中极为重要的一部分。

  在人工智能这个大领域百度的探索和研究都可谓不遗余力,且在多个细分小类别都有巨大的投入。

  其中,就包括引进权威人才吴恩达及组建硅谷研究中心。2014年5月,百度宣布在美国硅谷成立人工智能的专门研发中心,并从谷歌挖来了深度学习权威学者吴恩达(Andrew Ng)任命其为百度深度学习研究院首席科学家。吴恩达不仅是斯坦福大学计算机科学和电子工程学的学术风向标,更因其一手创建并领导了谷歌深度学习团队,被业界誉为“谷歌大脑之父”,百度能聘到这样的权威级人才实属不易,可见其重视和投入。

  去年底,美国《福布斯》发布文章称,吴恩达及研究团队发明了一种新的语音识别方法,这款基于深度学习的名为“Deep Speech”语音识别系统可以在嘈杂环境下实现将近 81% 的辨识准确率。卡耐基梅隆大学工程学助理研究教授Ian Lane对其的评价是“百度研究院最近的工作有可能颠覆语音识别在未来的应用效果。”

  而百度目前在国内拥有十几座云计算中心,为满足大数据在计算和存储上的高要求,还投入使用了4兆交换机,并在探索10兆的交换机。百度在GPU高性能计算机上的投入也是十分下血本,其美国研发中心的科学家吴韧称百度在2013年刚开始准备组建Minwa超级计算机的时候,购买量在国内达到了第二,“拿不到第一是因为天河当然得是第一”。

  此外,去年9月百度宣布已经与宝马正式签署合作协议,共同研发自动化驾驶技术。利用其地图大数据资源对宝马的车辆导航系统给予支持。而一系列有着人工智能气息的独特产品如BaiduEye、筷搜等也是一时之间占据各大科技头条。

  虽然其中一些产品的宣传意义远大于实际意义,但我们也可以从中看出百度人工智能领域的重视。甚至,一些国内外媒体都将其直接和谷歌、微软、Facebook等国际科技巨头相提并论。由此“百度人工智能”的名声也随着水涨船高,旗下科学家也是频发论文、四处讲演等,博得了不小的学术声誉。

  国际同行的口诛笔伐

  百度ImageNet违规作弊事件也许在普通公众看来好像并没有什么大不了的,不就是参加测试不规范钻了个空子么?但这对于百度在人工智能图像识别这个学术领域的国际地位是沉重的打击。

  国际学术界各大评测和比赛的主旨是希望通过竞争促进研究发展,所制定的各种规则也一般都主要靠参与者的自律,其他国家的学者更关心的都是该领域的真正进展,而不仅是最后的成绩排位,违反学术诚信的事情即使可能不被发现一般也坚决不会去做的。结果百度一来参加这个比赛就被发现作弊,这在学术界绝对算让人大跌眼镜的事情。

  不少国际学者对百度此举也是不留情面地批评讽刺,美国艾伦人工智能研究所的CEO Oren Etzioni将百度比喻为疯狂买彩票的投机彩民;而加州大学一名计算机科学界Jitendra Malik更是用嗑药来讽刺百度:“如果你100米跑出了9.5秒,但你实际上是嗑药吃兴奋剂才取得的,那这个成绩怎么可信呢?”

  截至目前,百度对此并没有对此事件进行公开回应,不过ImageNet官网公布了一封据称为百度深度学习小组的科学家Ren Wu的道歉信,信中Ren Wu称此次事件为一次“失误”:我们已经在论文中添加了注释……并将继续提供相关更新。

  当然,这种解释信不信由你了。

好文打赏,给Ta鼓励
扫一扫用手机阅读本文
Tags:失误  作弊  百度  图像  识别  别人  人工  人工智能  智能  遭遇  
  • 相关搜索
图片推荐
    Apple Watch需求放缓 可穿戴设备发展思考

    Apple Watch需求放缓 可穿戴设备发展思考

    苹果旗下智能手表Apple Watch已经上市两个多月了,不同于4月刚上市时受热捧的景象,近期市场分析师普遍看衰Apple Watch的销量,甚至不少国外媒体在报道中加上了Apple Watch滞销标
    开淘宝网店需要什么手续条件?注意哪些步骤?

    开淘宝网店需要什么手续条件?注意哪些步骤?

    现在在淘宝网上开网店已经不是什么新鲜的事情了,每天都会有很多人涌入淘宝这个大家庭,而对于一些想在淘宝上开店的新手来说,应当先把开店需要准备的手续办理好,万事具备你才能赢在起跑线上。至于开店需要哪些手续
    浅谈:不相关行业的原创文章应该如何写

    浅谈:不相关行业的原创文章应该如何写

    现在SEO界好多人都在谈用户体验,都在谈高质量的外链。都在谈网站要有高质量的文章。可是,这个高质量跟写原创文章分不开。也就是我们只要能写出高质量的原创文章,所谓高质量和用户体验也就有了。那么,高质量的
    揭秘淘宝新闻外链骗局,垃圾链接你敢买吗?

    揭秘淘宝新闻外链骗局,垃圾链接你敢买吗?

    在SEO优化中,一直有这样一句话:内容为王,外链为皇!,SEO外链产业孕育而生,很多站长为了提升自己网站的权重,获取更好的排名,花钱购买外链,而这一行为对百度来说也算是作弊的,随着搜索引擎算法的不断升
    扒一扒黑客为什么不敢攻击支付宝?

    扒一扒黑客为什么不敢攻击支付宝?

    “支付宝被黑客搞了!!!”女票发给我一段视频。中哥我虎躯一震,这么大的事儿居委会咋没通知我??赶紧打开视频。我去,这是黑客吗?谁来解释一下,明明是黑客,为神马穿得这么白,连脸都是白的。。。还有,你带着
    谷歌葫芦卖啥药?Android Wear 2.0延期明年发布

    谷歌葫芦卖啥药?Android Wear 2.0延期明年发布

    TechWeb报道 在智能手表操作系统领域,Google一样也是苹果的劲敌,不少媒体和消费者都聚焦于Google在10月4日召开的发布会,但官方在发布会之前,宣布原定于今年秋季上线的Android W
    由热播剧大秦帝国之纵横想到的网站原创文章的构建策略

    由热播剧大秦帝国之纵横想到的网站原创文章的构建策略

    众所周知,内容为王已经是不争事实,但究竟如何做好网站内容,不仅仅考虑的是产品业务的熟知程度更重要的是文章究竟能不能更深层次的方面帮助你网站的用户更深入的了解自身产品,从而在认识上和客户达成一致,建立信
你是怎么知道非凡网赚网的?
  •   
  • 联系QQ 邮箱:976382653@qq.com 微信:976382653
    在线留言
    发布软文
    广告自助购
    文章调用
    常见问题
    保存到桌面