爱吧机器人网 » 技术 > 机器学习 > 正文

机器学习太讨厌!细数ML五大罪,引发网友大讨论

鱼羊 发自 凹非寺

在当今的人工智能领域,机器学习已成主宰,独领时代风骚。



但登上技术王座并不意味着地位永固,万众归心。

偏偏就有人不买账,恨不能拿着大喇叭向全世界宣布:讨厌机器学习!

甚至还有理有据,灵魂拷问机器学习。

振臂一呼,追随者众。对机器学习的质疑掀起波澜,引发了一片热议。

五问机器学习

质疑源自一位不愿透露姓名的人工智能研(shou)究(nue)者。



灵魂质疑一:今年的技术明年就out

当年还说RNN好,转头就投入了CNN的怀抱。

如果不做技术的弄潮儿,转眼机器学习的大浪就把你拍死在沙滩上。

技术迭代是正常的,可无休止的更新会让一天的专注学习全都付诸流水。



灵魂质疑二:付费墙

想做机器学习,数据集和算力缺一不可。

拥有更强大的计算资源,你就可以快人一步地训练并测试方案。

那不就是比谁更能烧钱吗?



诚然在许多工业领域,资金投入一样非常重要,钱总能带来更快更好的进步,但在机器学习领域,问题远不止于此。

只要肯烧钱,即使你的数据集分类器是一坨垃圾,你的模型也可能比别人学得更快更好——这才是问题所在。

哦,做数据集也要花钱呢!

这还不够让人讨厌的吗?

灵魂质疑三:code/改进机器学习代码令人沮丧

黑盒是老生常谈了,但你可知道,它竟给程序员造成了精神折磨?

码代码解决问题给人一种创造的快感,但神经网络的黑盒属性破坏了这一切。

做一个炼丹师会快乐吗?不会的。我调参了,我的分类准确度提升了,可它是为什么提升的?鬼知道!

这位工程师举了个例子,Ta曾花费了数周的时间在改变输入数据的形态和设置,调整每个层的节点数量这样的事情上,然而,这一切毫无效果。

有一天Ta把稠密层上的激活函数从relu换成了selu,神奇的事情出现了,只是改变了字母,网络的准确度就超越了过去几周里所有的尝试!

这样的感觉太糟糕了,就好像你并把握不住你的代码。你做出了调整并且也知道会有所改进,可这个改进在何时何地以何种程度出现,没人能给出准确的答案。

花费在这种事情上的时间越久,失望的感觉就会捆得人越紧,到底是我玩机器学习,还是机器学习玩我?

工程师可不是无情的调参机器啊。



灵魂质疑四:依赖数据集

没有数据集的神经网络是没有灵魂的空壳,可数据集会存在什么样的bias可说不好。

拿考试复习来举个例子,非机器学习的方式是从头开始建立对学习资料的理解,扎实的理解足以解决任何可能出现的问题。

而机器学习的方式则是搜集教授前几年出的试题,而后疯狂刷题。



诚然刷题可能会让成绩更好看,但问题是在考试结束之后,在实际解决问题之时,真正掌握了知识的人更有可能发挥坚实的作用。

更糟糕的是,在机器学习的逻辑里,如果答题出错,那么一定是因为这道题没出过。

在实际应用场景当中,神经网络会把数据集里的固有偏差变成自己的特质,在遇到以前没有见过的情况时它就变成了那个不靠谱的猪队友。

灵魂质疑五:建议使用机器学习解决问题的人和真正的ML工程师缺乏联系

引发热议

五点质疑引起热烈讨论,许多人产生了共鸣:

我非常烦恼的是有些人文章写得稀烂还沾沾自喜,要是不开源代码,我压根不想读他们的文章。在这个领域里,许多结果根本无法重现。

付费墙这件事我也很想吐槽。看英伟达的论文里说的:噢,看我们这个网络多么鹅妹子嘤,你只需要8个V100就能复现我们的工作哟。简直想打人。
 


赞成。让模型变快基本就是纯靠经验,课程和教材都没啥帮助。不过倒是有一些技术标准可以用来诊断模型里偏差 vs. 方差的问题。
 


也有人不以为然:

我认为这些方法并没有变化得那么快。注意力机制是在2013年提出的,但它对机器翻译来说依然非常重要。同样的例子还有LSTM,90年代末期它就出现了。

甚至是RNN,尽管用的比以前少了(这也是有争议的),但ResNet在概念上仍对LSTM有很大影响。
 


机器学习的准入门槛很低了,有时候甚至能从Google和AWS上拿到免费的GPU时间。即使是在计算机科学领域,ML也不是最贵的。更何况ML是非常开放的,很多最新研究成果都能轻松获取。
 


其实,机器学习还是一个非常年轻的领域,它潜力巨大,但这也意味着存在许多未知。随着基础研究的推进,这个黑盒在未来很可能渐渐透明,发挥更加强大的超能力。

你觉得呢?



上一篇:恶意的机器学习如何破坏人工智能?
下一篇:Google发布基于AI的学习程序Socratic
精选推荐
比利时研发出可以自我愈合伤口的软体机器人
比利时研发出可以自我愈合伤口的软体机器人

[2017-09-03]  软体机器人是机器人技术的新兴领域; 他们“可以与人类相互作用,而不会杀死他们,并拿起像西红柿这样柔软的物体。” 从长远来看,布鲁塞尔大学队伍正在努力创建一个类似的材......

揭秘达芬奇手术机器人
揭秘达芬奇手术机器人

[2018-04-19]  达芬奇手术系统是由美国Intuitive Surgical公司制造的机器人手术系统。美国食品和药物管理局(FDA)于2000年通过该标准,旨在利用微创手段 ...

为未来战场创造更有效的机器人 美国陆军研究人工纳米马达
为未来战场创造更有效的机器人 美国陆军研究人工纳米马达

[2019-10-11]  为了使机器人在战斗中更有效、更多才多艺地成为士兵的战友,美国陆军研究人员正在执行一项任务,即研究肌肉分子生命功能的价值,以及复制过 ...

2022年全球工业机器人市场将达到790亿美元
2022年全球工业机器人市场将达到790亿美元

[2017-09-04]  预计到 2022年, 全球工业机器人市场将达到790亿美元, 并在预测期内登记11 5% 的复合年增长率。随着发展中国家中小型企业需求的不断增长, 采用自动化技术以确保生产质量......

美国普渡大学研发快动作软体机器人,灵感来自变色龙舌头捕食
美国普渡大学研发快动作软体机器人,灵感来自变色龙舌头捕食

[2019-10-31]  本文图片均来自:Ramses v Martinez 普渡大学变色龙、蝾螈和许多蟾蜍利用积蓄的弹性能量,向距离1 5倍体长的毫无防备的昆虫伸出粘糊糊的舌 ...

2017年:AI渗入云端
2017年:AI渗入云端

[2017-12-29]  云中的人工智能不仅仅是科技巨头的权力游戏,它也可能是人工智能领域的下一个飞跃。加利福尼亚州的Rigetti Computing公司刚刚使用其原型量子芯片之一在其云平台上运行机器学......

美国喷气推进实验室的AI驱动无人机挑战人类飞行员
美国喷气推进实验室的AI驱动无人机挑战人类飞行员

[2017-12-08]  随着无人机及其组件越来越小,效率越来越高,功能越来越强大,我们已经看到越来越多的研究开始让无人机自主飞行在半结构化的环境中,而不依赖于外部定位。 宾夕法尼亚大学在......

如何让人工智能机器人快速自我纠正错误并吃一堑长一智?
如何让人工智能机器人快速自我纠正错误并吃一堑长一智?

[2017-08-23]  莱斯特大学数学系的研究人员在《Neural Networks》杂志上发表了一篇文章,概述了新算法的数学基础,可以使人工智能收集错误报告并立即纠正,而不影响现有技能 ,同时还会积......

本周栏目热点

深度学习反向传播算法(BP)原理推导及代码实现

[2017-12-19]  分析了手写字数据集分类的原理,利用神经网络模型,编写了SGD算法的代码,分多个epochs,每个 epoch 又对 mini_batch 样本做多次迭代计算。这其中,非常重要的一个步骤,......

如何在机器学习项目中使用统计方法的示例

[2018-07-23]  事实上,机器学习预测建模项目必须通过统计学方法才能有效的进行。在本文中,我们将通过实例介绍一些在预测建模问题中起关键作用的统计学方法。...

[2017-08-28]  模拟退火(Simulated Annealing,简称SA)是一种通用概率算法,用来在一个大的搜寻空间内找寻命题的最优解。1、固体退火原理:将固体加温 ...

Machine Learning-感知器分类算法详解

[2018-05-31]  今天我们来讲解的内容是感知器分类算法,本文的结构如下:什么是感知器分类算法,在Python中实现感知器学习算法,在iris(鸢尾花)数据集上训练一个感知器模型,自适应线性神......

机器人是怎么深度学习的?

[2016-03-29]      一个人独处时,感觉有点孤单,怎么办?微软亚洲研究院推出的微软小冰,或许 ...