文章目录

引言:浅谈对如何入门AI领域科研的片面认识


之前几年一直在玩web开发相关的东西,转手进入了AI领域,这其实对于我来说是一个近乎全新的东西。

在web开发的阶段,我们入门其实只需要弄清楚下面几个事情:

能够知道当前最好用的框架是什么,并且熟练使用其中之一;能够知道前后端通信用什么,有哪几种方案,各自优缺点是什么,并且有对应实践;在大前端体系下用什么通信,有什么跨端开发方案,各自优缺点是什么,并且有所涉猎;能够培养一些设计美感,在缺少设计师的时候也能胜任聊胜于无的页面设计;能够知道一些软件工程的知识,在缺乏项目经理的时候也能胜任聊胜于无的项目组织工作。

或许某些时候新手更能够给新手讲明白一件事情。对于我来说,我认为在AI领域,入门应该是可以自己或在导师的帮助下完成特定领域的一篇论文,对整个领域有大致的进展上的认识。

那么,如何在AI领域发论文?

并没有人告诉过我这件事情,从最开始到现在,所有人都在告诉我看什么书,学什么东西,或者看什么论文,但是从来没有告诉我,我什么时候可以发论文,发一篇有质量的论文。

但直到今天,我也算是从零星点点的生活细节中顿获了些许感悟。

何老师说:“硕士毕业答辩时总喜欢说自己创新了什么,而我最讨厌他们说自己创新,因为他们的创新早就被前人做过了。如果一个人真的想认认真真做科研,就应该至少读过该领域50篇论文。总有人跟我说老师我想做科研,那我的要求就是你至少要先读这个领域50篇论文,博采众长,看看人家是怎么创新的,对这个领域有了一定认识再来做科研。”

我以前总觉得发文章是一个特别复杂的事情,一定是要经过若干年努力,要有多么辉煌的研究成果才可以发出来。

王老师总喜欢在计算理论课上跟我们说图灵,这个天才当时想的也不过是考到剑桥三一学院,却没考上,去了王后学院,就从事了可行性计算方面的研究,发了一篇毕业论文,论文中首次指出图灵机——在脚注上说,你可以认为有这么一个机器……这篇论文火了以后,大家就叫这个机器为图灵机了。经历没有什么传奇色彩,也不是苹果砸头上来的灵感。

张老师总举一些发nature、science的例子,而在我粗浅看来这些文章并不是那么触不可及,仅仅是在于数学严密性上是很强的。

但一定是要学习他们的辩思思维的。

昨天我看到了李永乐一个视频,说杨振宁和李政道拿了华人第一个诺贝尔奖。当时是一个年轻俊才辈出的时代,很多理论都是年轻人20多岁提出来的。其实很多理论并不复杂,例如杨、李提出的弱作用力下宇称不守恒,是因为当时在电磁、引力、强力情况下宇称守恒是很容易验的,而弱力情况下一般不好做实验去验证,而当时包括很多非常有名的科学家普遍认为在弱力下宇称应该也是守恒的。杨、李提出一种非常简单的方法去验证到底宇称是否在弱力情况下是守恒的,而在吴健雄的帮助下将实验完成了,震惊世界。实验完成后科学家们甚至认为实验出错了,因为许多物理定理是基于各种守恒性质上的,他们讥笑这种质疑是可笑的。而随着越来越多的验证,证明了弱作用力下宇称不守恒。诺贝尔奖在第二年就颁发给了杨和李,他们当时也就20多岁。

所以距离发文章,我们到底缺点什么呢?

从杨振宁和李政道的例子里,我们可以看到对于当前科研界的进展的把握是十分必要的,什么地方做了,什么地方没做,什么地方值得做。

发表论文并不是特别困难的事情,甚至是好论文,也不一定是特别困难的事情。评价一个事情到底好不好,不一定从它的技术含量是高是低,但一定是从它的影响力,它的价值去评价的。或许杨、李的验证实验并不复杂,但它带来的价值就一定值得诺贝尔奖。

至少,我们应该对所从事的科研方向要足够了解,知道哪里欠缺什么,自己才能发挥自己的想象力去弥补什么。有了主意之后,做任何事情都有可能成功。95后博士生杨欢睿的高被引文章DVERGE提出了Ensemble方式以对抗迁移式神经网络攻击,他也是瞅准了一个痛点,足够清楚目前可以采用的方式,以及加上自己的一些想法和想象去提出的这篇非常有意义的文章。

所以,一定要像何老师说的,先读足够多的文章,再去做科研。科研就是提出想法,验证想法的过程,这是非常有趣的。有太多人发论文不过是在现有成果上进行小改动,这些不值得回味。

因为,要做就做大的咯。

文章目录