两种提idea的思路:先有问题,再找答案?还是现有答案,再找问题?

你们可能会奇怪为什么我把《模拟游戏》的剧照放在封面,为什么我把图灵的照片放在这。其实这个跟我今天要说的内容很有关系。

我以前讲过一种错误的找idea的方式:从别人的论文里面挑毛病。但是我发现,其实很多人,无论是刚入学的研究生,还是已经毕业了的博士,都往往会陷入到另一个痛苦的科研过程中。这种痛苦,可能不是因为他们挑别人论文的毛病导致的。而是因为另一个很容易被人忽视的原因:那就是先找到一个科研中遇到的问题,然后再去找答案或者方法去解决这个问题。

我知道一些不负责的老师,往往会跟学生说这么一段话:

我现在有一个课题,是研究XXX的。我们经过一段时间的调研,发现在研究XXX的过程中,遇到了YYY这个问题。如果你能把YYY这个问题给解决了的话,那么你肯定可以发表在顶级会议或者期刊上面。你想不想去解决YYY这个问题?这个问题很有意义,很多研究XXX的人都遇到了这个问题。YYY这个问题已经是被大家普遍认可的,你要是解决了,你将来可以在这个问题基础上,发表一系列的论文。

在这段对话中,往往导师貌似是在给学生指点一个方向,实际上很可能这个方向是一个大坑。因为这段话对里面,导师并没有给出一个idea,而是指出了一个科研的问题而已。大家一定要明确到底什么才是一个idea。

其实更加严重的是,很多学生在不明白一个idea的组成部分的时候,也往往误以为:只要我发现了一个需要研究的问题,我就是有了一个idea。比如说,有的同学发现在城市里面部署的pm2.5监测站有点少,在北京只有20几个监测站。这些监测站只能告诉大家监测站周围的pm2.5的情况,并不能反映出任意位置的pm2.5。于是乎,有的同学就误以为发现了一个重大的idea:如何计算出任意位置的pm2.5的数值?

这个时候,如果你是这个同学,你应该怎么解决这个问题呢?诺大的北京城,就这么20几个监测站而已,监测站之外的位置的pm2.5到底是多少呢?你怎么解决这个问题呢?

大家应该发现了,先找到一个科研中遇到的问题,然后再去找答案或者方法去解决这个问题,这种方式存在一个致命的问题就是:你只找到了一个问题,但是你不确定到底应该怎么解决这个问题。最后可能花了很长时间甚至一两年,也没找到一个合适的方法来解决这个问题。因为你并没有在找到问题的时候,有任何能够解决这个问题的insight。

当然了,很多科研中的非常困难的问题,也都是这么开始攻克的。然而,如果一个科研问题真的是很多人都没能解决的,那么我们真的需要问自己一下:我能解决这个问题么?或者,这个问题到底为什么别人没能解决?再或者,这个问题,到底有没有能过被解决的可能性?

为什么不能先找一个问题,后去找答案?

其实图灵的理论可以证明我说的是正确的。

如果大家学过计算理论的话,应该了解到当年图灵在研制计算机(图灵机)之前,他先做了大量的理论工作。基于这些理论,他才有信心制造出计算机。而他提出的这些众多的理论中,最关键的就是图灵停机问题。

这个问题翻译过来就是,一台图灵机一旦开始工作,它到底会不会停下来?一台图灵机开始工作,代表着它开始求解一个问题。他的停机代表着它已经找到了问题的答案。图灵最终证明了:一台图灵机是否能够停下来,是没法被证明的。

在电影《模拟游戏》里面,图灵制造出了图灵机以后,他并不能保证他造的机器能够在第二天早晨6点之前停下来,也就是他并不确定他能够在第二天早上6点之前破译德军的密码。

翻译过来就是:有一些图灵机(或者问题)在多项式时间内停不下来,甚至可能永远也停不下来。换句话说,有些问题,可能永远也找不到答案。那我再进一步,根据这套理论,我们可以得到一个结论就是:不是所有的问题都能在有限的时间内得到解决。 换句话说,图灵当年已经从数学上证明了一个可怕的事实:往往找答案,比找问题难多了。

于是乎,当我们面对一个科研的问题的时候,如果我们没有能过解决这个问题的insight的话,那么我们将处于一种非常迷茫的状态。在接下来的科研过程中,我们会陷入无穷无尽地探索当中。而这种探索是让人绝望的,因为你会发现你在一直失败。

那么如果我们反过来,先是找到一个insight,找到某些有趣的现象。然后利用这个现象做出一个有意思的设计,之后再给这个设计找一个合适的场景。然后从这套设计和场景中,再找到我们真正解决的问题,整个过程就容易太多了。

先找答案,再去定义一个问题

我之前介绍过aircloud这篇论文。这篇论文就是解决了我刚才说的,预测任意位置的pm2.5的数值。那么他是怎么解决的呢?作者在北京市部署了上百台他们自己设计的,廉价的pm2.5传感器,并且提出了一个很漂亮的模型来预测任意位置的pm2.5.

作者在写论文的时候,他的逻辑是:我们发现了一个非常严重的问题,那就是我们无法知道任意位置的pm2.5数值。我们发现了一个insight:pm2.5在空间分布上是连续的。于是我们设计了一个数学模型来预测任意位置的pm2.5。为了支撑我们这个庞大的模型,我们设计了一些廉价的pm2.5传感器。

可是,事实上,这并不是他们科研的真正思路。作者们当初是因为他们发现现在的pm2.5检测设备过于昂贵,于是他们开始设计一款廉价的pm2.5传感器。这种pm2.5传感器设计好了以后,他们发现既然这么便宜,我们就大量部署一下看看效果吧。结果如他们所料,大量部署了pm2.5传感器以后,他们可以实现了精准预测任意位置的pm2.5。最后他们才把精准预测任意位置pm2.5当作他们解决的问题,然后形成了他们论文。

我想说的是,很多科研成果,不是先预设好了一个十分困难的科研问题,然后大家去找答案。这个不太现实,图灵已经证明过了。而现实是,好的科研成果是通过作者对于实验和理论的长期积累以后,发现了一些有趣的现象和insight,然后弄出了一套方法,最后再去找一个科研问题套在这个方法上面而已。

而这种做科研,或者说提idea的思路,往往更加高效。提出来的idea有着insight的支持,也就几乎不可能会失败。这种idea经常可以在很短的时间内就做出来。

《硅谷》

有个喜剧叫《硅谷》,讲的是几个人一起创业的故事。我在2017年的时候,方小文同学告诉过这个电视剧不错,但是我没看这个电视剧。前几天我把这个美剧看了一遍。一共6季。

这帮人在创业的时候,先设计了一款app。这就相当于我们先找到了一些insight,然后设计了一个方法。

然后他们去拉投资。在接触投资人的过程中,他们逐渐发现他们设计的app不满足投资人的需求。于是乎他们开始把他们的app进行重定位。这就是一个在做论文重定位和寻找新场景和新问题的过程。

最终,他们的app发布了,然后根据用户的需求还需要增加新的功能。这就相当于我们在之前的论文的基础上,做一些扩展,等等。

从这里面大家可以看到一个有意思的事情:创业公司想要成功一定是掌握了一些核心技术,然后把这些技术用在不同的商业场景中。这样一来,技术本身可以去适应新的场景。而不是我先找一个商业场景,之后再试图解决这个场景里面的问题。这个跟科研是一样的。

其实,科研真的没那么复杂。一切喜欢把科研神话和妖魔化的文章,都是在忽悠人的。科研本身,是一种创新。而这种创新往往伴随的是风险。所以科研的核心也就是如何控制风险。今天我给大家介绍的这个思路,也是众多控制风险的方法之一。加油吧。

—————————————————-END———————————————————–

我们建立了一个微信公众号:“分享科研经验的科学家”。我们会同步分享科研经验到这个公众号。在微信里,我们的文章可以更加自由地排版。文章也会更加适合阅读和传播。我们相信,经过大家的不懈努力,一定会帮助到越来越多的同学们。请大家关注我们的公众号,并且把这个传播给因为科研而痛苦的同学们。除了扫描二维码,大家还可以通过在微信上搜索“分享科研经验的科学家”来添加我们的公众号 :

Written on December 26, 2021