复杂性思维——应对混沌与秩序之间的不确定性世界

0
10191
复杂性思维

这篇文章是根据塔勒布的反脆弱引申到我自身的学科“复杂系统” 所得到的。 今天我就在之前很多思考基础上再谈谈这个主题。

风险和不确定性来自于不可预测,如果一切容易预测, 何“险”之有?

那么一个很自然的问题就是这种不可预测性是否无可避免, 我么要走进它的根源, 也就是我们刚刚讲到的复杂性来认识它。 如果用一句话来总结复杂性, 我会说是“ 世界有网络组成, 网络带来的非线性作用, 毁灭了可预测性,却带来了世界的所有精彩, 从生命,到智能, 到我们的文明本身” 。

那么我们就把两句话依次展开:

复杂性导致预测失败的本质

预测是人类最古老的主题, 从一个人的命运生老病死, 到一个国家国势的兴衰。 这都包含在预测这个庞大的主题里。 想象一下,如果你能预测你的人生, 或者某个人能够预测一个国家甚至人类的兴衰, 那将是何等意义的事。 阿西莫夫的小说基地里的故事说,一个叫哈里谢顿的人发明了一个叫心理史学的学问能够预测整个银河帝国的兴衰,便是这类故事的一种形式。

如果粗略把这个世界的东西分个类, 那一定会被分成两个大类,一类可以叫做”死物“ , 比如宇宙里的星体, 固体, 液体, 各类分子原子, 亚原子 。  另一类就是”活物“  , 包括所有和生命有关的东西,从各类生物学的细胞过程, 到我们大脑里的神经运动,再到社会经济。

对于第一类事物,人类已经无比成功的做到了预测, 而第二类事物则不是。

物理模型 

物理预测的故事一类围绕那些确定性的, 周期性的事物, 如单摆或行星, 一类围绕那些微观的随机的不确定的东西, 而中间有一个叫统计物理的东西把它们连起来。

确定性的东西具经典的莫过于行星运动模型的进化史。 从托勒密 (Ptolemy) 的宇宙模型系统, 他的模型里说日月星辰的运动可以分解为一系列互相嵌套的圆周运动,到哥白尼的日心说, 直到开普勒把之前的圆形轨道变成椭圆轨道。

最终椭圆轨道起到了牛顿力学, 模糊被经典的微分方程抽象化, 我们也可以称之为定理。 它们可以预测各类事物的变化,而又可以通过实验检验。 从此苹果落地的抛物线,到日月星辰的运动, 被统一在一起。

这种对现象进行分解,抽象出最一般性的因素的方法就是物理的思维。 很快, 这种思维开始进入微观世界。 这些微小的例子由于测不准原理具有根深蒂固的不确定性,却可以描述, 而之后被实验证实。  没错, 物理预测的力量正在于每一次我们都在实验发生前就知道了将要发生什么。

差不多同时,我们开始构建微观到宏观的桥梁。 如果原子是随机的, 那么它们组成了所有宏观物质,它们有温度,有软硬,有形状,有化学性质, 为什么却是确定的呢?我们能否从微观预测宏观?  我们又一次的成功了, 而这在常识里, 可以被看成不可能的任务。

这不得不归功于统计物理。 统计物理的最重要的观点是, 微观尺度上的大量粒子运动是随机的,通过统计的方法,我们在宏观尺度上得到的东西却可以如磁铁般稳固, 且可以预测的特性。

比如我们可以计算磁铁的磁性,水的沸点。 这种随机到宏观精确的可预测性背后的保证, 正是大数定律。 大数定律的关键观点是你有无数的随机且独立的变量不停加和, 你就会得到一个更大尺度上确定性的个体。  所谓多而不同。

一个典型的例子是掉入水里的花粉颗粒像一个醉汉一样做布朗运动, 而一个巨大的台球掉进去就是扑通一下从加速到减速的确定轨迹。 两者有何不同?体积也。

社会与人类心理预测的失败

在20世纪以后, 在所有之前工业革命基础上出现了计算机, 以至于后面的互联网, 使得人类积累数据, 以及用数学来预测的能力又一次空前提高, 迎来了信息爆炸的时代。我们依然按照之前的思路继续建模,因循着这样的思路,人开始思考社会本身也存在类似牛顿原则一样的第一性原理,是否可以由统计物理来预测。

而在心理学领域,我们也开始认识到人类的心智也如同一台动力学机器, 在客观的受力法则下思考和运行。 对于这一类愿望的典型描述在阿西莫夫的基地里淋漓尽致, 它借哈里谢顿教授的口说出:

人类社会的每个成员如同气体里的分子,他们的运动可能是随机的不可预测, 但是其组成的人类社会确是高度可以预测的。因此它预测了整个“基地“ 的没落, 从而展开了整个它的改变人类历史的计划。 这简直就是对统计物理的观点重演,每个人随机的不可预测, 但是很多人加总在一起, 一个国家,一个民族的兴衰确是高度精确可测的。

但是这些幻想很快落空, 这条路走不下去了。 我们发现, 凡是跟社会和人类有关的领域,我们几乎输的精光。 你想应用大数定律, 你却总在失败。

一个典型的预测失效的例子在于经济金融危机和股市,大家都想预测股票价格,一群最天才的数学物理加发现了black-scholes 方程, 我们想象股市的价格是大量的进入交易所买入和卖出的交易者决定的, 股市价格的本质是人们对公司未来总价值的预期, 如果这些交易者, 就像组成物质实体的粒子一样, 虽然随机, 统计上却可以预测, 市场总体会符合一个经典的随机微分方程。 然而事实逐步违背了天才们的初衷, 这么多的聪明人进入到股市交易搏杀, 却没有几个人能预测2009年的金融危机。

事实上金融市场的背后推手往往有社会层面的突发事件,这些事件更加难以预测。 比如特朗普的当选, 或者英国的脱欧。

而另一个角度, 我们对自己的大脑的预测更是知之甚少, 比如目前几乎还没有什么仪器能够预测你老了会不会得老年痴呆,或者你今晚会不会失眠。我们并不能用受力分析的方法把人脑分解为细胞,然后找到一组方程, 或者用统计的方法, 解出心智运行的模型。

预测失败的元凶 – 网络复杂性

到底是什么, 破坏了我们建造预测性模型的目标?

我们先前的理论一个根本缺陷是一个最重要的假设是不成立的, 它就是独立性假设。 当组成整体的每个个体之间的相互作用可忽略, 我们称为独立假设成立, 这时候,如果每一个个体的行为是随机的, 但是组成总体的特性确实可以确定的。

最致命的是, 人的大脑或人类社会, 独立性假设不成立。 显然你的成长无法忽略周围的某些特定个体对你的影响, 同样的你的大脑里的某个神经元离开周围神经元的信号传递一无是处,几乎就是一个比较大的电阻电容电路而已。

所有这些问题的背后, 隐藏了一个新的问题范式 – 网络。 如果个体和个体不独立,意味着它们的互相影响无法忽略, 这个互相影响, 导致之前的预测范式无法很好的起作用, 有效的理解个体已经不再是理解总体的基础。 这个网络, 会引入如下几个效应:

非线性:
整体不再是部分的加和我们管它叫非线性,这个整体的特性变得特别难以预测。  这个你可以理解当下的互联网使得个人的作用已经远远不是加法。 非线性的基本类型包含负反馈和正反馈,它使得整体的相加的结果更大或者更小于部分之和。

这样的例子在你身边也很多, 两个很优秀组成的家庭可能非常不幸福, 而一群乌合之众在某个清晰聪明的规则下, 可以其力断金。

非线性带来机会, 由于连续的正反馈, 一个单个节点有时可以改变整个网络, 你可以想象某个小人物有时候突然改变了历史的进程, 无论是遇雨失期的陈胜, 还是一战里那个艺术气质的失落士兵希特勒。非线性对应普通个体意味着机会。

混沌:
气象预测一直以来是农业生产的重要课题,曾经有一段时间, 物理学家认为只要能够合理的解出气体运动的流体力学方程, 那么一个月后的天气无非是大量模拟可以解决。

然而气象学家试图对大气建模(当然是牛顿力学了)的过程里,发现了一个不可思议的现象,它们算出来的天气一会儿晴天一会儿下雨:完全相同的一份数据,多保留小数点后一位数,计算出来的就是晴天;少保留一位小数,计算出来的就是下雨。这是机器的问题吗,比如说这是程序员都遇见过的计算机浮点误差导致的?最后这为我们揭示了叫做混沌的物理现象。

有本书叫三体, 事实上牛顿力学里三体问题的时候就已经很难预测了, 三个物体之间只要有复杂的相互预测,在一定时间后, 得到的解都已经极不稳定, 假设计算机程序出那么一丁点的误差, 都会使得我们最终的解与之前完全不同。 这里的不确定性来自于我们无法控制所研究系统的所有信息,而每一丁点的不同都导致结果完全不同。

只要个体数大于等于三, 系统内的非线性连接足够强, 就会发生混沌, 非线性网络大部分都处在混沌成立的条件区间,这使得确定性逐步远离了我们的视野。

相变与涌现:

混沌绝不仅是不可知的混乱, 它的另一面恰恰是我们说的秩序(order)。 我们说非线性网络中的正反馈达到一定程度, 会从比较稳定的结构过度到混沌, 这个混沌边缘的点或者说相变点。恰是所有复杂结构(秩序)诞生的基础, 比如智能的载体神经网络就是在这个混沌边缘的点工作的。  

复杂网络间的耦合:

社会,历史,经济问题恰是两个不同尺度的复杂非线性网络的耦合, 一个是社会网络, 一个是大脑网络 。 两个网络都符合前面的所有特征。 而恰恰是两个网络纠缠在一起。 社会网络的节点, 其实是一个个超级复杂的脑网络, 它们的某个情绪风暴, 会引起下一级社会网络的一个革命风暴, 尤其是当两个网络都处于相变点, 这种级联效应更加可怕, 也使得它们构成的整体彻底的逃离了预测性的边界。

我们要意识到虽然非线性网络在毁灭预测性, 但来了世界的丰富多彩, 生命本身来自于这样的网络, 以至于智能物种的产生, 直道文明和社会, 直到你自己, 这些事情都是不可思议, 也非确定发生的, 它, 也是我们生活的所有滋味所在。

我们既然存在于这张不确定的网中, 就要做到与它对抗, 而是共存。 因为在我们的生活, 还是创业中, 我们真正面临的不是精确的预测每个个体乃至社会的行为, 而是正确的决策, 即使无法预测, 依然可以英明决策。

下面我们就来说一下有关决策应对不确定性的问题:

一些系统的应对不确定性的思维方法可以称之为算法, 我们站在事物发展, 而非自身的层面去看问题。

进化算法:

其实整个生命进化史, 就是一套自然应对不确定性的方法论。  你要看到,从远古生命到现在, 自然环境发生的沧海桑田的变化已经有多少次? 也许有无数次, 你都可以假定生命已经毁灭了, 事实上发生的是, 生命没有被毁灭, 而是在这个过程里, 越来越复杂, 越来越高级。 这背后, 就是达尔文发生的进化论。

我想可以把这件事做如下总结:

1、生命不能预测未来, 但是它可以生成一套在各种条件下的一组行为策略。

比如摄入什么样的物质, 向什么方向移动, 这组策略被一套叫DNA的大分子固定, 也就是我们常常说的遗传编码 , 它通过一个复杂的化学反应, 制造RNA和特定的蛋白质,而一切生命现象都是由特定蛋白质实现的, 我们简单的说就是生命策略, 比如在外界环境出现如何变化时候如何反应。 你可以把DNA的编码看成一系列的if else语句, 就是在某种条件下, 触发某个蛋白质, 实现某一个功能。

2、单组策略的存在时间有限, 它会以繁殖的形式得到一个和自己一样的策略, 但是这个过程不是完全精确的, 它会以一定的方式出错或者说变化。 

这恰恰使得下一代的策略可以轻微的偏离上一代, 从而在一段时间里, 形成越来越多的策略,我们叫做基因池。

3、有的时候不同的基因会发生交叉。 

也就是说把两组策略把各自的一部分给对方, 然后形成新的策略组合。 这种重组产生新的基因的速度会比变异快的多, 也就是我们说的交配。  

4、环境会评估某个策略(DNA) 是不是适合自己, 这个通常由一个叫适应度函数的东西表达。  

适应度越高, 基因就是越适应当下环境。 经过一段时间, 适应环境的策略会比不适应的环境的策略得到更多的个体,因为它自身存活的概率更高, 这样, 最终环境里数量最多的, 是最适应环境的策略。这样的策略不一定有一个。

5、环境会变化。

当环境变化, 最适宜的策略发生变化, 这个时候最适合的策略也发生变化, 导致新的物种和生态系统的生成。

应该说, 这样的一个算法具有一种天然的反脆弱性, 基因的变化是随机的无目的的, 恰恰对应环境的变化是不可预测的无方向的, 生命通过死亡,竞争和繁殖的游戏, 使得群体总有某些个体能够适应环境而延续, 即使对于每个个体这足够残酷, 但是在总体水平上, 却使得基因能最有效的调整自己。  即便不做任何预测, 也可以很好存留。

对于我们日常生活的启发性:

1, 试错而非设计的方法论: 对不确定环境具有最高适应的策略 , 是来自于自然进化和淘汰而非设计, 靠的是繁殖的速度能够跑赢环境变化。 因此, 对于产品设计, 最重要的是加快迭代速度, 远好于常开会。

2, 迭代很重要:  最好的东西不一定是目前看起来最优的, 而是在变化的环境中可以适应自己的。所谓杀不死的是最好的, 也就是塔勒布的反脆弱。 也许一个方案特别完美, 但是条件一旦出现变化, 它就不成立了, 这还不如找一个没有那么完美, 但是适应性更好的方案, 往往迭代试错来的方案具有这个特点。

3, 冗余备份策略: 自然进化的特点是对待个体是残酷的, 而总体上获得进化的反脆弱性,  多子嗣,也就是多备份。 对于产品设计, 或公司运营, 我们要考虑环境变化时候的备选方案。

智能算法:  

进化算法最重要的里程碑是动物神经系统的产生, 或者说我们的大脑。 也就是在这个阶段, 生存策略的生成出现了质的飞跃, 此时的策略, 不再是单向的在环境有水的时候就去喝水这种, 而是出现了所谓的学习策略,你可以把它看成一个生成策略的策略,通过一个叫神经网络的东西, 你可以超越基因编码新的策略。

这里最重要的就是强化学习的出现, 相比进化这种被动的随机的策略搜索, 强化学习更类似于一种主动有目标的调整, 从而使得策略更新的效率极大的加快。

那么,强化学习算法可以看作第二个更有效的面对不确定性的思维框架。

强化学习里最核心的思想是有效的探索策略, 以及探索和收益的平衡。 它包含如下要点:

1, 强化学习分为几个要素, 个体, 环境, 行为, 奖励, 个体做出行动, 获得环境的奖励反馈,同时改变环境,个体为了让长期的奖励最大化, 需要调整自己的行为。 行为的规则的, 也就是不同环境条件下的该做什么行为, 也就是策略, 也就是我们学习的对象。

2, 未来是不确定的,但我们必须在此刻做出选择, 因此, 我们把未来所有可行的选项都考虑进去, 并给每个可行性估值, 它代表我所认为的潜在收益。 我们根据这个估值来做行动的决策, 我们倾向于选择那个估值最高的选项, 但是不要马上抛弃其它选项,而是给其它的选项一个较小的概率执行,这又称为探索。 最初的估值我们可以看作在初期更多就是凭直觉, 后面会迅速调整。

3, 每个行动会带来有关结果的新的信息,这个信息可能对结果有害或者有益, 这时候我们要迅速的调整估值,然后基于新的估值决策。

更高级的强化学习包含了一个世界模型的部分, 也就是说, 在行动之初, 你不仅要设定可行选项, 还要尽可能的在平行宇宙里将不同选项导致的未来展开, 先在思维里战上100轮,减少那些不好的选项, 这就比最初凭直觉估值好的多了, 虽然我们无法精确预测, 但是有一个模糊的世界模型依然可以大大加强我们决策正确的概率, 阿法狗就是凭类似的思想战胜李世石的。

强化学习给我们的启示:

1、 未来不可预测, 但不等于我们可以没有清晰的目标:  

强化学习成立的根据在于一开始就有一个自定义的收益函数,  这个函数必须是行为体已知的, 而不是之前进化算法里来自环境的适应度。 这里的收益, 就是目标, 一开始没有清晰的目标界定, 一切行动无从谈起。

2、只考虑可行边界之内的事, 无论目标有多宏大, 我们每一步只考虑可能做到的几个动作, 及这些动作对目标的影响。

这点的反面就是眼高手低, 很多人每天想来想去,事实上都在想自己的可行区间外的事情。

3、 探索与收益是随时间调整的。 虽然我们始终要考虑探索与收益,但是强化学习过程里, 探索和收益的比值始终在不停减少。也就是说越到后期, 就越以收益为主, 探索,但一定要有限度,因为你的生命是有限的。

这里面直接的方法论就是我们年龄越大就越要保守,如果你20岁, 失败只是打一个喷嚏, 30岁, 还可以从头再来, 50岁, 就很难了, 褚时健毕竟是少数, 已经取得了一定资历的人, 一定要把成功换成更稳定的,可以向下一代传递的东西。

4、无论任何时候, 尝试建立世界模型。

虽然预测是困难的, 你要把不同方案导致的未来,以及它们的结果, 尽量的建立一个世界模型, 就好像一个平行宇宙的展开。这个展开的方式, 一方面来自由你的经验模板塑造的直觉, 另一方面是关于世界运行的原理。 如果你的平行宇宙展开的足够好, 你就得到了一个可能世界的合理分布。 阿法狗其实是面对不确定性的最聪明的算法, 虽然我们不是阿法狗, 但是可以学习它的套路。  有时候, 你做了这件事, 会淘汰一些直觉看起来正确, 但是错误的选项。

曾经的我,思路更加接近于不断试错和迭代的进化算法, 而今天, 我的思维更接近强化学习的系统, 人生苦短, 试错有限,在结构目标非常清晰的时候, 极为高效的试错, 并且迅速的收敛于那个收益最高的解,再此基础上迭代, 是更有效的策略。

如何把这样的思维更精确的结合数据来使用我们会得到贝叶斯算法:
当下这个时代, 我们拥有越来越多帮助我们决策的数据, 谷歌,百度, 知乎, 都在帮助我们迅速的得到信息。 很多时候你会告诉我, 预测无非就是数数, 比如预测大选结果, 我可以做一个简单的假设, 在谷歌上被搜索更多的那位更有可能获胜 , 然后你去查看谷歌的搜索结果, 你居然真的可以准确预测!。

但是这样的方法却不总是奏效, 几年前谷歌搞过一个预测流感的系统,它把流感出现的关键词,比如头痛,发烧,咳嗽, 呕吐都做成了特征。 这些关键词,构成了一组关键特征, 可以用来有效的预测流感是否发生, 只要我们搜索这些词汇, 应该就可以预测流感在一个地区是否会发生。 然而,这个问题虽然一开始的预测比较准确, 很快就完全的偏离了真实的数据, 问题出在什么地方? 我们无法避免隐藏在数据里的大量噪声, 因为产生那些特征的原因非常多, 比如说头痛, 工作疲劳可以头痛, 失恋也可以头痛,感冒仅仅是原因之一。

而贝叶斯算法可以有效的剔除数据里的噪声,因为它可以通过加入先验信息, 把我们几千年积累的知识和大数据结合起来。贝叶斯算法其实是一种非常中庸的态度, 一方面, 我们要保持一套对世界的预测模型, 虽然我们知道它不准确, 另在不确定性面前, 我们最好的办法是保持一种理性的谦逊, 也就是赋予这种原始预测一个有限的概率, 然后我们设计实验收集数据, 如果这个数据支持这种模型假设, 我们就加强一点信息, 否则就减少一点, 这个根据数据调整信心(概率)的公式就是贝叶斯公式, 我更喜欢把它看成一个思维方法。

一个很好的运用贝叶斯的例子来自于对掉入海里的飞机的搜索, 比如之前的马航事件, 这几乎可以说是一个不确定性大到极点的例子,大海茫茫, 我们依据的信息却是非常稀少的。 但是并不需要特别担心, 因为我们有贝叶斯的框架。

首先, 一组专家会对可能找到黑匣子的区域做出限定, 然后, 搜救人员会出动进入这个区域, 它们所做的事情大致是这样的, 我们把区域分成无数的小方格, 首先搜索那些根据专家开始估计的概率最大的区域, 如果没有黑匣子, 就降低这个区域的概率,同时提高那些没有搜救的概率, 这样每搜索一个格子, 这个概率就会变化一次, 最终经过几轮之后, 我们就会得到越来越小和精确的搜救区域, 根据这样的方法, 即使是大海捞针,我们也可以胜利。
在不确定面前,我们能够做的最蠢的事情是直接把某些选项的概率降为0,  因为这样如果它们真的是成立的, 你就死无葬身之地了。

应对非线性的一些策略启示

相变营销:这里记录一些没有那么成系统的思想, 我们知道非线性网络里相变的影响, 那么, 我们也可以利用这种思想来营销。 我们都想爆发式增长, 在互联网世界, 它就是你的客户网络里的一种相变, 如何能够达到这样的产品? 首先是时机,第一个发布的产品在用户的心理永远更容易占据位置。

然后是速度, 因为非线性的原理告诉我们, 速度决定了网络里传播的密度, 最终将影响动力学的稳定点, 只有速度超过一个阈值,我们才能推动这个产品的传播达到一个更高的稳定点,也就是占领整个市场。

关于搜索策略: 鲨鱼在寻找事物时候实行一种像随机游走的姿势, 它时而在一个小范围里不停翻滚改变方向, 时而做一系列极长的不改变方向的行动以达到更远的点, 这个策略事实上是在时间有限希望能够快速探索整个空间的方法 。

因为资源的分布是非线性的,要不是富集状态,要不一穷二白, 相对应的,当我们经过一个小的搜索得不到什么资源时候, 做个较大幅度的调整通常可以跳脱局部极小, 然后再进行比较密集的搜索。  这样往往可以更快的找到富矿。

关于认知偏差
一个很致命的影响我们应对不确定性的策略的因子是心态,很多人在不确定性面前容易犯以下几个错误:

1, 认知的锚定效应, 夸大或缩小一些可能, 而看不到真实的分布。

我们通常喜欢那些容易认知的东西, 而夸大那些可能性。 比如你天天在新闻联播里看到以色列发生了恐怖袭击, 你就会觉得耶路撒冷天天都在发生炸弹爆炸。

比如你很容易想象阴谋论里说的非典是美国人制造的病毒这种事, 因为脑补这样的画面非常容易, 我给你将一个更抽象但是成立概率更高的可能性, 但是由于脑补不成故事画面, 你就不会重视那个可能。 这点在应对不确定性时候是致命的, 因为你对概率的估计能力决定了你策略的准确性。

2,决策的后果不等于质量

很多人是根据决策的后果来思考是否决策正确, 比如当年没有投资马爸爸, 没有买北京房子, 说自己当时有人劝自己做那些事而没有做, 或者差一点做了,然后特别后悔 。

其实这是一个非常常见的误区。 因为我刚刚讲过的一点, 我们的信息永远是不足的, 所谓的最优决策就是在有限信息下的最优决策。 即使你当年有钱投资马爸爸, 但是那时候的你的信息完全不足以支撑你买,这才是事实。  而你不买也不一定不对。

因为你只是看到了所有可能的后果中的一种。  有多少创业成功的人认为自己回到过去还会成功? 100个平行宇宙, 只有一个马爸爸是成为首富, 那99个世界没有投资的你可都做了正确的决定啊。 记住, 成功学鸡汤背后, 可能藏着的就是幸存者偏差。

3, 关于现实扭曲力场最牛的人, 往往做的事不是预测, 而是改变。 虽然预测是不可能准确的, 但是如果你的行动足以改变它,那么世界就会向着你所预想的方向变化 。 也就是说, 正确的决策使得你所预想的未来成为现实, 那句鸡汤不是说, be the change you want to see 吗?  正是说, 与其无休止的预测, 不如让你的力量产生一个足够强大的现实扭曲力场。

芒格学院
芒格学院