AIfuns

为中华之富强而读书

0%

Hausdorff空间定义:如果对于拓扑空间X中任意两个不同的点$x_1$和$x_2$,分别存在$x_1$和$x_2$的邻域$U_1$和$U_2$使得这两个邻域无交,则称X为一个Hausdorff空间.

定理:Hausdorff空间中的任何有限集都是闭的。

拓扑学核心任务:寻找拓扑不变性质

拓扑的定义:
设X是一个非空集合。X的一个子集族$\tau$称为X的一个拓扑,如果它满足:

  1. X,$\varnothing$都包含在$\tau$中。
  2. $\tau$中任意多个成员的并集都在$\tau$中。
  3. $\tau$中有限多个成员的交集都在$\tau$中。

集合X和拓扑$\tau$一并称为拓扑空间。

诱导拓扑:若X为拓扑空间,Y为X的子集,Y上的子空间拓扑或诱导拓扑是以X的开集与Y的交集作为这个拓扑的开集而定义的。

定理:一个子集为闭集,当且仅当它包含了自己全部的极限点。

定理:A的闭包是包含A的最小闭集,换句话说,是包含A的一切闭集之交。

拓扑基:设集合X上有了一个拓扑,$\beta$为这个拓扑的一组开集,使得每个开集可以写成$\beta$中成员的并集,则$\beta$叫做这个拓扑的一组拓扑基。

同胚:是指一个连续单一满映射,它的逆映射也连续。

定理:设X为拓扑空间,$\mathcal{F}$为X的一组开集,他们的并集是整个X。这样的一组开集叫做X的 开覆盖。若$\mathcal{F}’$ 是$\mathcal{F}$的一个子集,并且若$\bigcup \mathcal{F}’=X$,则$\mathcal{F}’$叫做$\mathcal{F}$的一个子覆盖。

定义:拓扑空间X紧致,假如X的任何开覆盖包含有限子覆盖。

群”是一个“ 有结构的集合”

紧致空间的无穷子集必有极限点。(如果在紧致空间内取出无穷多个点,那么这些点的分布必然在某处显得很拥挤,这就是极限点)

道路:一个连续映射$\gamma{:[0,1]\rightarrow} X$

定义:空间被称为道路连通的,假如它的任意两点可以用一条道路连结。$\gamma{(0)}$和$\gamma{(1)}$分别叫做道路的起点和终点。注意,若$\gamma^{-1}$定义做:

则$\gamma^{-1}$是连结$\gamma{(0)}$和$\gamma{(1)}$的一条道路。

(基本群是利用空间中的道路连通构建出来的)

定理:道路连通空间是连通的。

粘合拓扑:设X为拓扑空间,$\mathcal{P}$为X的一族互不相交的非空子集,使得$\bigcup{\mathcal{P}}=X$ ,这样的一个族$\mathcal{P}$叫做X的一个划分。按照下述方式制造一个新空间Y,叫做粘合空间:Y是$\mathcal{P}$的成员,并且若$\pi : x\rightarrow y$将X的每点送到$\mathcal{P}$所属的成员中,而Y的拓扑是使$\pi$为连续的最大拓扑。于是,Y的子集O为开集,当且仅当$\pi^{-1}{O}$在X为开集。我们可以把Y看做是从空间X出发,把属于$\mathcal{P}$的每一子集粘合成为一点而形成的空间。

定义:G是一个拓扑群,假如它既是一个Hausdorff空间,又是一个群,并且这两个结构在下述意义之下是相容的:群的乘积$m:G\times G \rightarrow G$,与群的求逆运算$i:G\rightarrow G$都是连续映射。

定义:设X是一个拓扑空间,$A\subset X$.如果点$x\in X$的每一个邻域U中都有A中异于x的点,即$U \bigcap (A-{x}) \neq \varnothing$,则称点x为A的一个凝聚点极限点。集合A的所有凝聚点构成的集合称为A的导集,记做$d(A)$,

定义:设X是一个拓扑空间,$A\subset X$.集合A与A的导集$d(A)$的并$A\bigcup d(A)$称为集合A的闭包,记做$\overline{A}$

定义:设X是一个拓扑空间,$A\subset X$.如果A是点$x\in X$的一个邻域,即存在X中的一个开集V使得$x\in X \subset A$,则称点x是A的一个内点。集合A的所有内点所构成的集合称为A的内部,记做$\mathring{A}$

每一个球形邻域都是开集,从而任意多个球形邻域的并也是开集;另一方面,假如U是度量空间X中的一个开集,则对于每一个$x\in U$有一个球形邻域$B(x,\epsilon) \subset U$,因此$U = \bigcup_{x\in U}B(x,\epsilon)$.也就是说,一个集合是某度量空间中的一个开集,当且仅当它是这个度量空间中的若干个球形邻域的并。因此我们可以说,度量空间的拓扑是由它的所有的球形邻域的集族求并这一运算“产生”出来的。

定义:设$(X,\mathcal{T})$是一个拓扑空间,$\mathcal{B}$是$\mathcal{T}$的一个子族。如果$\mathcal{T}$中的每一个元素(即拓扑空间X中的每一个开集)是$\mathcal{B}$中某些元素的并,即对于每一个$U\in \mathcal{T}$,存在$\mathcal{B}1 \subset \mathcal{B}$,使得$U=\bigcup{B\in \mathcal{B_1}}B$,则称$\mathcal{B}$是拓扑$\mathcal{T}$的一个基,或称$\mathcal{B}$是拓扑空间X的一个基。

“子空间”实际上是从大拓扑空间中“切割”出来的一部分。这里有一个问题,概言之就是:一个拓扑空间什么时候是另一个拓扑空间的子空间?换言之,一个拓扑空间在什么条件下能够“镶嵌”到另一个拓扑空间中去?

定义:设X和Y是两个拓扑空间,$f:X\rightarrow Y$,映射$f$称为一个嵌入,如果它是一个单射,并且是从X到它的像集的$f(X)$的一个同胚。如果存在$f:X\rightarrow Y$,则我们称拓扑空间X可嵌入拓扑空间Y

拓扑空间的某种性质,如果为一个拓扑空间所具有也必然为它在任何一个连续映射下的像所具有,则称这个性质是一个在连续映射下保持不变的性质

点集拓扑 GTM27

disjoint : $A \bigcap B = 0$

the absolute complement of a set A is written $\sim A$

the relative complement of A is written as $X \sim A = X\bigcap \sim A$

if R is a relation and A is a set,then R[A] ,the set of all R-relatives all points of A.

the members of the topology of $\mathcal{T}$ are called open relative to $\mathcal{T} $

normal space(p128) : a space is normal iff disjoint closed sets have disjoint neighbourhoods.And another statement is suggested that a family of neighbourhoods of a set is a base of neighbourhood system of the set iff every neighbour of the set contains a member of the family

regular space(p129):iff for each point x and each neibourhood U of x , there is a closed neighbourhood V of x ,such that V $\subset$ U,that is a closed neighbourhoods of each point is a base for the neighbourhood system of the point.

Suppose that one-point sets are closed in X.Then X is said to be 【regular】if for each pair consisting of a point x and a closed set B disjoint from x, there exist disjoint open sets containing x and B, respectively.
The space X is said to be 【normal】if for each pair A,B of disjoint closed sets of X,there exist disjoint open sets containing A and B, respectively.

第二可数公理:一个拓扑空间如果有一个可数基,则称这个空间满足第二可数公理。

第一可数公理:一个拓扑空间如果在它的每一点处都有一个可数邻域基,则称这个可数空间是第一可数的。

p129,结尾的一段很重要

Lectrue 1

Structure and Clarity

Know your readers who want to

  • know the result of the paper to determine to read on - Abstract
  • know the intuitively the key idea behind this paper,how it is derived,what are the significance and implications - Introduction
  • know all the gory details whole paper

Difference between writing papers in English and Chinese

Cultural

  • Confidence versus modesty:中国认为谦逊是好的表达方式,而外国人则认为证据才是最有力的。
  • “Responsibility” of delivery(how much the reader can understand you). 中国人认为,背景知识应该是读者所预先掌握的;而外国人则相反。
  • Language:Direct translations often do not work,so,can i write paper in Chinese and then translate it into English?Theacher do not recommond you to do so,cause that is not a good practice.Ofent come to a bad translation.

No personal expression in your paper!

Lectrue 2

Main Contents of a Scientific Paper

first of all , title.

Title

  • Best representation of the paper : contributions and unique features.
  • Generally not a sentence
  • Importance of right word order
  • No waste of words

Abstract

  • Summary in a few hundred words
  • Very important to attract readers

Introduction

  • Motivations and problem descriptions:what is motivation to write the paper and what is the main problem we discussing
  • Academic and/or industrial impact
  • Literature reviews
    • Show the SOTA
    • Cite references available to general public
    • Avoid offensive remarks
    • Use the most recent results
    • Orgnization of the paper (optional)

Problem Descriptions of Formulation

  • System configuration , environment,etc
  • Definitions of all notation for variables,symbols,etc.
  • Mathematical models and formulations.

Methodology

  • Main ideas to solve the problem
  • Theorems and proofs
  • Descriptions of the approach or algorithm

Results of applications , experiment or testing

  • Description of the practical or experiment system
  • Description of the data and the associated system
  • Descriptions of the computer system
  • Presentation of the results:tables,figures,etc.
  • Applications and benefits

Conclution

conclution is not the repeat of the abstract.

  • Summary of your findings (not a repeat of abstract)
  • Concluding remarks

Acknowledgment

  • Acknowledge the funding agencies
  • Thank individuals

References(Very important!!!)

  • List references in approproate fromat
  • Have recent references if possible
  • Give complete information
  • List appropriate numbers of references
  • Do not list anything that is not refereed to
  • Do not list too many home made references

List references in appropriate format and try to meet the requirements of the journal

format must be consistently

论文的三段式结构

前言

老师将论文大致分为三个部分。通常来说,引言段和结论段应该以议论文的形式来进行书写,而中间段可以以写说明文的方式进行书写。所以引言段和结论段通常来说需要较强的逻辑性,而中间段则需要写清晰的实验过程。

  • 引言段
    需要得出的结论是,这篇文章的研究目标是合理的,论据应该是从各种文献中收集来的相关资料。
    • 从论述结构的角度来看,引言段是从一般到特殊(倒三角),从一个较为普遍,大家都比较接受的问题或者观念入手,逐步引导读者,逐步深入,最终说服读者接受一个特定的研究目标。
  • 中间段
    Objective , method , result
  • 结论段
    目的是为了说明这篇文章是有价值的,所使用的论据主要是自己的(即中间段)的研究结果,同时也包括一些从文献中搜集来的相关资料。
    • 从论述结构的角度来看,结论段是从特定到普遍(正三角),从一个特定的研究结果开始,引导读者接受这个结果所带来的普遍的意义。

写论文越早越好,最好早于做实验和采集数据,因为写作引言段是不需要有任何实验数据的。而且,一个与Introduction相对应的单词叫做outroduction,是conclution的同义词。这就好像,如果把读者比作猎物,那么Introduction就像是洞口,是吸引猎物上钩的诱饵;那么中间段就是洞内,吸引猎物继续前进,看一看;最后,结论段将猎物带出洞。

引言段


引言应落脚于研究目标,所以在引言结尾一边都连接着对应研究目标的完整描述。在本模板中,将引言和研究目标作为一个整体来考虑,可以更好的分析他们之间的逻辑关系。在这个模板中,可以分为相互对应的两大段:

  • 在第一段,确定一个研究机会。从一个大问题开始,到提出一个研究空白、研究问题结束。
  • 在第二段,提出一个解决方案,并占领这个研究机会。即:清晰的描述研究目标,填补在第一段中的研究空白

中间段


如何确立一个好的研究课题以及怎样才算是一个好的研究课题:

  1. 填补研究空白:
    致力于发现现有文献中的研究空白或者漏洞,而我们提出一个课题去弥补这个漏洞。一般来说,空白都是领域内的老问题,虽然被普遍认可,但是填补的难度很高,具有挑战性。因此,主要强调课题中的创新部分,它可能是一个新的解决方案或者是从其他领域中借鉴过来的新的想法。同时,还因为它是一个老问题,还需要了解前人都做过怎样的尝试,我们需要论述,我们的研究与前人的研究有着怎样的不同。或者我们的研究怎样才能与前人的研究成果相依托相配合。
  2. 延伸现有研究:
    在这个方法中,我们追踪某一领域的研究历史,一项接一项的成就,每一项都承接着上一项的历史,建立在上一项的基础之上,同时又为下一项研究奠定了基础。延伸现有研究往往会有新的问题,甚至是新的领域。新的问题往往蕴含着新的机会,但意义往往并不十分明确,对于没有经验的研究者来说,容易迷失。所以,要始终牢记长期目标,要时常问自己,这一项工作的意义和必要性,我们选择的这一项研究课题对于我们的长期目标和受众读者来说有什么实际的意义和贡献?
  3. 复制成功的研究:
    将一项成功的研究在不同的情况下进行复制。

为了确定一个好的课题,上述三种方式可以单独使用也可以组合使用。那么,怎样才算是一个好的课题呢?这里也有三条准则:

  • 具体可行:所有的术语和变量都应该有明确的定义。整个课题具有明确的边界。不应该存在任何先入为主的假设。
  • 开放的和可争议的:可证伪性是区分科学与非科学的标准。如果课题是不可证伪的,那么就是不可取的。
  • 一个好的课题应该能够激发创新:技术的发展为创新制造机会,而技术的发展可能来自本领域,但更多的却是来自其他不同的领域。跨领域甚至是跨学科的思考往往是创新的来源。

最后,有两种研究课题是最牛的:

  1. 研究者填补了当前领域内的所有漏洞,完善了目前的知识框架,在他的工作之后,没有人能够做进一步的改进了。
  2. 研究者突破了目前的知识框架,为更多的机会打开了大门,在他的工作之后,有很多研究者跟随着他的脚步进行着研究。

确立具体的研究目标


大处着眼,小处着手。将长期目标和短期目标结合起来。

  • 大处着眼:不管我们目前自身的能力或者是自身的资源是多么的有限,我们都希望能够尽可能的参与到一些有意义的大事业中,从而使我们的工作更有意义。如果我们局限于自身的实力,而只甘心做一些细枝末节的项目,那么我们的工作很难有大的影响,也很难对我们的工作保持长久的热情。更重要的是,我们丧失的是成长的空间。
  • 小处着手:不管我们的理想有多么的宏伟,我们每一次的进步,都应该根据自身现有的条件,踏踏实实的从小事做起。

因此,要将手头需要做的小事和心中所要做的大事联系起来。如果我们只关注眼前的小事而没有心中的大事,那么我们的项目可能就会由于苟且而没有意义。相反,如果我们只关注心中的大事,而不去做手头的小事,那么我们的项目可能就会限于大而空。

如果把我们的长远目标比作一个宏伟的建筑,那么我们的当前目标可能只是一个小小的砖块。在实际中,我们的长远目标可能是和许多别的研究者所共享的,大家的贡献合在一起就能够完成一个伟大的事业。

文献综述的两个基本点


学而不思则罔,思而不学则殆。

  • 有所学:在文献综述中,要展示与我们专业相关的所有的知识,有一个全面的了解。要尽可能的包括所有的,相关的,主要的文献。如果在我们的文献综述中遗漏了一个与文章目标相关的文献,那么在审稿人的眼中,我们的论文就是不专业的。

阅读文献的两个阶段


好记性不如烂笔头。

将论文中的内容抽象出来。

用故事的逻辑写文献综述


一个好的故事应该是有起伏的,有起伏才能建立起一个吸引人的故事。故事的起伏能够积累和释放听众的情绪,从而产生强大的影响力。那么我们怎样才能说好一个有起伏的故事呢?图中的木板包括四个要素:

  1. 情境(陈述背景)
  2. 冲突(矛盾的表象)
  3. 关键问题(矛盾的本质)
  4. 解决方案(如何解决矛盾)

其中:

  • SCQA是一个讲故事最自然的顺序。而在实际的写作情况中,这个顺序是可以有所调整的。
  • 有的时候,关键问题和解决方案比较易于为读者所接受,那么,就可以采用比较省时间的开门见山的方式,也就是QASC或者QACS。首先提出关键问题和解决方案,直接点明本文的解决问题和研究目标,随后再慢慢介绍情景和冲突。
  • 如果你希望你的文章能够有冲击力,也可以采用CSQA的顺序,首先提出冲突,引发读者的关注,随后再介绍情境和后续的解决方案。

文献分析的三种逻辑推理方法

  • 归纳法:通过对各种不同的资料进行归纳总结,从而由个别的证据推断出一般性的规律。简单的说,就是实现由点到线的推理。归纳推理有两种方法:
    • 求同:找出各种不同文献之间的共同点,从而找出普遍性的规律
    • 求异:通过比较各种不同文献资料之间的不同点,从而找到造成这种不同的关键因子,或者是变量的趋势、走向。
  • 演绎法:把文献中已经总结出的某种一般性的规律,和我们当前所面临的实际情况相结合进行演绎分析,由一般到个别,简单的说,就是实现由线到点的推理。我们所熟悉的由大前提、小前提来得出结论的三段论的结构就属于一种演绎推理。
  • 溯因推理:从一堆看似杂乱无章的事实中获得洞见的一个过程。类似于侦探破案,从已知的所有线索中排除各种可能性,从而最终推断出真相。

如何从文献出发来推出自己的论点

用结构化思维构思文章


一般来说,一个逻辑清晰、内容详实的文章,应该至少包括一个图中所示的三层次的金字塔结构。金字塔的塔尖就是文章的终极结论,金字塔的中间,则是文章的一级小标题;金字塔的第三层可以是逐个支持上一级小标题的各个段落,比如,在引言的小标题下,我们要论证我们的研究目标是合理的;在方法的小标题下,我们要展示我们的研究方法是靠谱的;在结果和讨论的小标题下,我们要论证,我们的研究结果的意义。当然,我们也可以决定是否需要加入二级小标题,从而构成金字塔更多的层次。在这样一个金字塔结构中,文章中的每一个段落,每一个小标题都不是孤立的存在,而是彼此连接,各有功能的。它们一方面要支撑上一级的观点,另一方面,又受到下一级观点和数据的支撑。一片文章如果具有了这样一套路径清晰的金字塔结构,则会为读者节省大量的阅读时间,读者会读的很爽快。

学术论文的写作往往要求既要简练,又要详实。这看似矛盾,其实不然。要求简练的是文字,要求详实的是内容和层次。我们希望文章中的每一个观点都有来自不同方向的支撑,所以,分类要详尽,层次要丰富、深入。尤其是在金字塔的最下面一层,一定要有落到实处的信息化语言,比如说数据或者具体的文献支撑。我们应当追求以最少的文字来表达出最多的意思。就好比,对文章的骨架,要追求详实丰富,而对文章的血肉要追求简练、瘦身。在构建这样一个金字塔的过程中,有两种结构化的思维方法非常有用。

  1. 由上向下的MECE分类法则:Mutually Exclusive Collectively Exhaustive(相互独立,完全穷尽),也就是分类的各个要素之间不重合不遗漏。
  2. 从下向上总结可以用最小容器法则:很多时候我们拥有了大量的具体资料和信息,需要做从下向上的总结,

如何分解和精选研究目标


在之前说过,要从大处着眼,从小处着手,这就需要将复杂问题简单化,因为万事万物,往往都只有一个主要的矛盾。

有洞察力的人,能够看清这个矛盾;有创造力的人,可以将这个矛盾转化为别的更为容易解决的矛盾。为了促成这种核心矛盾的转化,我们应该首先对矛盾的各个方面或者是各个核心要素分别用结构化思维向下分解为不同的要素,分解的时候可以用到MECE法则,矛盾的每一个要素都可以向下分解为一个多层的小金字塔,这样分解之后,我们就有可能发现新的核心要素,而原先在A和B之间的矛盾就有可能转为新的核心要素之间的矛盾,比如图中A1和B1之间的矛盾。

举例:
如何将2L的水放入1L的杯子中。这个问题的核心要素有三个:杯子,水,重力。首先将问题分解为这三个结构化的要素,再对每个要素进行深入分解,就能够找出解决问题的方案。比如,首先从杯子方面来分析:

  • 主要应该解决杯子的容积问题。可以考虑做一个有弹性的杯子,随着水倒进去,杯子会变得越来越大。这样,我们的原始问题就转化为了如何做一个有弹性的杯子。

从水的方面来分析:

  • 主要应该解决水的流动性问题。可以考虑将水冻成冰柱。这样,我们的原始问题就转化为了水要冻成怎样的形状才能装进杯子。

从重力方面分析:

  • 主要应该解决如何消除重力的问题。可以把水和杯子放到太空中,水失去了重力就会变成球,即使放到1L的杯子里也不会漫出来。

这就是一个清晰完整的,用结构化思维分析问题的过程。我们把问题分解为三个结构化要素,再逐个对每个要素进行分析,得出各种不同的解决方案或者是简化方案,最后再选择最适合我们的方案。

分解问题是第一步,它是对问题的各个核心要素的定义化的过程。在此之后,我们还需要对某些问题的关键要素进行量化。并对关键问题进行公式化的处理。从而,我们就有可能将一个笼统的问题转化为一个具体的,几个变量之间的关系问题。最后,我们可以对关键变量进行假设,来进一步细分问题。我们还可以根据假设来收集数据,再验证这些假设,并不断地更新假设。这样我们就可能找到最有可能解决问题的最有意义的研究目标,来投入我们有限的时间和资源。大多数问题都源于我们没有准确的定义这些问题。运用结构化的思维,我们不仅可以精细化的定义问题,把一个大问题转化为诸多的小问题,或者把一个问题的内在矛盾转化为别的矛盾,从而精选出有创新性的研究目标。

通过文献检索细化研究目标


当我们有了一个研究目标的初稿时,首先要做的就是把它概念化。也就是提炼出这个研究目标所有的关键概念。随后要对这些关键概念的内涵和外延做基本的了解。需要带着问题阅读。每一个关键概念都有可能有不同的表达方法,或者近似的表达。所以需要尽可能多而全的搜索这些文献。

定义和描述研究目标


首先,要有明确的方向和边界。其中,图中的Objective一般是自己独具慧眼所发现的,而对于大多数读者来说并不明显。

  • 这时候就要指明方向,指出它和我们长远目标之间的关系;
  • 第二是帮助读者了解我们研究目标的意义。这时候就需要两句话来描述定义的具体目标;另一句话用于指明该具体目标对于我们长远目标的贡献。

也就是说,我们要明确的指出,本次的工作包含哪些内容,不包含哪些内容。在划定辩解的时候,头脑中要对边界的研究内容和可能结论都要有相应的考虑。

  • 第一,我们需要考虑边界中的研究内容是否能在有限的时间内完成;
  • 第二,这个边界中的研究目标如果达成了,我们是否可以据此得出有意义的结论。

因此,一个好的研究目标应该是有边界的,而且这个研究目标的完成度应该是可以测量的。也就是说,读者应该可以根据研究结果来判断研究目标是否达成。所以,在选择研究目标的时候,应该尽量选择一些具有完成意味的动词。

在描述研究目标时,最常见的问题就是目标过于宽泛,这包括边界过大,或者边界不清。边界过大,则目标不可信;边界不清,则会传达出一种无能或者不自信的感觉。

用批判性思维检阅文献

文献检阅可以分为两步:客观评价和主观选择。

  • 客观评价就是首先用一个客观的标准对所检阅的文献做一个客观的评断:它是否可信。Validity&reliability。这个客观的标准就是事实和逻辑。首先,要区分文献中的信息是事实还是观点。如果是观点,那就不仅要看观点本身,还要看支撑观点的证据和逻辑。对于这些观点,还要判断作者是否有对其符合逻辑的论证。首先要识别这个论证方法是属于归纳还是演绎。这时候要注意,演绎推理得出的结论一般是必然性结论,而归纳推理得出的结论只能是可能性的结论。比如一个作者归纳:所有的天鹅都是白色的。那么这个作者是观察10只天鹅得出的结论还是观察100只天鹅得出的结论,这这两种情况下,该结论的可信度是不同的。因此,对于归纳得出的结论,还需要对证据的充分程度有所了解,以此来得出结论的可欣程度。
    • 演绎推理:演绎推理得出结论的正确性主要源于其前提是否真实。由于在实际中,演绎推理很少会使出全部的前提,因此我们在评判演绎推理得出的观点时,一定要注意:补全作者所有的隐含假设。问问自己,这些隐含假设我们是否同意。
  • 主观选择:依据自身情况来判断文献信息是否可以为我所用。也就是判断文献信息的Significance & Relevance。

批判性思维的核心不是为了消极的批评或者质疑,而是积极的选择,不是为了否定,而是为了建设。所谓的批判也绝不仅仅是为了批判别人,更重要的是批判和反思自己。

结果讨论和结论的写作要点

结果部分的写作重在:简介,简练,平实。尽量使用简单的句型,易于理解。给出基于数据的客观事实和结果,而不要附加任何的个人观点。为了表达清楚,很多的研究结果需要分类别、分层次、分段来写。这时候一定要分类清晰,层次分明。

在对结果进行分类分层时,一方面要突出关键数据、科学意义、代表性数据,另一方面要保持各类结果的适当均衡。另外就是要做到图中的两个一致。

  • 结果与方法保持一致。结果最好具有可复制性。文字内容应该与图标保持一致。在结果部分,我们一般只描述结果,而不做解释或者比较。对结果的解释或者比较一般放在讨论部分。解释是结果的延伸,是由结果+文献资料+个人观点而做出相关的推论。重在逻辑。有选择性的对部分关键结果进行深入分析得出有意义的推论。我们对结果的引用类似于对文献的引用。文献和文章中的结果都可以作为推理的论据。对于结果的讨论常常设计三种比较:
    • 结果与预期目标的比较:根据我们的研究目标,我们要把我们的实际结果与我们预期的结果进行比较。如有不符,我们应该能尽量的给出解释。有时候还要根据实际研究结果指出本次研究的局限性。
    • 结果与相关文献的比较:通过比较,最好能够指出本次文章的创新点,优势或者特色。
    • 结果与长远目标的比较:通过比较,来说明我们本次的研究对于长远目标的实际贡献。指出本次研究的理论意义、实用价值、或者推广前景,等等。
  • 论文的结论部分可视为对讨论部分的总结。一个好的结论要做到两点:
    • 突出亮点:突出本次研究的创新点,这个创新点可以是来自结果的结论,也可以是来自我们的研究目标或者研究方法。
    • 指明方向:指出我们本次研究的局限性,和尚未解决的问题。从而对我们今后的研究方向做出建议或者设想。

好的结论,两点和方向缺一不可。

讨论和结论的逻辑架构

【中英双语】科技论文写作与投稿审稿经验分享(20200624直播完整回放)

意译了一部分重点内容

作为一个科学家,首先要认为自己是一个职业的作者,因为科学家之间的交流和工作主要是通过论文的形式。虽然科学家都很擅长也很愿意学习的知识,但问题是有的科学家却去刻意学习写作技术,这是不对的。

为什么要写的好?

  • 能被发表
  • 能被引用
  • 能得到资金
  • 与其他领域的科学家进行交流
  • 增进沟通技巧

虽然上述几点内容都是发表论文的好处,但有两点是特别能够说服人的。

  1. 被引用:别人对你工作的认可
  2. 与其他领域的科学家进行交流:能够出一些意想不到的成果

写作的两个角度

实际上我认为这就是批判性思维

  1. 找到一个好的切入点
    1. 动机:为什么要做这个研究?
    2. 公开的问题:这个特定的研究需要什么
    3. 关键结果:新在哪里?
    4. 影响:结果会带来哪些冲击?

要把论文中的所有东西都解释清楚,因为看你论文的不一定是同行。

正当自然过程的辩证性质以不可抗拒的力量迫使人们不得不承认它,因而只有自然辩证法能够帮助自然科学战胜理论困难的时候,人们却把辩证法和黑格尔派一起抛到大海里去了,因而又无可奈何的陷入了旧的形而上学。

但是,在自然科学本身中我们也长长遇到这样一些理论,在这些理论中真实的关系被颠倒了,映像被当做了原形,因而这些理论需要一个同样的倒置。

【自然科学家得受哲学的支配】

【量转化为质和质转化为量】

我们可以想象这样的一种图结构:
他是一种异质图,每个节点上都有n种实体,这个节点就可以看做是一个集合。
那么n种实体就会对应n!个关系,这可以认为是实体之间相互联系的规则。
然后每个节点实际上都是一个集合,集合大小越接近1,那么联系就越紧密。

对之前的想法进行改良:虽然现在有异质图这个概念,但我更倾向于是“同质图”。一个节点可以承担不同的作用,因为这个节点实际上是一个集合。v=set

导言

  • 第一章:复杂性研究是人类认识史科学史上的重大转折:主要是说明复杂性研究的重要意义。
    • 第一节:简单性曾经是科学追求的最高目标
    • 第二界:复杂性研究室人类认识史上的重大转折
    • 第三节:怎样理解复杂性 ,复杂性定义与特征
    • 第四节:复杂性的判定与度量
    • 第五节:复杂性研究的主要方向和进展
  • 第二章:探索复杂性的新学科:人类在20世纪是如何发现复杂性的,如何研究和发展复杂性
    • 第一节:20世纪40年代 系统论信息论 控制论 开创了复杂性系统研究的先和
    • 第二节:20世纪60年代 复杂系统的自组织理论的创立
    • 第三节:复杂系统研究的新发现
  • 第三章:认识组织性、复杂性、非线性的新学科—系统科学:这个学科的创立者是钱学森
    • 第一节:什么是系统与系统科学
    • 第二节:系统科学的体系结构
    • 第三节:系统科学本质上是复杂科学
  • 第四章:探索组织性、复杂性、非线性问题的新思维方式—系统思维方式:这些学科如何改变了人类的思维方式?这种思维被称为系统思维方式
    • 第一节:什么是系统思维
    • 第二节:系统思维方式的基本思路
    • 第三节:系统思维方式的特点
    • 第四节:系统思维方式运用方式的案例
  • 第五章:解决组织性、复杂性、非线性问题的一种新工具论—系统科学方法论
    • 第一节:什么是系统科学方法
    • 第二节:系统科学方法论的基本构想与内容
    • 第三节:系统科学方法论的基本特征
    • 第四节:从系统科学方法论到综合集成方法论
  • 第六章:系统观为认识组织性、复杂性、非线性食物提供了新的自然观和世界观
    • 第一节:什么是系统观
    • 第二节:系统观的基本要点
    • 第三节:系统观丰富发展了辩证唯物主义的自然观
    • 第四节:系统观丰富发展了辩证唯物主义的世界观
  • 第七章:系统论是认识组织性、复杂性、非线性食物的科学技术哲学,是沟通系统科学与马克思主义的哲学桥梁:钱老认为,任何科学都要受辩证唯物主义指导,而这个桥梁就是系统论
    • 第一节:什么是系统论
    • 第二节:系统论的基本原理
    • 第三节:系统论的基本规律

第一章:复杂性研究是人类认识史科学史上的重大转折

第一节:简单性曾是科学追求的最高目标

古希腊的先贤们曾经将世界的本源归结为:水、火、原子与空虚、冷热干湿等等。而且近代诸如伽利略、牛顿、爱因斯坦等大科学家都是追求简单性的。简单性是指:在体系所包含的彼此独立的假设或者公理最少。而对于当今科学,简单性原则已经不适应科学技术和社会发展的需要了。

第二节:复杂性研究是人类认识史上的重大转折

  • 由于自动化和计算机科学发展引起物质生产方式系统组织性的复杂性
  • 由于信息论和信息技术的发展引起社会生活方式的复杂性
    我们的社会已经从农业社会发展到了信息社会,我们的生产工具的效率越来越高,同时,处理信息(相当于逆熵)的能力也越来越强。
  • 由于社会经济系统的复杂化引起的管理对象的复杂性

这一节主要是大概的提一下,哪些事物是典型的,需要使用复杂性去分析的,比如大脑和DNA。另外又举了一些上世纪科学家们的名言。

第三节:怎样理解复杂性 ,复杂性定义与特征

从本质上理解什么是复杂性

教授提出了一个二元结构的模型:将事件分解为一下过程:
自然系统通过人认知,认识了以后形成看法,这是形式系统,这个看法在实践中加以建议,看看是否符合你认识的这个自然系统。

教授认为,复杂性包括两方面:

  1. 自然系统本身的复杂性(自然复杂性)
  2. 主体对其认识的复杂性(形势复杂性)

而且,复杂性是矗立于我们已知世界之上的世界。复杂性是一定阶段我们理解或我们认知的极限。所以,复杂性是随着人们的深入认识而不同的。复杂性是有二重性的,有本体论的自然复杂性和认识论的形式复杂性。

复杂性是一个多意的概念,具有双重本色

多意:不是一种而是多种意义上的
双重:本体论的自然复杂性+认识论的形势复杂性
而且,目前复杂性还没有统一的定义。但是可以将定义分为三种类型:

  1. 系统复杂性(自然复杂性 、本体论复杂性)
    1. 系统状态复杂性:
    2. 系统结构复杂性:(实体)相互作用产生了不同的联系方式,随着个体单位作用的强度的概率的变化而变化。
    3. 系统功能复杂性:随着恢复系统功能完整行为的变化而变化。
  2. 问题复杂性(由所解决问题的复杂性而决定的)
  3. 问题解决复杂性(包括计算复杂性)

问题复杂性和问题解决复杂性都可以归结为认识论的复杂性,即形式复杂性。

盖尔曼:复杂性是系统演化有序性,结构层次性,形态多样性等性质的概念表述
上面这个是有效复杂性。

构成复杂性的主要特征(英国百科全书):

  1. 多连通性
  2. 非集中控制性
  3. 不稳定性(这显然是不准确的,鲁棒性是复杂系统的一大特点,这个应该是描述混沌系统对初值的敏感性)
  4. 涌现性
  5. 分化(这是相变或者临界点)
  6. 多样化
  7. 净化能力(这是打错了吗?听的是进化能力)

墨兰:复杂性既包括有序也包括无序;既包括随机性,也包括组织化。所以,无序性和有序性共同构成世界的本质。
(我真的想吐槽,无序性是复杂系统多样性的表现,而不是无序,因为实体是一个集合,集合本身就是无序的)

中国复杂性讨论大会的讨论成果(这主要是教授的个人观点):

  1. 因素众多,涉及面广:(吐槽:这可能是因为复杂系统中的实体众多,因此形成了众多的组合,覆盖面足够广)
  2. 联系紧密,随机性强:(complex system is unpredictable)
  3. 非线性
  4. 因果关系的反直观性:(吐槽,先有鸡还是先有蛋呢?大概就是这个感觉?)

复杂性的判定和度量

复杂性与认识主体的地位密切相关

第二章

贝塔朗菲与系统论

系统论初步解释了生物系统的复杂性运动规律。复杂性的研究最初是从生物学开始的。
一般系统论:是一种运用逻辑和数学的方案考察一般系统的理论,是关于“整体”和“整体性”的一般科学。其主要目的是把对象作为有机整体,系统来加以专门研究,试图确立适用于系统和系统运动的一般原则,寻求适用于一切综合系统与子系统的模式、原则和规律。
一般系统论发展为系统论,可以概括为三个方面:

  1. “系统的科学”(数学系统论)
  2. 系统技术:运用系统论的新概念、新方法,特别是整体论方法和系统方法去解决复杂系统的时机问题,把一些创新的概念引入技术科学领域中去,确立系统技术在现代系统研究中的地位。
  3. 系统哲学:研究由于系统这一个新的科学规范,而产生的世界观方面的变化。

从系统观到系统论的进化

亚里士多德:整体大于它各部分的总和
陈亮:理一分殊
恩格斯:思维既把相互联系的要素联合为一个统一体,同样也把意识的对象分解为它的要素。以近乎系统的形式描绘出一幅自然界联系的清晰图画。

而直接导致系统论产生的原因是20世纪初,生物学历史上机械论与活力论的斗争。
简化论和机械决定论:主张把一切生命过程简化为物理和化学过程。
而杜里舒的海胆胚胎实验则否定了决定论。因为无论几个海胆胚胎细胞都能最终变成一个海胆个体。
后来有人把生物体当做一个有机整体或者系统来考察。

贝塔朗菲认为,旧的生物学有三个错误观点阻碍了生物学的发展:

  • 简单相加的观点:比如 四肢+躯干+眼睛=人。
  • 机械观点:把生命现象简单的比作机器,那么用物理化学这样机械的运动就能描述
  • 被动的反应的观点:只把有机体看作是受刺激才作出反应的。

贝塔朗菲提出的三个观点:

  • 系统观点:一切有机体都是一个整体————系统,生物机体是在时间和空间上有限的具有复杂结构的一种自然整体。
  • 系统是相互作用的诸要素的组合体
  • 系统的性质取决于复合体内部特定的关系:我们不仅要知道组成部分和要素,还要知道在这个有机体中,这些部分和要素是如何联系的,以及他们之间的相互关系是怎样的。

Q_i表示要素P_i(i=1,2,…,n)的某个量,那么,有多少个要素,就需要对应多少个微分方程。

$\frac{dQ_1}{dt}=f_1(Q_1,Q_2,\cdots,Q_n)$
$\frac{dQ_2}{dt}=f_2(Q_1,Q_2,\cdots,Q_n)$
$\frac{dQ_n}{dt}=f_n(Q_1,Q_2,\cdots,Q_n)$

一切生命现象本身都处于积极活动的状态,活的东西的基本特征是组织。有机体之所以能组织处于活动状态并保持其活的生命运动,是由于系统与环境不断地进行物质与能量交换。

开放系统:自身能够不断的与外界进行物质或者能量的交换。(这实际上就是一个逆熵的过程。)
生命系统本质上是开放系统,这种系统能够维持其自身的有序和有组织的状态。
即使是一个简单的开放系统,都能在一定条件下保持自身的动态稳定性。

第三个观点:等级观点:
各种有机体都按照严格的等级组织起来(有层次的)
比如:细胞-组织-器官-整体
比如:生物圈-生物群-群体-个体
而且,处于同一层次的事物在一定程度上都是相同的(比如节肢动物门类中,有很多相似的特点,不然也不能划分到同一个门类是吧。)

系统论揭示了复杂系统的若干运动规律

生长规律:

竞争规律:

层次规律:

中心化规律:系统当中某一部分的微小的变化会导致整个系统总体的巨大变化的要素,就是系统的中心。
目的性规律:一个系统随着时间的增加可以渐进的达到某一种稳定的静态。
同型性规律:存在着适用于一般化系统和子系统的模式、原则和规律,而不论其具体种类,组成部分的性质和它们之间的关系或“力”的情况如何。这就是说,人类在不同领域的意识或社会性活动存在着结构上的相似性。所以,我们可以用同一个原则,规律,模式去描述不同领域的同一个现象。就比如我们可以用生长规律去描述老鼠、人类、植物、图书出版等相似的规律。

在不同领域和科学中存在同型性的先决条件:

  1. 必须是一个系统
  2. 规律的客观性
  3. 可以用数学概念结构加以描述

同型性的作用:

  1. 同型性思想为使在不同学科,不同对象之间的相似性确定出逻辑对应关系。
  2. 同型性思想为使在一个领域发现规律,合理地正确地推广到另一个领域提供依据。
  3. 同型性有助于科学的统一,科学的一体化。

系统论从系统的角度研究客观世界,从不同的侧面解释了客观物质世界新的本质、联系和运动规律。系统论适应了现代科学技术研究从个体食物水平上升到负责系统水平的需要,为现代科学技术的发展提供了新思想、新方法、新理论,为解决复杂系统提供了有效方法。因为它将定性和定量的方法结合了起来,使方法产生了质的飞跃。系统论沟通了自然科学和社会科学的联系,为辩证唯物主义的丰富和发展提供了自然科学基础。

19世纪三大科学发现:
能量守恒,细胞学说,达尔文进化论。
这三大科学发现为马克思的辩证唯物主义提供了自然科学的基础。那么,复杂系统的发展就可以为马克思主义提供现代科学的基础。

系统论产生的意义:

  1. 系统为人们从整体上研究事物、处理问题提供了新的科学方法。(系统论突破了以往的分析方法,摒弃了原有有机联系的,活的系统,分解为若干小要素一个个研究,然后在联系起来分析的方法。企图用简单机械方法是无法解决复杂系统问题的)系统论如实地把对象作为有机体系统或复杂系统来进行考察,从整体和部分的相互依赖,相互制约的关系当中,来揭示系统的特征和运动规律。在系统论看来,任何事情的发生都不是偶然、随机、混杂的堆积,而是合乎规律的,按照诸要素以一定逻辑有机的结合在一起的。离开了相互联系和相互作用,系统就不能被认识。而且,任何孤立的行为都不能通过简单的累加去认识整体。所以,目标就是从个体水平提升到整体水平。
  2. 系统论为复杂系统问题提供了锐利武器
  3. 系统论为领导决策科学化提供了可能
  4. 系统论为辩证唯物主义提炼新的哲学范畴提供了素材

第三章

信息论:人类对信息的认识过程

(信息论的发展历史就不说了,但我突然感觉,也许正是信息量变才导致了系统的相变。这可以追溯到麦克斯韦妖的思维实验,虽然整体的熵增加了,)

若干整数的最小公倍数

关于笔记

这本书特别难读,每个字都认识,但组合起来就意义不明了。所以还是要多写写笔记,免得学完就忘。另外,这本书的哲学指导主要还是靠西方那一套,虽然我没学过,但感觉没有马克思主义三大基本原理给力,其中一些很容易用三大原理解决的问题被复杂化了,很可惜。因此,在写笔记的时候我也会把带有马克思主义的哲学思考写下。

第零章 前言

哲学家关注的重大问题:在保持系统的完整和其组分的个体的同时,我们如何能够清楚地表述一个大系统的组合?以往的理论没法很好的兼顾宏观与微观。
而本书的成因正是作者在和她弟弟的一次对话中,谈及跨学科研究问题时所产生的灵感。

第一章 导论

1.1 复杂组合系统的总和微观分析

组合不仅仅是聚集,组合物的组分之间存在着相互作用,通过这种相互作用会形成复杂的结构;但它还不仅仅是相互作用,它在表现组分特性的同时,还传递着作为整体而新产生的特点
所以,整体不等于部分之和。那么话说回来,部分是如何组合成整体的呢?这个问题实际上对应的就是涌现现象。后面再说,问题不大。
更一般的说,无数的个体组织起来,形成了一个动态的、易变的、自适应的系统。虽然对外界环境产生反应,但该系统的演化主要依照由其组分间的相互关系所产生的复杂的内部结构进行。
整体由个体组成,但是其结构比个体所在的层级更高。而个体间的相互关系则是造成整体不同的源头。
与其说涌现性的出现显示了组合物的物质基础,不如说是这些物质是如何被组织起来的。
就像是欣赏壁画的时候不能鼻子顶着墙,必须退后一步才能发现其中意义。
混沌过程与其阶段的相继确定之间的差异说明:整体与其局部的涌现概念之间存在差异。
小的组合物与其组分处于同样的组织层次;大系统则构成更高的组织层次,这是一大差别。单层次上的实体可以由单组概念可话,而不同层次上的实体通常由不同的概念刻画。
可是,不可预测并不是不可解释,因为解释具有后见之明。

2.1 复杂系统

我们将把注意力放在大尺度组合呈现出的复杂性,在更宽泛的意义上,把它理解为由许多阶段组成的动力学过程。

2.3 两种复杂的概念

第二章 组合系统理论

4.2 粘合与瓦解

个体之间黏性相互作用是组合以及结构形成的基础,但并不是所有的相互作用都是黏性的。一个系统只有当个体间以某种方式通过一些合适的规则来协调它们的行为时才能形成。
如果粘合力大于将个体分开的力。。。这个集合就形成一个整体结构,在更大的尺度上成为一个组合系统。

4.3 原子论与物理主义

自己连18世纪的数学都没看明白还想啥深度学习呢…

从勒让德其人说起

阿德里安-马里·勒让德仅存的肖像。

阿德里安-马里·勒让德(法语:Adrien-Marie Legendre,1752年9月18日-1833年1月10日),法国数学家。他的主要贡献在统计学、数论、抽象代数与数学分析上。勒让德的主要研究领域是分析学(尤其是椭圆积分理论)、数论、初等几何与天体力学,取得了许多成果,导致了一系列重要理论的诞生。勒让德是椭圆积分理论奠基人之一。勒让德对数论的主要贡献是二次互反律,这是同余式论中的一条基本定理。他还是解析数论的先驱者之一,归纳出了素数分布律,促使许多数学家研究这个问题。其他贡献包括:椭圆函数论、最小二乘法、测地线理论等。


如何测量一个灯泡的体积?

  如果给你一个这样的灯泡,你应该怎么计算它的体积呢?
  这件事情可以算的上是比较有名的科学故事了,要从卖报出身的爱迪生和名校毕业生之间的一段“江湖恩怨”说起。大概就是名校学生用尺子和公司测量了好几个小时也没测出来的问题,被爱迪生用一个小妙招轻松解决:只需要把灯泡里面盛满水再倒出来,就能够知道这个灯泡的体积大概是多少了(如果忽略实验过程中的微小误差,比如内壁的残余的水)。

  同理,我们也可以把这个灯泡插进沙子里,然后用融化的铝填满,这时候看看用掉了多少铝就可以得到灯泡的体积。

为什么要说这些问题?

  在很多情况下,我们很难直接测量一个事物。就比如古人在不知道圆形面积计算公式的情况,要怎么去测量一个圆盘的面积呢?我们可以有两种最直观的方式测量:从里往外,用无数个多边体去填充,这个方法就是割圆术。第二种方法是从外向内逼近。理论上只要足够精细,无论从外逼近还是从内逼近都可以得到这个圆形的面积。

  很多


横看成岭侧成峰

总结

并不是说物理学的工作对于人工智能具有启发作用,哲学思想也有不少指导呢。而是说前车之鉴,后车之师。多领域的结合往往能出现令人意想不到的成功。

写在前面~

根据TTC课程《understanding COMPLEXITY》的听译编写了这个文档。不求精准(过程中可能存在听译错误、意译、口语化严重、翻译不准确等问题,见谅),但求知识传播。我本人对复杂系统非常感兴趣,因为它和人工智能有着某种密切联系。总之会持续更新,直到完结。一共12课,B站有资源,可以直接看。

hope you enjoy.

前言

根据一个复杂系统的科普视频写成本节
https://www.bilibili.com/video/BV1fW411T7Fh

什么是复杂系统?

首先,复杂系统是多元素的集合,这些元素被称为实体;这些实体相互之间都联系,被称为关系。

上述部分可以是有序的也可是无序的。无序的系统就是一堆东西的简单集合,因为他们不会形成任何关系或者结构,我们只需要把这个集合里面的元素以属性的形式简单的罗列出来就能将其表示。所以,地上的一堆石头就是这种无序集合的代表,他们之中没有形成任何模型或者结构,因此我们就可以以属性的形式去单独的描述每一个集合中的元素然后再做一个简单的累加,因此,这个无序集合也只不过是其中各元素以属性形式的简单叠加。

作为对比,如果这些部分以某种关系相互关联并形成了一个功能整体,我就们会看到,从这个组织中涌现出了一个全局模式,这个全局模式就有能力去作为一个连贯的整体运行。

比如,如果我们把车子的零件都以某种方式排列,我们就得到了一个全局层面的整体,被称为交通运输车辆。再比如细胞构成了器官,器官构成了人体,那人体就是功能整体,是细胞在宏观层面的涌现。

因此,一堆小系统中的元素以某种关系组织在一起,这些元素形成了一个整体,在宏观层面就会涌现出一个新的组织。

随后我们再加入一点复杂性,也许所有复杂系统的共性之一就是它们是由很多个部分组成的。这些部分以无中心控制的形式分布。组织则是通过自组织由关系在局部的交互,在新的层面形成了一个新的组织。就像我们之前所说过的涌现性现象,当这些组织再以新的方式联系在一起,就会在一个新的层面涌现出新的组织,如此往复。

人们形成小组,小组形成社群,社群就会形成一类人。

这种系统都会有一个层级结构,就比如鹦鹉螺,(构成壳的)小元素以嵌套的结构堆叠在一起,这就反过来形成了更大的系统。所有的复杂系统都有这种多维属性:多种维度的多种元素相互影响。

本地经济形成了社会经济,社会经济形成了国际经济。其中的每一个部分都是相互依赖,相互影响的。我们不可以完全的独立其中的任何一个元素,或者将整体都视为一个层级。

许多部分都以局部交互的形式分布,而自组织又能够提供在不同维度的涌现力。

另外就是相互依赖性和非线性。复杂系统中的元素正是由于高度的相互依赖性而产生非线性。几乎所有的线性系统都有非线性这个短语。这是一个反复出现且非常普遍的主题:加入两个或更多东西到一个线性系统中会引发非线性的事实,其结果很可能不是各部分属性的简单相加。作为对比,两个部分的组合也许比各部分更糟糕或者更好,因为作为一个整体系统,各部分都是相互依赖的。

就比如结婚,也许是1+1>2,也许是1+1<0。

这是因为系统中存在反馈机制,非线性系统会以指数率增长或衰减。这一飞速变化的过程被称为相变。所以,复杂系统才会被发现,它会在很短的时期飞速变化或者干脆直接相变。复杂系统中一个小小的变化,都会因为反馈过程中的指数变化,而导致最终的爆炸输出(蝴蝶效应)。这被称为是初始值敏感,这是混沌理论的核心观点之一。这种现象可以体现在股市崩溃,生态系统崩溃。

接下来是是关联性。

许多定义涉及到复杂系统的组件之间的关联性,但是当我们深入观察之后,却发现这些关联性定义了复杂系统而非其组件的属性。所以,事物之间如何联系,什么和什么联系在一起,成为了本节的主要问题。在一些关键层面的关联性,系统不再是其组件的集合,而是组件所构成的网络结构。至此为止,问题又变成了网络中物体流动的问题。在复杂系统中,互相关联的组件构成了一种拓扑结构,比如在国际航空网络,国际贸易网络,国际运输网络问题中,空间这个概念被由关系所形成的拓扑结构重新定义。重要的是你所处在的网络的节点以及该节点的连通度。又一次的,关联性将我们领入了一个充满复杂性的世界,元素之间的关系数目以指数级增长,哪怕是少数几个元素都可能以数千种方式相连。

最后就是自适应。

无论我们讨论鸟群,国际经济或者是互联网,你都不可能找到一个自顶而下的中央控制者指挥全局。而在复杂系统中,其中的元素都有一定的自主能力,能够根据其本身的行动集自主的适应局部环境。

在没有中心协调和一定程度的自主的条件下,元素可以在局部同步或协作,这会导致一种组织模式自底而上的出现。对于给定现象具有各种不同反应的能力意味着复杂系统通常是异构的,多样性的生态系统和多样性的文化系统就是很好的例子。由宏观发展而来的复杂系统是通过进化过程,其中的元素受到自然选择的驱使去适应环境,适者生存,优胜劣汰。同样的还有市场经济,选举,物种竞争。在这种情形下,微观系统设法去适应环境而不需要中心化协调机制,进而又发展出了更高层次的分化与趋同。元素具有越高的自主和适应性,系统就越复杂。

第一课

斯科特·佩奇教授说:
自从我接受数学和经济学训练的十年以来,我一直都是在密西根的?大学教复杂系统的教授,人们总是问我:什么是复杂系统,什么是复杂性?在这个系列中,我们将会讨论复杂性这个话题,包括它是啥,又是干啥的。复杂这个词是说【多样性的集合(varieties of settings)】,我们从报纸上、电视上可以听到,金融市场,国际政治,都可以用复杂性去描述。在医学研究中,复杂性也包括蛋白质的折叠;还有吃饭的时候,主厨描述???

那么以上这些都是在说什么?它们都是同一个意思吗?so,简而言之,当我们描述一个复杂的东西的时候,我们的意思是:这个东西是 相互依赖的,多样的实体的集合 (interdependent,diverse entities )

另外,我们假设这些实体都是自适应的。它们会以某种方式响应(respond)本地和全局环境。所以,将这些实体想象成是排列在某种空间中是有帮助的。

so,我们得到了这些定义:
视频字幕:【complex: diverse , interdependent , connected ,adapting entities】

  • 多样的
  • 相互依赖的
  • 相互关联的
  • 自适应的(感觉视频中,此词还有演化的含义)

如果我们认同了上述观点,那么我们可以回答一个yes or no 的问题,金融市场是复杂的。银行、交易员、政府、监管员都是被某种网络给联系在一起的,他们的行为都是相互依赖的。一个银行的行为会影响到另一个银行。而且这些银行的本质都是自适应的。但不幸的是,他们的演化方向是趋同的,比如泡沫,经济危机什么的。同样,政治系统也是复杂的,对吧?一个国家的行为会影响另一个国家。对于那些???来说(之前说的主厨的那个例子,没听懂),也差不多,虽然没有太多自适应,但如果情况变多,也会???

so,我们对复杂系统感兴趣是有一大堆原因的。
首先,复杂系统都是难以预测的,这不是啥好事。第二,复杂系统会产生一大堆事件,比如崩溃和战争。但好消息是,复杂系统非常鲁棒,所以可以在一个多变的环境中。(withstand unbelievable truama)承受住不可思议的创伤,即使这样都可以保持在一起。比如生态系统,生态系统可以损失一些物种,却可以微妙的保持功能。

  • Unpredictable,不可预测
  • Produce large events,产生大量事件
  • Robust ,鲁棒

也许在复杂系统中,最不可思议、最有趣的事情就是自底而上的涌现现象。(bottom-up emergent phenomena).

这是从微观层面出发而言的,与我们在宏观世界观察到的“不同”是不同的。用“意识”来举例:比如单个的神经元,真的真的是非常简单的东西,但人脑有很多个神经元彼此依赖、联系,就产生了有意识的思维。这就是涌现性!牛逼!

涌现性有很多形式,包括自组织,所以下次我们要观测一个城市,退一步(意思是从微观处着眼),观测进出的人,车,货物,你连城市的影子都看不见。主要是没有核心策划者,但是一个城市就这样自底而上的涌现了出来。

最后,我们再来看一下复杂系统。

  • Unpredictability
  • Large events
  • Robustness
  • Emergence
  • Novelty

不管你喜欢与否,我们就是生活在这样一个复杂的时代。在第一讲中,佩奇教授会深入浅出,用精确的定义而不是模糊的词语,对复杂系统下定义。这就可以让我们对复杂性进行一个判别,一个情况为什么比另一个更加复杂。但要时刻牢记复杂系统的特性。什么城市啊,大脑啊,公司啦,物种啦。。。构成这些东西的“基本元素”都是相互依赖,相互关联,自适应的,正是这些性质,产生了复杂性————这既是我们的幸运,也是我们的不幸。

复杂性理论是新的学问,新的学问将伴随新的范例,又会产生新的工具去解释。而且这些解释复杂性的工具,大部分都是可计算的。接下来,将会抛开比喻,直奔复杂性的科学解释。不过在此之前还要先学几个新词汇。

  • Rugged landscapes(崎岖地貌,意指梯度)
  • Tipping points(临界点,相变点,质量变的边界)
  • Positive feedbacks(正反馈)
  • Emergence(涌现性)
  • Self-Organized criticality(?)
  • Agent-based models

佩奇教授又说道,复杂系统这门课有两种经典慢讲,第一种是偏物理的,关键词:【物理的,定义,数学,模型,计算】。另一种方式是像社会科学家那样(佩奇教授自称是社会科学家),讲一些报道,故事,比喻和趣(xiang)闻(sheng)。最后佩奇教授折中,该文就文,该理就理。

复杂性是自底而上的,它所产生的模式、结构,都是涌现出来的,而不是系统内置(built-in)的。。就比如生命,是一种涌现。

复杂性并不拘泥于小模式,比方说地球周期的绕着太阳公转这种模式,而是一种constant novelty(连续的新奇?查了一下谷歌翻译,constant做形容词时的解释为:occurring continuously over a period of time.是不是可以理解成,一点小小的改变都会带来新的变化,而且这种变换对应改变是连续的。),一点点小的干扰都会导致偏差,但这又引发了矛盾,之前说复杂系统是鲁棒的。

教授说,复杂系统是不寻常的。意思是,复杂系统的输出结果并是我们平常所见的正态分布,而是遵循了幂律规律(power low)。复杂系统最令人着迷的地方,就是它能够脉动生命。复杂系统是非平衡的(意思可能是非静态平衡),不需要像经济学家那样思考供需平衡。也不是说它混乱,而是同时处于两种状态:一面是混乱,一面是秩序。

让我们更深入的来探讨一下之前对复杂系统的定义:
我们定义了复杂系统,又或者说,一个具有多样性的系统是复杂的,这就是说一个系统如果是由多样的智能体(agent)互相联系,且他们的行为都是互相依赖的,且是自适应的。这四个部分:

  • Diverse
  • Connected
  • interdependent
  • Adaption
    是一个复杂系统的必要组成部分。所以,与其说生态系统是复杂的、金融系统是复杂的,或者说国际政治体系是复杂的,不如说这些系统都是以逻辑基础为基础的。

接下来一个个的进行讨论:
经济系统是多样的,它可以有麦当劳,家乐福这样的生产者。生态系统是多样的,它可以有苍蝇,松鼠,麻雀。而且经济系统和生态系统各自都是相互关联的。比如在经济系统中,公司和生产者供应链中相互关联了起来,而且这种关系即表现在地理,又表现在网络。在生态系统中,物种通常是地理相连的,他们相互联系如果地理位置相同。那些相同的物种在自然界中,牙齿和爪子呈现红色,意思是相互为食。经济系统中也有相互依赖,尽管从表面上看来不是生态系统那么激烈,弱肉强食的,但其中有竞争关系:一个公司的行动取决于另一个公司的行动。

最后一个是适应和选择。以麦当劳举例,他们提供沙拉,这是因为他们要适应一个变化的环境。股市同样如此,他们会赶走那些业绩差的,所以我们会观测到一个残酷的世界,适应和实践。教授说他在一个地方待过一年,他亲眼看到松树吃了他车里面大豆做的电线(soy-based electric wires)???这就是适应性。虽然我们在经济和生态中看到的适应性不是那么明显,但化石告诉我们一个道理,适者生存。这就对之前对复杂系统的描述添加了更加详实的证据,我们今天所处的世界是更加复杂的

1万年前的地球,只能支撑五百万到一千万人口。这些人都更加关心生存问题,他们可不关心今晚看啥电视剧,他们打猎,收集浆果。直至百年前的郊区乡村,人们还是以农业和畜牧业为主,但不要理解错了,农业已经变得更加复杂了:春天的时候,你要捡石头,犁地,挤奶,接生,等等。那时候的农民,只要是同一个社区的,都差不多,没什么多样性,他们都掌握着差不多的技能,而且社区和社区之间都是基本孤立的。也许他们一个月才进一次城,买点糖,布,卖点农作物换钱。没有太多依赖,联系,适应。很多年过去了,农民基本还是老样子,播种收获,也许他们可以种大豆和胡萝卜了,但没什么不可预测的。

我们现在用当代的工人去做对比。当代的工人,几乎都各个不同,有着很大的多样性。人们住在城市,联系的更加密切。在发达国家,他们有着不可思议的各种技能,去查查黄页,你可以找到工程师,物理学家,律师,心理医生,建筑师,码农,等等。你会发现,人们的联系更加密切了,这种联系包括物理联系,因为我们住的位置都差不多,而且大部分工作都是由团队协作的方式完成的。联系也包含虚拟的,因为我们每个人都有网友,而且虚拟联系更加密切。另外就是,我们的行为更加具有依赖性,比如我们的工作都是依赖于团队完成,一个人贡献的程度取决于另外队友的贡献程度。无论我们是拍电影还是写一个项目模块亦或是制造一台汽车,一个项目的成功取决于整个团队的行动。农民种瓜得瓜,种豆得豆;现代知识工作者的素质只取决于团队周围的人以及她所处的环境。而且我们更加的适应了,在信息革命之前,科技公司看股票行情都是以半年为单位的,信息革命之后,基本上都是以分钟计算。

注意事项

  • 多样性,联系性,相互依存性和适应性的增加并不意味着过去的世界并不复杂(只是现在的世界更复杂了)
  • 关于复杂性增加的争论相对于今天来说,对过去是没有意义的。
  • 世界也可能降低复杂程度。

教授并不是说过去的生活无聊枯燥,只是说当今科技的进步,人口的增加,这些属性加速了对于复杂性的贡献。但是这个世界的物理规律没有变,为啥复杂性就增加了呢?比如交通运输会跨大洋传播外来物种,外来病毒,这就让曾经的不可能变为可能。又比如在发现了元素周期表之后,人类甚至可以人工合成自然界并不存在的新物质,所以我们有了更多的新东西。最后我们来看一个我们更能意识到复杂性存在的例子:也许我们认为人类就是一种纯粹的,从基因型到表现型的映射,但实际上这是一个非常复杂的过程,包括DNA,RNA,还有基因之外的化学因素,等等。看的越深,就越发觉这个世界的复杂。

complexity is not the same thing to the complicated.(翻译不出来,感觉是复杂性是动态平衡系统的属性,在静态平衡中的“复杂性”只能称得上是繁琐)

教授举了一个例子:他的机械手表也很复杂,同时还有依赖性,关联性,但是这个机械手表是不具备复杂性的,毕竟手表的运动规律是高度可测的。这是因为手表不具备自适应性,同时也不服从自然选择,它们只是机械的部分之和,服从于给定的机械规律。所以手表做不到复杂系统的事情,首先它没有产生大量事件,其次它也并不是鲁棒的,一旦小小的干扰就能让它失灵,比如拆掉一个齿轮就完犊子了,其他的零部件也不可能去自适应的填补缺失齿轮的空白。但是你少上一天班,社会也不会垮掉的,因为人是社会的组成部分,人可以自适应的填补你的空白。所以你看,鲁棒性是复杂系统的一个属性。

如果系统想要有鲁棒性,那么这个系统就会产生出大量事件。教授所说的large events,就是真的larrrrrrge events。比如自然灾害啦,洪水啦,台风啦,地震啦,火山喷发啦,股市崩溃啦,交通事故啦,流感啦。

complex system are not normal.

复杂系统是不寻常的,这个意思是说,复杂系统所产生的事件的分布并不是正态分布那样,而更像长尾分布,大事件都靠在后面,这些大事件一旦触发就会有严重后果,什么世界大战之类的,那些人类最不愿意它发生的事情,就是大事件。

这看起来是矛盾的,而且也应当是矛盾的。一边是鲁棒性,一边又容易受到大事件影响。教授举了一个他经历过的例子。90年他任教授的那个城市遭受了大地震,但是股市只是小幅下降,因为人们适应了地震后的环境,他们互相转告,这就是社会系统的鲁棒性作用。

当然,如果我们能够知道怎么去造一个复杂系统,比如经济系统,政治系统,法律系统,那当然是极好的。同时,如果我们可以鉴别这些大事件产生的时机,然后就可以阻止其发生,甚至是扼杀在摇篮之中。但我们不是要探讨应对之策。

实际上,学习复杂系统的最大原因就是去解释涌现性(这可能是宇宙的一个基本属性),教授认为,涌现性是:when the macro differs from the micro(当宏观不同于微观?)。一个景点的现象就是意识的自我涌现。

随后从《微观动力和宏观表现》中举了一个例子。一群人,他们没有种族主义,要选择一个地方居住。根据本书的研究表明,从宏观观测,这群人是种族隔离的,但是从微观来看,他们又并非种族主义者。显而易见,这就是微观和宏观之间的“失联”。这个失联并不是整体与部分不同,而是整体在类型上的不同。比如单个的水分子不可能产生“湿”这个属性,只有在宏观层面才会出现湿。(水滴是水分子的宏观级别,但是水滴在微观层面,每个水分子都是相同的)

涌现性的通常形式是产生自组织,表现为一些空间图案和结构。如鸟群,鱼群,晶体结构,这都是自组织。同样的,自组织也是自底而上的,没有核心控制,就比如没有哪个水分子会跳出来说:“hi!艾瑞巴蒂,我们变湿吧!”。而队列表演则是自顶而下的,有指挥,人们会跟着命令行动。

复杂系统在动态角度来看,有一个有趣的现象就是相变。(视频的例子用语言描述比较难,换一个例子来说。比如咱们想冲出地球,就必须要达到第二宇宙速度,哪怕是比第二宇宙速度稍微慢一点都不能摆脱地球引力束缚。所以,对于冲出地球这个问题来说,第二宇宙速度就是一个相变点。)

我们称这个相变特性为非线性。就比如第二宇宙速度是11.2,一个火箭一开始的速度是10.4,增加一点,到10.5,也还是冲不出地球,再加一点10.6也不行,再加一点10.7也不行,再加一点10.8也不行,.。。。最后加到了11.2,突然他就行了!。这就是非线性系统的特性。

教授举了个例子,学习非线性方程就像是学习non-elephants(盲人摸象???),人会淹死在数字的海洋中。

第二课 simple , rugged and danding landscape

本节课我们将重点讲述landscape(地貌?)
我们将使用但不限于比喻的方式,比如想象我们正在爬坡,同样也要使用数学对象描述,这个对象是将函数的数值到一个特定的点作为地貌的高度。所以高度将扮演函数值的角色。我们将从最简单的可行的地貌说起,比如富士山,就像一个突出的椎体,你很容易就能够找到最高点。本次课程将会展示如何将现实中的问题,如经济,生态问题,转换成“富士山”(这样的地貌)。

我们讨论的大多数问题都不是像富士山这样的(简单),这些问题有高峰有低谷,你很难一眼看到最高点,也会被困在很多地方。

如果你站在阿巴拉契亚山道,你会看到很多山路都是向上指的,这时候就会迷失方向。

像阿巴拉契亚这样的地貌就被称为崎岖。本次课程我们将会学习这些地貌是如何变得崎岖的,答案将会是智能体采取的选择和机会之间的相互作用。比如,设计一辆汽车,也许你觉得大重量能让一辆车更好,但实际上也许会事与愿违,因为你需要更沉的引擎才能带动整车的重量。因此,改变一个变量也许会得到局部最优,但实际上却会导致全局变得更糟糕。

人们总是说复杂系统就像一个崎岖的地貌,这并不准确。复杂系统包含依赖性和自适应的智能体,这意味着,解的数值,地貌的最高点,取决于其他人的行为。这意味着一个人所处的高度会因为其他人的行动而改变。所以在本次课程中,我们将重点关注复杂系统是如何组成智能体之间的依赖关系,假设他们之间都是以某种关系相互关联的,而且是多样的。但关联性和多样性暂且不谈,因为我们更想知道地貌是如何变得崎岖的,以及地貌如何跳动。

想要了解跳动的地貌确实比了解崎岖的地貌更具有挑战性,而实际上复杂系统是一个跳动的地貌。想象你在阿巴拉契亚中的一个山峰,暴雨来了,你能看到洪水上涨,却丝毫不慌,但突然来了地震,整个地貌都发生了变化,上一秒你稳如老狗,下一秒你可能就没了。所以,想要保持干燥,保持一个好的解决方式,当地貌发生跳动的时候,要持续的警惕和频繁的运动。

  • 富士山地貌
  • 崎岖地貌
  • 阿拉巴契亚地貌

以上这三个地貌是本次课程的主题,所以这和复杂系统有什么关系?这些都仅仅是比喻吗?我们将要用上述这三个例子来解释,为什么有些问题可以被人和进化最优的解决,而另一些问题不能。另外,我们也将会窥见复杂关系诸如生态系统和经济系统和造核弹、治疗癌症等复杂问题的核心问题的不同。我们也将知道为什么解决一个困难问题的最好方式,又或是崎岖地貌问题,与如何在一个现实的复杂世界中存活的不同。所以,我们比喻的地貌,那个非常好的富士山地貌,是我们思考复杂问题的基本方式。记住,富士山地貌并不是一个比喻,而是一个确切的数学定义。地貌中点,实际上是你的动作,你的(一个动作的)解,而高度就相当于解的数值。在开始之前我们要先下两个定义,这两个定义是直觉的,同样也是很重要的:当我们看到一种地貌的时候,峰或者尖就是一个山岭的最高点。我们需要区分局部顶点,这意味着无论朝着东南西北运动,高度都会下降;而全局顶点则是整个地貌的最高点。所以,对富士山来说,它有一个局部顶点,这个局部顶点同样也是全局顶点;而阿拉巴契亚,则有很多很多的局部顶点。在重申一遍,富士山(那样的简单地貌)有一个局部顶点,而崎岖的地貌则有很多很多个局部顶点。

现在我们就要思考,如何在崎岖地貌中寻找(全局)顶点。假设你有足够的时间能够遍历全局,那你就会很容易的找到全局顶点,对吧。但这实际上是不可能的,你会以更大的概率陷入局部最优。情况到了崎岖地貌这里就会出现很多问题,它不会像富士山那样仅有一个全局最优,而可能像洛基山脉那样有很多很多山峰。跳动地貌的关键特征就是它们频繁的运动变化, 所以你想要处于局部顶点,那你就要时刻的运动,意思是你要不断的去适应,去学习。以上这个idea是本课程的中心角色,过程中会被反复提及,这是因为:在复杂系统中,智能体不断的去适应,而陷入一个局部顶点。对于智能体的表现和回报,我们可以理解成地貌的高度。那么对于处在复杂系统中的公司啦,物种啦,都在以某种方式“爬坡”,让自己保持在崎岖地貌中的局部顶点,当然也有欧皇能爬到全局顶点,但没必要肝。所以,上述观点说明了一个问题,就是地貌高低可以代表行为或者选择的好坏程度,高度越高解越好。

现在我们可以不用比喻,转而来点实在的。在之前的课程中,教授曾提出了一个观点,那就是这个世界变得越来越复杂了,导致了联系更加密切,依赖更加紧密,反映更为迅速。在二战时期,我们面对的问题基本都是工程问题:如何造战车,如何造导弹。而到了20世纪,许多涉及人工劳动在单一任务上的问题,比如铺设铁路,挖煤,拧螺丝,对于这一类问题,就有很多时间去试错了,而且良好的时间管理技术,使得找到全局最优成为可能。

事实上,这种通过实验去找最优解的洞察能力率先在19世纪成为了支撑整个商业模式的方式,这被称为了科学管理,或者是泰勒主义。泰勒是这方面的奠基人,他的一个经典案例就是铲煤。比方说我们现在要铲煤,但是这个铲子没有头,技术的说这就是根棍子。如果我们用这根棍子去铲煤,那么产能是零,对应的地貌高度就特别低,因此效能就很低也提不上回报。当铲子的头变得越来越大,我们就可以铲越来越多的煤,这时候我们就可以用工人在一个班次内的铲煤量来计算这个铲子的性能了。所以,提升铲子头的大小就能够提升铲煤量,对应的地貌高度就会变得更高;但有些时候铲子头太沉了,又会导致产煤量降低。在更长远看来,铲子头大小的提升会更加急剧的导致工人产能的降低,就比如铲子头变得像餐桌或者讲台那么大的时候,产能一样会降低至零。所以我们就可以将这个现实世界中的问题转化为数学方程,那就是一张图,这张图可以被想象成地貌。这时候,横轴可以代表铲子头的大小,纵轴代表产能效率。

如果将上图想象成地形图,那么我们就得到了一个二维的“富士山”。这种问题是比较容易解决的,也是比较好理解的,无论是用数学去算还是用实践去试错,都可以找到最优解,教授给出了这个最优解的高度是21磅。

但当今世界已经早已不是泰勒的那个时代了,我们所面临的问题更加复杂,地貌更加崎岖,还伴随着跳跃。因此我们想尝试着建模跳跃的地貌。

我们首先来探讨崎岖地貌。在崎岖地貌中寻找全局顶点并不是一件易事,因为概率空间很大,被称为combinatorically large(组合爆炸?)。而科学又不是能像展开地理图那样直观,顶点能被直接看见。所以为了找到全局最优,我们必须被迫的去寻找局部最优。进化就是典型的在解空间搜索的过程中(寻找全局最优)受到搜索步长的约束,物种不可能跨越老虎和大象,直接进化成“象虎”,一种体型巨大有着黑色条纹和獠牙的超级野兽。我们不是说象虎这种怪兽不可能存在(言外之意就是,象虎在解空间中是有可能存在的),而只是说解空间太大太大了,有无数种情况要去试,所以无法实现一个从老虎和大象两个物种直接跳跃的步长(因为这个步长根本不可测)。

教授举了一个例子:比如今晚吃鸡,假设你要做一个全世界最美味的鸡料理,这就要涉及到原材料问题。你是要用土鸡,还是用玉米鸡,还是什么鸡,然后你又要用鸡的哪一部分?又要用什么烹饪方式?什么调料?好了,现在假设是场上有3种不同类型的鸡,鸡又可以有5种能吃的部分,烹饪方式20种,调料50种,这时候用排列组合的方式去计算一下,那就是3·5·20·50种排列组合,炸了。

排列组合的爆炸与崎岖地貌并不是一回事。如果地貌变得崎岖,就必须有相互作用,这些相互作用使得地貌变得崎岖。这些相互作用发生在单个行动者的选择之间,要搞明白它们是如何产生的局部顶点的,就必须深入挖掘一些例子。(简而言之就是牵一发而动全身)

比如现在有一个小房子,我希望扩大一下房子的入口,但不得不移动壁橱,不过我可以将壁橱弄到楼上的卧室,这看起来很美好,我们似乎到达了一个顶点———房子的门扩大了,卧室也有了壁橱,但实际上卧室会变得暗了,于是不得不再给卧室开一个窗户,这个操作就使得整体的地貌上移了。原本只需要花10块钱就能将房门扩大,最后一算却花了1000块,得不偿失。我们在这个高度滑倒(在这个问题上失手),究其原因,是因为变量在这个装修的过程中是相互影响的,而不是相互孤立的。(如果要扩大房门就必须移动壁橱)。

因此就有了一个原则:关联越多,地貌越崎岖

与之前的铲煤不同,铲煤所要考虑的事情非常简单(变量只有一个,就是铲子头大小),而装修的案例就很“崎岖”,因为变量是各种家具和房子格局。

但是,尽管像装修那样的崎岖地貌的问题很难,但是它并不复杂。它们不复杂,是因为它们保持不变(家具还是那个家具)。所以,崎岖常常只是复杂性的一个组成部分。不过崎岖性也可以变成复杂性,只要地貌发生跳动。

如果要解释崎岖和跳动之间的不同,只需要举两个例子,一个是牛奶供应商的例子,一个是飞机航线的例子。

每天,奶牛产奶,奶农挤奶,供应商收集牛奶然后分发各个销售点销售。假设供应量和需求量都是常数,那么供应商就有了两个问题要去解决,第一,应该分配哪个卡车去哪个农场;第二,牛奶经过巴氏杀菌之后,应该分配哪个卡车去哪个销售点。
最性感的解决方式当然是用数学,但是通过最大化利益计算上述问题并不是那么容易的,实际上这是一个崎岖地貌的问题,为什么?(参考中国邮递员问题。)找到最优解实际上是一个非常困难的问题,这个问题被计算机科学家研究了很久,这需要很多算力和时间去解决。对我们来说,这个问题虽然很难,但至少是不变的,因为农场的位置是不变的,奶牛也不会走的太远,所以我们日复一日,面对的都是同样的崎岖地貌。但如果问题到了飞机航线问题,那么地貌就开始跳动了,因为飞机航线是会受到很多很多因素影响的。参与者的行为会导致地貌跳动,这是因为参与者之间是相互依赖的。比如在飞机航线的例子中,参与者有:消费者,航空公司,etc。假设有很多数学家和物理学家参与航线设计,花了半年时间给出了最大利益,这对消费者和航空公司来说都是非常给力的。航线设计可以在六月一日实施,但是该公司的对手又给出了一个更给力的优惠政策并且可以在五月末实施,这时候,第一家航空公司就不得不改变策略了,这意味着他们白白努力了半年,整个计划都泡汤了。这就是地貌的跳动:山峰变平原,山谷起丘峦。所以,也许一个曾经的最优解对现在来说甚至不是一个解。复盘一下,你想,六个月才给出了最优解,在这其中,地貌早已经发生了变化,只能说是:大人,时代变了。

what makes a landscape rugged are interactions between our own choices.
使地貌变得崎岖的正是我们的选择之间的相互作用。

what makes a landscape dance - and a situation complex -are interdependices between our actions and the actions of others.
我们的行为与他人行为之间的相互依赖使得地貌跳动,情况变得复杂。

一个行为的回报,或者说是他所处的地貌的高度,是取决于其他行为者的行动,这就是依赖性。而且依赖性起作用仅仅是在行为者适应环境的时候。

Complexity requires both interdependence and adaption.

虽然复杂性的程度会随着依赖性和适应性的提升而提升,但这是有限度的。

如果地貌保持不变,那么生活就会容易很多。但实际上不是,又因为实际上不是这样的,又使得公司,人,动物,并不总是采取最优策略。有些事情过去是最优的但并不一定总是最优的,

总结一下:

你可以想象一个问题的潜在的解是地貌中一个有高度的点,如果我们将这些解标号,从1至n,这些解的数值也许会形成一个富士山地貌。但随着情况的变化,地貌会变得越来越复杂。最后,如果我们的回报不仅仅取决与自己的行为,同时也依赖于其他行为者的行为,我们就会得到一个跳动的地貌,而一个跳动的地貌反过来又需要依赖性和适应性。

那么这些论据有什么重要的地方吗?

实际上,上面这些论据告诉我们,有时候,进化,或者人体系统,是能够像富士山地貌那样,找到最优解的,但有些时候不能。

又比如向日葵,向日葵的种子呈螺旋,实际上是斐波那契数列,这种结构最能吸收太阳能。但是向日葵不可能懂得数学,因此他们是在漫长的进化过程中通过适应环境而形成了这种螺旋结构的。

最后一个有趣的观点,是被哲学家称为“stand point”的概念,俗称perspective,观点。另一个更像是在新时代解构的短语:禅宗。

in creative systems there is no landscape

第三课

The Intersting In-Between

在第一课中,我们讨论了什么是复杂性,它的属性,以及它为什么重要。

在第二堂课中,我们了解了各种地貌,富士山地貌,崎岖地貌以及跳跃地貌。我们辨别出了一个难题:在崎岖地貌中找到顶点,与在复杂世界中生存:有很多种情况需要我们在一个跳动的地貌中不断学习、适应,以此变得成功,的不同的关键。

在第二课中,我们还观测到了相同实体的多维度多选择的交互行为会产生崎岖地貌,然后它在不同实体、公司、人、之间的依赖性与适应性一起,使得地貌跳跃,由此产生了复杂性。依赖性在其中所扮演的隐藏角色,实体是相互关联的,而且是多样的。

在本次课程中,我们将更加深入的讨论复杂系统的四个属性:

  • 依赖性
  • 关联性
  • 多样性
  • 适应性/学习能力

还要看这四个属性是如何形成复杂性的。

如上图所示,我们来做一个拨号的实验。四个旋钮代表复杂系统的四个属性,数值0~10代表属性的程度。就比如多样性为0的时候,系统内所有的实体都相同;多样性为10的时候,,系统内所有的是挺都不相同。关联性为0的时候,实体都是孤立的;关联性为10的时候,所有的实体都是关联的,etc。
教授希望通过拨号的方式去观察到底是什么造成了复杂性,又是什么没有起作用。当然,这个实验是个思维实验。

每当我们扭动旋钮的之后,就要想象发生了什么。

好了,当我们真正扭动旋钮之后,发生的事情也许与我们的期望正好相反,越是极端,越是得不到复杂性。实际上,复杂性只能出现在一个区间中,教授喜欢称之为In-Between。(也就是本次课程的题目,似乎翻译成中庸?)啥意思?解释一下就是,如果实体变得极度关联,那系统就越不复杂,我们就越容易得到统计规律。另一方面,如果实体的关联越是稀疏,那么系统就没有那么多动力去变得复杂。所以,系统也就必须在处于中庸状态的时候才会变得复杂:既不要简单的没什么关联,也不要复杂的到处都是关联。
现在,我们将四个属性都调出来,来看看复杂性是如何变化的。但在做此之前,我们必须要搞清楚,系统将会采取什么什么样的行为,所以我们也就可以辨识出哪些情况是复杂的,哪些情况不是。我们将要采用一个分类方法。但在开始之前我们将会非常仔细解释什么是要被归类的,我们将要归类系统本身、它所遵循的规则以及它的初始状态。

就比如以家庭举例,家庭成员坐在餐桌前的时候,会发现他们会表现的以一种非常巧妙且固定的模式安坐。所以,你可以说这个家庭是非常稳定的。同样的,我们再让这个家庭在车里待上一天半,在这种情况下,emmm,就变得复杂了。在经过了长久的沉默之后,暴力就爆发了。我们不可以说这个家庭是稳固的,也不可以说它复杂。因为这个家庭既可以是稳定的,也可以是不稳定,至于究竟是哪一种情况,还要看这个家庭的初始条件,是在餐桌前,还是在车里。

这对于任何一种复杂系统都是成立的,系统的行为既可以由初始状态决定,又可以由它的构成组件所遵循的规则决定。所以,这就是我们思考复杂系统的方式。

Wolfram’s four classes of behavior./沃尔夫拉姆对复杂系统四种行为的分类

  • class 1 : stable,single-point equilibria
  • class 2 : Periodic orbits
  • class 3 : Chaotic
  • class 4 : Complex
  1. 稳定态,单点平衡:教授说的比较多,而起他又提起了第一课的例子,我所举的例子是第二宇宙速度,这里继续以第二宇宙速度的例子为例。单点平衡有点类似于混沌理论中的吸引子,在这里的含义是,复杂系统中没有发生相变的元素最终都会归于一个稳定点(上一个相变点)。假如现在物体运动的速度介于第一和第二宇宙速度,那么这个物体最终会保持在第一宇宙速度,因为第一宇宙速度是一个相变点。

  2. 轨道周期:(直译)。还是有点像吸引子,因为吸引子是不同的,有的是蝴蝶效应中的那样,有的是一个点。教授说,第二点就是周期轨道,比如地球绕着太阳转。遵循轨道周期法则的,不一定是物理实体,也可能是狐狸和兔子的种群数量问题。(感觉还是吸引子问题)

  3. 混沌:这里直接说了蝴蝶效应,对初始值非常敏感。
  4. 复杂:在这点问题上,教授称之为复杂行为。就像轨道周期法则那样,复杂行为也会有固定模式,但与之不同的是,这些模式更长,而且它有一个数学名称:high-information contact,这意味着,你需要很长时间很多信息去描述他们。所以生命是复杂的,而且难以描述,比如股市,互联网,在车子里的家庭。系统在这些时候没有固定规律的,没有任何家庭、公司、国家会像时钟那样规律,但他们也并不混沌,而只是处于中庸。他们有结构,但是这个结构并不容易去下定义。

这时候,教授抛出了一个非常有趣的问题:什么条件才能让系统落入上述的四种情况之一?换一个表述方式,就是什么使得系统稳定,而什么又使得系统混沌,或者说是复杂?

继续回到之前的思维实验。我们现在将依赖性调为0,这意味着系统里的所有人都是孤立的,所以他根本不care其他人干啥。就比如我穿一件衣服雨女无瓜。这时候我们统计一下平均情况,会发现那大概是一种平衡状态。天越冷,穿毛衣的人就越多,这没什么复杂的。但假设你提升依赖性的程度,再看一下初中生,“我希望我穿的毛衣和我朋友一样,但我不希望我朋友穿的毛衣是我不喜欢的那种。”,一旦有了这种依赖性,那么就会有出现复杂性的苗头。所以你会看见初中生站在镜子前纠结到底要穿什么,这就是复杂性,这是由依赖性所产生的。我们继续转动这个旋钮到10,所有的学生都会关心在乎其他学生穿什么,甚至是一个装饰。我们就会超过复杂的界限而得到混乱。因为一个学生换了装,其他学生都得换,这就接近了混沌,对初值非常非常的敏感。

interdependency : whether other entities influence actions

connnectedness : how many people a person connects to

不会去改变某个人对你多重要,而是去改变多少人对你是重要的。我们来加入两个“游戏”,来自博弈论(game theory),一门研究策略的学问。
第一个是完全合作游戏(pure coordination game),在这个游戏里,人们采取的行为会完全的和其他人相同,就以打招呼为例,我们会握手,亲脸,拥抱,你只需要选择其中一项,然后照做即可。重要是你要和你的朋友做同样的事,如果你去握手结果你的朋友要选择拥抱,那就尴尬了。好了,现在让一个网络中的人去做游戏,然后他们决定了一个规则,而我们所要做的,就是去假设(这些人玩游戏的结果有)最优回应(best responed)。就比如,当玩家采取最优回应的时候,昨天们握手,那么今天你就握手;如果昨天你的朋友亲脸,那你今天就亲脸。好了,现在假设系统的关联性很小,就比方一个人只有一个朋友,那么这个系统就会陷入平衡,一部分朋友对会握手,一部分朋友对会亲脸,还有一部分朋友对会拥抱。现在让这个系统变得更联系一些,部分联系吧,并初始化一些人是握手,一些人是亲脸,一些人是拥抱,有些人又会从亲脸转成拥抱,有些会从握手转成亲脸,etc。过了一会儿,或者是过了很长一会儿,这个系统就会陷入一个平衡状态,也许会过很久很久,但最终所有人都会以同一种方式打招呼。
现在继续转动旋钮,让每个人之间都有联系,人们打招呼的方式就会快速的收敛到那个最流行的行为,不管是亲脸还是拥抱、握手。其结果就是,平衡态会很快速的达到。

所以在这个完全合作游戏中,不管这个系统的关联性有多高,但最终都会陷入平衡态。
如果关联性程度处于中庸,那也许会用很长很长的时间去达到最终的平衡状态,过程中可能会产生混乱,但终归是平衡态(这不就是吸引子吗???)。

现在又换游戏了,换成石头剪刀布,那么游戏的合作就会转化为博弈,人们会采取和其他人相悖的方式。然后还是从低关联性着手,一人一个朋友,但这时候你朋友出布的时候你就要出石头了,再假设最优回应,就意味着如果要达到最优回应,就必须要赢。所以你朋友如果出布,你就要出剪子,然后另外的人可能又出石头,然后套娃了。

这个过程就是一个循环过程,长度为6.对应于第二种分类,就是周期轨道。

这时候再调整关联性程度至10,一个人要采取的行动就要取决于其他人了。就比如,一开始大部分人都是出石头的,这就意味着下一个时间步,所有人都会出布,因为出布能够获得最优回应。下一个时间步,所有人又会出剪子,因为对于别人出布的时候,出剪子能获得最优回应。然后陷入了套娃。

所以我们可以看到这样的现象,无关联性的时候,我们得到了一个循环;高关联性的时候,我们也得到了一个循环。

那么中庸的情况呢?就是连通性处于一个中间位置。

这时候就会出现复杂性(有兴趣可以看看动物世界),所有人都会根据周围的不同做出自己的选择,这时候就会出现一些有趣的模式。这个例子的情况是真实存在的,就比如你的肠道菌群。有些是敏感的,有些是拮抗的,有些是有毒的。这些大肠杆菌就在我们的肠道内做游戏。敏感的大肠杆菌能够击败拮抗的,因为敏感的大肠杆菌繁殖速度更快,因为他们的DNA更短。但是这些敏感的大肠杆菌又会被有毒的大肠杆菌干掉。又但是,拮抗的大肠杆菌能够抵抗有毒的大肠杆菌。

所以在你的肠道内,是真实发生石头剪刀布这个游戏的。而这个游戏的名字叫做“敏感,拮抗,有毒”

有的生物学家就真的做了这个实验。他们将这三种大肠杆菌放在同一个培养皿上培养,然后在显微镜下观察,他们发现了复杂性,发现了大肠杆菌多样的模式。
为了判别这种模式是否取决于关联性,他们就将大肠杆菌放到了烧杯里搅拌,这样就会使得关联性提升,(几乎)每一个大肠杆菌都与其他的大肠杆菌相关联。这又会观察到什么呢?人们观察到了其中一种大肠杆菌的阵亡,系统没有复杂,而是最终陷入了平衡。所以,自然科学也有很多这种现象,少量的关联性会引发复杂,但是关联性太强又会陷入平衡。

接下来我们会看到更有趣的东西:如果你上过博弈论的课,教授的博士生涯就是研究博弈论的。你研究每一个参与者不同的策略行为,这些参与者可以是公司,政治实体,两个玩羽毛球的玩家。

所以你对这个结果不会感到震惊:博弈论中的大多数结论的研究对象都是两个低关联性的参与者,或者很多个高关联性的参与者。因为两个参与者的情况并不难研究,而很多个参与者的情况你只需要统计大多数人怎么做就可以了。

有趣的是:关联性中庸,所有人都玩着自己的“局部游戏”,这时候就会出现地貌。所以用数学描述这种情况就会变得极其复杂。所以,博弈论就会忽略中庸,转而研究两个极端,要么关联性很高,要么关联性很低。

所以,关联性过高或者过低都会导致系统陷入平衡,复杂性只会出现在中庸。

下面我们来说说多样性。我们首先来说清楚什么是我们要研究的多样性:在生态环境中,多样性应该是指物种的多样性。在经济系统中,多样性应该是指公司产品的多样性。在化学课中,多样性应该是指化学元素的多样性。

但我们说的多样性并不是指差异,就比如人口统计的方差,这个问题后续会继续讨论。

教授所说的多样性,是种类上的多样性。

Diversity : different in types.

不同的种类有着不同的功能。所以我们先从化学实验来看看,什么级别的多样性能影响复杂性。就比如我有一大堆碳原子,没有任何多样性,因此也没什么好玩的事情发生。但当我在其中加入一些其他元素的时候,我就能得到一些稳定的化学物质。比如氢原子加氧原子就能得到水。所以这个观点就是,如果我们加入一些不同种类的东西,就会有很好玩的东西出现。可乐+曼妥思=爆炸。所以,没有多样性,就没有复杂性。加入一些由不同功能控制的相互关联的实体,就能得到复杂性。

但如果我们把元素周期表的前20位混合在一起,我们只能得到一坨糊糊。所以,当我们按照一定步骤去转动旋钮的时候,我们就会从简单到复杂到混乱。wait a second,那生态系统又是什么样呢?上面的观点还会成立吗?下面来看看撒哈拉大沙漠。其实撒哈拉里面也是有上千种生物的。作为对比,亚马逊雨林有超过5百万中生物。因为雨林退化,每周都会有近一千种生物的消失,这比整个撒哈拉加起来还要多,而且这仅仅是一周。但是亚马逊雨林依旧是复杂的,而不会变成一坨糊糊,为什么?因为亚马逊雨林是经过了长时间的演化而来的,每一个物种都适应和进化出了一定区域的适应性(niche assembly,个人翻译:生态位汇集。维基百科没找到这个词),这需要物种之间有严格的交互(不能越界)。如果不是要建立一个生态系统,而只是随即的连接各种物种,那我们就得不到复杂性,而大概率能看到系统的崩溃。教授的意思是,即使系统的多样性很高,但系统仍是以低交互响应的。这并不是直觉,一个生物学家就总结出了一个理论模型,用于考察一个系统的鲁棒性和多样性之间的联系。这个生物学家就设计了几种可以相互为食的物种,然后手动指定谁吃谁,谁吃什么(这是在降低关联性)。他就发现,一旦多样性超过了某一个点,鲁棒性就没了,复杂性也随之消失。你就会发现,整个生态系统就突然崩溃了,再也不会支持复杂的动力学了(狐狸和兔子的那种人口动力学模型)。

那么要如何解释上述情形呢?回到化学实验,这和之前的生态理论模型很像,我们把很多种东西混合在一起,如果我们有很多的随机种类(因为随机的东西是没有界限的),那么就会要么得到一坨糊糊,要么就是崩溃。再回到亚马逊的例子,每一个物种都是有各自的生态位的(老虎不可能像蜣螂那样吃屎),所以,这就使得系统有可能增进多样性而变得更加复杂,别不要去想着单纯的增加多样性就能够得到复杂性,而只能是事与愿违,要么崩溃,要么糊成一坨。这就像外来入侵物种一样,虽然增加了多样性,但是没有增加复杂性,而且还破坏了复杂性。

好了,最后来讨论适应性/学习能力对复杂性的影响。当我们转动旋钮的时候并不是希望增强参与者(智能体)的适应性,因为这样会使得演化加速,系统变得没什么好聊的,而是增强参与者的学习能力,让参与者变得更加聪明。依旧是从零开始,让参与者的智商为零,没有学习能力,他们就是一个遵循法则的参与者。在后面的课程中会提到生命游戏(元胞自动机),虽然其中的参与者也是遵循一些法则而产生复杂性,但二者并不相同。所以现在我们面临了与之前对多样性和复杂性的讨论的问题,就如同化学和计算机,虽然我们可以把很多不同的东西混合在一起,但是我们得不到复杂性。这时候,学习能力就会起到很大帮助,系统中的参与者就知道了如何与其他参与者互动,也知道如何才能形成一个复杂的整体。现在我们将适应性旋钮转到最右边,然而答案却通常是陷入平衡,解释如下:假设系统保持流动,其中的参与者一定会想办法改变他们当前的行为,那么就一定有足够聪明的参与者已经改变了他们的行为。现在将这些参与者看成是人。如果所有人都是非常聪明的,我们的行为都会根据其他人的行为调整至最优,然后这个系统就应该是平衡的。又因为我们假设了系统不是平衡的,所以就应该会有人做一些不同的事情,因为假设人们足够聪明,因此应该早已经做了这些不同的事情。这不是说像石头剪刀布那样,最优化体现在下一个时间步。我们举的这个例子,最优化就应该是处于时时刻刻,这东西在博弈论中被称为纳什均衡,这是新古典经济学的一个核心观点,人们总是最初最优的选择(这就是理性人假设吧)。但如果人们总是最优,那我们就得不到复杂性,而是平衡态。这就是为什么我们的市场经济是复杂的,因为如果人足够聪明,那么经济市场时刻都是最优的,因而会陷入平衡态(这和陈平大佬对新古典经济学的批判是一样的,如果人人都是聪明的理性人,那么大家的最终收益都是0)。我们在接下来的课程中可以看到为什么负反馈并不是经济学一个的坏假设,另外,这也不一定对于所有情况都是好的假设。
另外就是,比如扑克,实际上扑克并不复杂,虽然它的情况很多,但是你只需要根据情况并按照一定规则作出反应就能胜利,因此并不有趣,只有玩家在处于中庸的时候才会觉得有趣。

第四课 Why different is more

在这节课中,我们聚焦于复杂系统中的差异性:种类的差异、或者是种类的多样性。就比如一种蓝色的小鸟(indigo bunting):

靛蓝彩旗之间的差异性很大,如果你想挑一只鸟,那么雄鸟擅飞,雌鸟擅鸣。相邻的靛蓝彩旗叫声会有一种模式,但是哪怕是超过了半英里,这种模式都会发生变化。所以当你看到了一种与上述描述相同的鸟,也许你会说,看,这就是靛蓝彩旗,但从技术的角度来说,这不太正确。你应当当说,这是整个靛蓝彩旗种群中的一只。为什么教授如此吹毛求疵?因为这种叫做靛蓝彩旗的鸟类,在基因型和表现型上都是不同的,所以每一只这种被称为靛蓝彩旗的小鸟的出生或者死亡,都在改变着这个种群的定义。靛蓝彩旗是我们对这种鸟类的种群区分,而不是一个固定的事实,有种深远的影响。这种差异可以导致适应性的产生。比如现在会有一个长达十年之久的干旱,靛蓝彩旗的唯一食物来源就是小坚果,那么他们就必须要有短的喙去啄开果壳。所以,如果想要活下去,那么鸟喙就必须变短,在经过几代的繁衍之后,整个种群的鸟喙都是短的,因此,对于什么是靛蓝彩旗的定义也会随之而发生变化。

同样的陈述还体现在文化方面。这世间并没有法国人,而只是一类说法语的人。他们有着不一样的遗传基因、天赋、政治、技能。在本节课程中,我们将会讨论差异和多样性,这不可一并而论,而且两者对于复杂系统都是很重要的。本节课程将分成三个部分。

第一部分将会讨论什么是多样性以及如何测量他们,达到一种弄清楚他们的目的。

在第二部分,我们将会学习复杂系统为什么会产生多样性,为什么要产生多样性以及如何产生多样性。在这节课中还会讨论creative system(创造型系统)和 evolutional system(进化型系统),以及这两种类型的系统是如何产生多样性的。

在第三部分中,我们将会讨论多样性在复杂系统中所扮演的角色。所以先描绘一下全景图:复杂系统产生和保持多样性的能力使得它具有创造性和鲁棒性,

在讨论多样性之前,我们要先搞清楚什么是多样性。在过去的半个世纪中,物理学家,计算机科学家,生物学家,等等,提出了很多种不同的对多样性的测量方法。但我们需要分辨四种对于多样性的测量方法。

Four types of Diversity measures:

  • variation
  • entropy
  • distance
  • attribute

在讨论之前先说一句。

Measures can be constructed from the group up by experimenting by mathematical formulae, or derived analytically from a list of desiderate.

测度可以通过数学公式进行实验来从整体上构造,也可以从一系列期望中分析得出。

第二种方法似乎听起来更加的科学,但实际上两种方式都是殊途同归。

Diversity measuers compress informations.

因为在测量过程中,多样性会被压缩成一个单一的数,这就会使得信息丢失。就比如两个含有大量不同的集合却要用同样的多样性程度去测量。

第三,因为多样性程度的度量可以适用于很多很多实体,文化,语言,甚至是牙刷,所以这种度量方式不可能一劳永逸。

We should not expect a one-size-fits-all measure.

因此,对于多样性程度的度量有很多。

比如鸟类有着相同的基因血统,这可以以地理拓扑图的形式展现各个分支,我们也可以顺着这些分支去回溯鸟类进化的起源。所以,鸟类的分类可以利用这种分叉树结构。但是早餐就不行,因为早餐没有这样的图。充足的分类形式并不是坏事,这可以让我们有很多选择去适配各种情形,同样也可以让我们有多种角度去观察同一个实体。

接下来我们来考察一下各种不同的多样性程度的测度。

Variation measures capture differences along a single numberical attribute.

方差可以捕捉单一可列属性的差异。在靛蓝彩旗的例子中,鸟喙的长度是有方差的,我们可以用分布来捕捉方差,因为分布所做的事情就是以似然画出一段区间内鸟喙的值,最后形成一个高斯分布,就能够看见极值和方差了。然后教授为了解释高斯分布又举了一个气体分子运动速度统计的例子。然后又开始解释方差是如何描述差异的了。

如果此时我想测量餐厅里桌子的颜色的诧异,这时候,你对颜色进行数值分配是没有任何意义的,这时候就要使用熵测量了。

entropy measures capture the evenness of a distribution across types.

熵测度捕获类型之间分布的均匀性。后来教授又举了很多例子。

但问题是,熵测度并没有考虑测量对象的类型的不同。假设一个篮子里面装了3个苹果、5个棒球和7个罐头,这时候怎么测量差异呢。

distance measure: assume a preexisting distance function between pairs of types.

在之前不是说过鸟类溯源的例子吗?衡量两种鸟类有多大差异,就可以通过计算分支的方式衡量。这个就是多样性的距离函数测度。

有时候你能够找到距离函数但有时候不能,就比如篮子问题。但是一个集合中有着越多的距离,这个系统就会有着越多的复杂性,这个观点在多样性的创造力方面尤为重要。

所以,篮子问题可以使用属性测度。

attribute measures : indentify the attributes of each types in the set and count up the total numbers of unique attributes.

在篮子问题中,一个篮子有三个属性,分别是苹果,棒球,罐头。这时候只要按照属性逐个统计就可以了。在属性测度中,我们更关注的属性的多样性。这与熵测度不同,比如你去波兰的时候需要一个说波兰语的翻译,这时候熵测度告诉你一个翻译所掌握的外语的分布,但你并不care,你只需要这个翻译会波兰语就够了。

现在我们了解了这些多样性测度都是个啥,现在我们要了解多样性是如何产生复杂性的了。我们现在要介绍四种主要原因,对创造型系统和进化型系统都是成立的。

第一个原因是正反馈。第二个是竞争或者是自然选择,第三个是崎岖/跳跃地貌。

how diversity is produced in complex system:

  • cause 1. diversity begets diversity.
  • cause 2. weak selective presure.
  • cause 3. different landscape.
  • cause 4. dancing landscape.

对于第一个原因,这是一个正反馈。这也许是多样性形成的最主要原因。越多的多样性就会产生更多的实体又转而产生更多的多样性。就比如你有一盒乐高积木,你可以用它来拼成很多东西。这时候再给你一盒不同的乐高积木,这两盒叠加在一起就会出现1+1>2的效果。

对于第二个原因,现代生物学家总是说适者生存。与其说竞争激烈,不如说适者生存,实际上不适应的已经没了,然后多样性就散开了。比如在商场里面,你可以看见人们穿着各异。此时如果你以熵去衡量就显得很不理智了。但如果你去律师事务所,就会发现里面的穿几乎都穿的差不多。为什么?在第一个例子中,人们没有太多的自然选择的压力,你穿什么都不会被赶出商场。但在商业中就不一样了,你穿着体面,人们就会觉得你是一个成功人士,靠得住。

对于第三个原因,依旧以穿着为例。虽然商场里的人不必承受自然选择的压力,但是有的人就是想出众,就是想coooool,所以他们的穿着自然会和常人不同。这就引起了地貌的改变。

关于这方面最著名的一个例子是达尔文给出的。

同一种鸟在不同自然选择的压力下,进化出了不同的喙。他们在适应环境,也就是在崎岖地貌中爬坡的过程,尽管目的都是找顶点,但结果却是演化出了多样性。

最后一种情况,跳跃地貌,也是引发多样性的原因之一。

the coupling of the different landscapes can produce different outcomes.

  1. diverse parts
  2. weak selection
  3. different landscapes
  4. dancing landscapes

以上四点是产生多样性的主要原因。

现在让我们来看看市场系统和生态系统有什么区别吧。

Differnces between creative systems and evolving systems

  1. the size of the leaps
  2. interim viability
  3. representation
  4. retrievability

对于第一点,进化系统是没有太大的步长的,而创造型系统就可以有,比如手电筒+头盔=采矿安全帽。

对于第二点,临时生存能力。进化是受限的,路线上的每一个步骤都要可行。所以人类进化出眼睛的每一个步骤都必须是可行的,这和我们心脏的四个心室是同一个道理,只有在进化的道路上进化出了心室这个实体才有可能最终形成四个心室。就比如在某一个进化步骤上进化出了两个心室,那么进化出四个心室才有可能。也许你的工程师朋友可能会说他的产品虽然现在还没做出来但是已经很接近了,��很可惜的是进化的字典里可没有接近这个词。

对于第三点,进化受限于其基因,不可能转变到另一种编码。但在创造型系统中就不一样。在之前我们讨论过,创造型系统中是不存在崎岖地貌的。对于创造型系统来说,创造性的行为是由对一个新问题应用全新的模式所构成的。

对于第四点,创造型系统可以回溯和重新启用idea和产品。对于创造型系统自然不必多说,对于进化型系统来说,基因中确实包含曾经的某些片段,但就拿大象来说,它的祖先也许是猛犸象,但是大象永远不可能返祖,变成猛犸象了。

所以,以上四个观点都说明了在某种情况下,创造型系统是比进化型系统更加多样的。但我们似乎忘记了一件事情:龟兔赛跑和那句名言:稳扎稳打才能赢。进化是无情的,虽然它很慢,但是它很稳,而且坚持不懈。它会慢慢试错。但在创造系统中,人们就很茫然,很难去尝试不同领域结合解决问题。

最后,为什么多样性重要?

diversity produces innovation

举例来说,就是更多的乐高积木能够出现更多的创意作品。这时候就以爱迪生举例了。爱迪生的实验室里面有各种瓶瓶罐罐,这些就是他的乐高积木,爱迪生可以随意组合,但是这些是组合爆炸的,这些组合都是多样性的体现,大力出奇迹,总归是能够组合出一些让人眼前一亮的创造的。

第五课

Explore Exploit : The Fundamental Trade-Off

(这节课说的好像是动态规划)
还记得复杂系统是由实体,智能体,内在规则,复杂性,鲁棒性。
在本节课中,我们将探索智能体在复杂系统中的基本权衡(foundamental tradeoff),讨论一个智能体究竟是选择探索(explore)还是利用(exploit)。
首先,先来一些基本定义:

exploration: searching for better solutions
探索,我指的是智能体寻找更好的解决方法,如爬到更高的地貌。搜索的更多,就有更多的机会去寻找更好的行动方式。
exploitation: taking advantage of what you know

利用:利用你所知道的,收割你在过去探索中的利益。
这种权衡,在持续探索或是利用之间的权衡,对于处在复杂系统中的智能体来说是家常便饭。就比如你想在纽约找一个熟食品店,纽约有数千个熟食品店,而且熟食品店会不断的出现,已经存在的熟食品店不断的适应环境:他们会更换菜单和供应商。如果你愿意,你可以一直去探索,但是熟食店的品质有均值,因此不断的探索,只能得到处于均值的品质。所以,有些时候你需要做的就是,利用手头现有的信息。所以,有些时候你需要的仅仅是利用收集到的信息,但如果你停止了探索,而选择了利用你现有的信息,你可能会错过更好的选择,更糟糕的是,你对于一家店的忠诚也许会导致其他店的降价。所以(随着地貌的变化),也许那些曾经是最好的地方反而还达不到普通水平。
所以,你要么保持现状,要么继续探索,你所要做的,就是平衡探索和利用(balance exploration aganinst exploitation).
在本节课中,我们将了解到复杂系统中的行为者是如何以及为什么要保持这种平衡,另外,我们还要弄明白为什么这么做(保持平衡)会导致复杂性。
再过去的课程中我们了解到,少量的联系和内在关联性不会产生复杂性,而是会产生一些独立的事件。反之则会产生复杂性或者gray goo。我们也知道,复杂性的出现要处于中庸的状态。那我们就要思考了,如果之前所说的旋钮都处于正中间的时候会出现复杂性,那么这些旋钮究竟是怎么被扭到中间的呢?

本次课程的基本观点是基于探索和利用的平衡,我们将在一个崎岖地貌问题,也就是two-armed bandit问题中,讨论探索和利用,而且我们也会介绍一些比较cool的算法,这些算法很好的平衡了探索和利用,被称为退火算法。这种方式最开始是从物理现象中取得的灵感,进而被用来解决一些问题。然后我们就会讲到演化系统,去看看一些进化的基本机制,比如进化、免疫、重组、选择,这些都可以被看作是探索与利用之间平衡的表现。

在一些赌场中你可以看到类似的赌博机,一般的赌博机都是单臂的。

而我们现在要说的是这种双臂的赌博机。所以,这一场赌博就是在寻找探索与利用之间的平衡。在之前的单臂赌博机中,我们拉动拉杆就知道赢了还是输了,但是这种方式并不具备复杂性,因为毕竟只有一个拉杆,即使你兜里有1000个硬币去赌博,最后也只能是知道赔了还是赚了。但是如果我们用这1k个硬币去双臂赌博机赌博的时候,情况就不一样了。

如上图所示,我们可以看到,左右两个拉杆得到的回报是不一样的,所以,假设你就探索到这里了,你也许会把剩下的980个硬币都投给右臂。但如果你继续探索,左右拉杆各十次,左边的回报是4,右边的回报是6,那么你也许就会得到结论,真的还是右边的拉杆得到的回报多。
再以登山者举例,登山者每走一步都可以判断这一步是向上还是向下了,如果是向上,那说明他再朝着好的方向发展,如果是向下了,那么他可以退回一步,这样,他不断的搜索不断的搜索,最终可以达到“山顶”,因为他四周都是向下的情况。如果是富士山的话,那么登山者很容易找到山峰,但是如果换成非常崎岖的洛基山脉这样崎岖的地貌,那么这个登山者就会被局部的山丘困住,因为山丘的四周也都是向下。
所以,在问题很简单的情况下,我们很容易找到那个山峰,但对于复杂的问题(崎岖的地貌),这个山峰就很难找到了。上述的登山者搜索山峰的方式被计算机科学家成为贪心所搜,意思是贪心并不总是最好的。所以我们需要更多的神经元去进行搜索,让登山者摆脱局部最优。搜索的方法就是多一点探索,少一点利用,相较于贪心算法。
这种搜索方法被称为退火算法,这种算法是在曼哈顿工程期间被发明的,
然后又举了切叶蚁的栗子。

Emergence I : why more is Different

在这一章中,我们要了解一个复杂系统中的神奇现象:涌现。

emergence : the spontaneous creation of order and functionality from the bottom up

如果我们观察物理世界,我们可以看到每一层级涌现出的规律。螺旋的星系,太阳系中围绕太阳旋转的行星,甚至是木星上的三倍于地球大小的风暴。这些我们都可以看做是涌现。而我们再反观地球,涌现的结构到处都是,河流、动物形成的模式。我们再看深入一点,比如人体,有呼吸系统,神经系统,骨骼系统,每一个这样的系统都包含了不同结构的细胞,他们以某种形式相互作用,最后涌现出了部分不具备,但是整体具有的特殊性质。总而言之,我们可以看到各种尺度的涌现性,不管是用望远镜去观察宇宙还是用显微镜观察细胞。我们强调结构,这些结构是具有功能的,心脏跳动,?,河流涌动,etc。但神奇的是,这些事情都发生在没有中心控制者的条件下,不是自上而下组织起来的,而是自下而上涌现的。探索结构和功能是如何自下而上涌现的 ,是所有科学中最有意义和有趣的事情。(省略一百字)

首先我们以史莱姆举例,它是一种?的单细胞生物,它们以腐烂的植物蔬菜为食。当史莱姆遇到困难的时候,如食物短缺,单个的史莱姆会产生酶,这是一种报警信号,附近的史莱姆会感受到这个报警信号,也会顺着这个方向产生酶,这就会产生更强烈的报警信号,这就会产生一个(没有)信号的路径,所有的史莱姆会向着那个没有报警信号的方向移动,最终汇聚成一个果冻一样的东西。这个果冻中的每一个细胞都是单个的史莱姆,任意两个细胞之间也没有什么不同。这个果冻没有心脏,没有大脑,也没有勇气,但是它却有个名字,叫做 伪原质团(pseudoplasmodium)。这东西,指伪原质团,会“走路”,因为单个的史莱姆细胞是可以移动的,就像是鼻涕虫。科学家在以前也认为伪原质团是鼻涕虫一类生物,但实际上不是,而是单一细胞所组成的一个种群(colony)。当伪原质团找不到食物的时候,它就不动了。但是里面的史莱姆细胞是会移动的,它们会向上爬,有一些幸运的史莱姆爬到了顶端,这时候它们就会散播自己的孢子。然而,有的史莱姆散播孢子,有的史莱姆却成了垫脚石,这个现象就被称为breaking symmetry,打破对称。这个概念是讨论涌现性的核心概念。

相比于大脑,史莱姆就不算什么了。因为大脑的复杂度你懂得,但更为神奇的是,大脑产生了意识,意识在某种程度上可以说是超级无敌的涌现性。因为意识不可能存在于部分(意识存在于整体),单个的脑细胞是不可能具有意识的。

classes of emergence

  1. Simple/Complex emergence:a macro level property in an equilibrium system(平衡系统中的宏观层面属性) 比如气体容积,桌子的重量,一块铁片的强度,水的湿度。想一想,单一的水分子是不可能产生湿度这个概念的,湿度是从相对弱的氢键中涌现出来的。
  2. Strong/Weak emergence :a macro level property that exists in complex systems not in equilibrium.(存在于非平衡的复杂系统中的宏观性质) ,比如伪原生质团和火焰。

strong emergence : what occurs at the macro level cannot be deduced from the interactions at the micro level(宏观层面发生的事情不能从微观层面的相互作用中推断出来)

weak emergence : what occurs at the macro level cannot be expected from the interactions at the micro level(在宏观层面发生的事情不能从微观层面的相互作用中期待)

那么,新的属性是如何涌现出来的呢?(举了元胞自动机和萤火虫的例子。)

culture: a shared set of beliefs,behaviors,and routines。这就如同完全合作游戏,首先会有一些不同领域的动作集合(比如太阳可以是从地平线自动升起,或者是被太阳神推向天空;人们见面握手或者是拥抱),然后不同地区的人类开始从动作集合中选择一些动作,同一地区的人类的动作会趋同,最终形成一定的规律和模式,也就形成了不同的文化。

每一个个体都是对局部情况进行反应,但这就可以引起全局的变化,最终涌现。

breaking the symmetry : things that were onece identical now differ

Emergence II: Network structrue and function

在这节课中,我们将讨论网络所扮演的角色。再过去的20年中,网络理论从诞生到主流,每个人都注意到了关于电的网络,互联网。?,在互联网中,每个人又构筑了自己的网络,所以网络现在随处可见。网络是这样的普遍,它在复杂系统中随处可见。在复杂系统中,空间很重要,它定义了物种,个体,思想,是如何联系在一起的,影响了大事件的发生,这是复杂系统的中心主题。这也许看起来非常明显,但大学课本总会无视空间。所以先进的模型,如供应链模型,病毒传播模型或是捕食者与被捕食者的动态平衡网络,都忽略了空间。这些假说的前提都是在针头跳舞(字面为 在针头上能够容纳多少个天使跳舞引申为 纠缠于研究细小奇怪没多大实用意义的事情)。为什么呢?因为好的模型是需要简化的,一些空间模型是过剩的。网络是很难建模的,但最近我们有了两个突破,我们有了一些新型的模型,比如小世界模型,agent-based models:通过竞争来研究复杂网络结构。再过去,人们没有工具去研究事实。但另一个事实是,过去研究问题的时候,锤子到处都是,但是很难见到钉子;可到了复杂系统中,钉子到处都是,但是锤子没有一个。现在他们有锤子了,那就要狠狠地锤了。
好了,过去的模型忽视空间,往往搞的很好。比如我们想计算面包的价格,我们就可以先去估计面包的平均价格而不用在意区域问题。
而在另外一些问题中,空间是很重要的一环,比如病毒传播模型。想象一种空气传播的病毒,一个城市中的人是随机传染另一个的。在一些经典的理论模型中是不存在空间概念的,比如SIR(susceptible , infected , recovered)模型,容易被感染者感染的概率只取决于人口中已被感染的百分比,就酱,人们的所在区域不考虑,朋友关系也不考虑。

所以,复杂系统是需要非常严肃的将空间考虑进去的,不管是地理的空间,关系的空间,还是虚拟的空间。

想一想上节课我们说过的涌现(与其说网络是如何涌现的,不如说网络是如何被组织起来的),想一想联系两个人的规则,或者是链接两个节点的规则。我们将会学习到,这些规则是如何产生网络结构的。网络结构是涌现出来的,因为没有人会去指定一个特定的网络结构。一旦我们知道涌现出了何种结构,我们就知道了这些网络具有何种功能了。

Two Function of Networks

  1. How quickly does information diffuse across the network?(how far the people apart from one another)
  2. (whether network is emerge robust to failuar) Are the networks that emerge robust to failures ;random failure \ strategic(节点的随机失活和选择性失活)

互联网对随机失活是非常鲁棒的。

A network consists of nodes and edges.
nodes = things
edges = relationships between nodes

复杂网络的度量方法:

  1. degree of a node: number of edges that connect to it
  2. average degree of a network : sum the degree of all the nodes and divide by the number of nodes
  3. path length : the minimal number of edges that you have to walk along in order to get from one node to the other
  4. average path length : average of all path length between all the nodes

随机连接网络:了解一下六度理论。

小世界模型:社交网络。

幂律模型:互联网,长尾分布。

这些究竟是弱涌现还是强涌现呢?我们可以了解他们吗?(这几个模型可以百度一下。。。)

preferential attachment model

Agent-Based Modeling : The New Tool

(这节课主要讲的是利用强化学习去探索复杂网络的方法,举了生命游戏,疏散通道,重新计算进化的栗子。教授最后说,这种方法在未来将会成为科学的主流,而且相信这一天很快就会到来。)
本节课将学习一个新的理论:基于智能体的模型,这是许多复杂系统研究的驱动力,它是一种计算机建模的模型,能够帮助我们了解复杂系统。
Rick Riolo:

agent-based models:consists of entities of various types (the so called agents) endowed with limited memory and cognitive ability that are embedded in a network,whose behaviors are interdependent.
最后一个条件非常重要,智能体的行为取决于其他智能体的行为,一个智能体只与它周围的智能体互动而不是随机发生行为,这很关键。
一个关键的假设是,智能体遵循规则。这些规则可以简单且固定或者复杂且变化。简单固定的很好理解,就比如计算机代码。变化的规则可以这样想:一个小女孩想要出去踢足球,而且是想在天气好的时候出去玩,那么她就会遵循这样的规则:我要在温度大于18度小于24摄氏度的时候出去玩。这看起来似乎是一个非常完美的固定规则,但她的朋友们也会使用同样的规则,这样,天气好的时候就会有很多小朋友出来玩,天气差的时候就宅在家里。因此,踢足球的小朋友就会适应规则,也许他们就会在一些天气不好的时候出来玩,这样就可以玩的更多。因此我们可以说,小女孩儿的规则因适应环境而产生了变化。
小女孩儿为了改变她的规则,智能体会采用元规则(meta rule),那么对于小女孩儿的元规则就是:如果我只在晴天踢球,那我的游戏时间就不够了,所以我需要改变只在晴天出去踢球的想法。
因为元规则也是规则,所以,即使小女孩儿改变了规则,我们也可以称她是基于规则的。

threshold-based:the agent’s behavior remains the same until some threshold is met

这种情况就会产生正反馈或者是负反馈。

agent-based model又被称为high fidelity modeling.

此处省略各种智能体模型的举例。但无论是哪一种具体的模型,你都要回答下面三个问题:

  1. who are the actors?
  2. what is their behavior ?
  3. what is the space within which they interact?

Feedbacks : Beehives , QWERTY, the Big Sort

正反馈:more creates more
负反馈:more creates less

path dependence : future outcomes depend on the actions along the way

feedbacks : dependencies between the same action

positive feedbacks : actions that prodece more of the same(think about leaf cut ants)
又举了一个比较有意思的例子,是为了说明threshold-based rule的。比如当你在商场里面购物,你走着走着发现身边的一个人突然冲向紧急出口,这时候你可能觉得他有病;但是如果两个人,三个人,四个人都开始往紧急出口冲的时候,你也许也会朝着紧急出口冲了;也许你的阈值是3~4,另外一些人是12~15,但很少有人的阈值是50,但不管是多少,这就是threshold-based rule。而这些往紧急出口冲的事件就会形成一个正反馈,因为这些事件会不断提升你冲向紧急出口的概率。

Lecture Goals:

  1. show how a combination of positive feedbacks and negative externalities produce path dependence.说明正反馈和负外部性的组合如何产生路径依赖。
  2. show how diversity produces tipping(points) in systems with positive feedbacks.展示多样性如何在正反馈的系统中产生临界点。
  3. show how diversity produces stability in systems with negative feedbacks.演示多样性如何在具有负反馈的系统中产生稳定性。
  4. convince you that interdenpendent actions can be written as a combination of feedbacks and externalities.让你相信相互独立的行为可以写成反馈和外部效应的组合。

对于第一个目标:
教授首先以QWERTY键位的键盘举例,QWERTY键盘安排次序的原则,是减少打字机在打字时连动杆之间的挤压及故障发生率的状况,因而要把常用字母隔开(不过像“E”、“R”就在一起)。其他种类的键盘,如1932年奥古斯特·德沃夏克发明的德沃夏克键盘,为希望在已经不需要避免连动杆的挤压后,重新排列键位以提高打字速度,因此把元音及5个最常用的辅音安排在中间一行,以便交换左右手打字的频率,同时也有设计左手或右手为重的键位。但是因故无法量产,以至于德沃夏克键盘键盘的普及程度不如QWERTY键盘。
不过这不是重点,重点是键盘背后的销售故事。
这种QWERTY键位的排列能够产生四种正反馈:

  1. returns to scale in production
  2. learning
  3. teaching
  4. sharing

这就让QWERTY键位的键盘畅销了,形成了正反馈。这种正反馈对于其他键位的打字机厂商来说是一种负反馈,所以QWERTY就逐渐占据了市场,并排挤出了其他厂商。这就产生了致命的组合:QWER越来越多,其他键位越来越少。但这并不是主要的,初始状态,即第一个购买者并不是主要问题。主要问题是路径上最初的几个步骤(反着理解就是一步错,步步错)。

path-denpendent processes are not predictable(路径指的是从A到B的变化,这是一个过程,过程中包含了许多选择,这就会导致组合爆炸。)

而这种路径依赖的不可预测性又会产生临界点。

tipping : a small event or a few small actions can cause a cascade and large scale change.
就比如紧急出口的例子里,总会有一个人数,让人群产生群体性恐慌,发生大规模逃亡事件,这个人数就是一个tipping,临界点。

这种路径依赖的模型因为存在路径,所以是长尾分布的,而我们之前又了解到,在复杂系统中,尾部很重要而均值不重要(因为均值是由尾部决定的),所以在复杂系统中,我们可以观察到tail wags dog (小人掌权)的现象:极端个体决定了整体走向。比如经济崩溃,暴动,都是由极端个体引发的。

threshold diversity combined with positive feedbacks create tips.

Lessons Learned:

  1. we can get segregation at the macro level even with tolerant individuals.我们以甜党和咸党为例,假设这两种吃货是可以忍受周围的人的口味和自己不同,但是如果不同的人数太多,那么这个人就会离开此地。那么我们就会在宏观上观察到分离而在微观上却是包容的个体。
  2. systems can tip.比如在一个池塘中,鱼、藻、氮气是平衡的,随着氮气不断的增多,一开始倒没什么,鱼类可以通过增加种群数量来减少过多的藻类,但超过了临界点,那么藻类就会大量繁殖而导致鱼类死亡。富营养导致生态系统崩溃。;;蜜蜂可以感受温度,如果温度低了,那么它们就会加热温度;如果温度高了,它们就会降低温度。而当温度太高的时候,就无能为力了。
  3. tipping goes in one direction.以第一点的例子继续说明:系统一旦超过了临界点就不会再回到之前的状态了,具体来说就是:一旦甜党和咸党在宏观层面形成了分离,那么他们就不会再混合到一起了。所以分离的状态比混合的状态更加稳定。

我们听了这么多的正反馈和负反馈,听起来很像系统动力学,而且确实也是。我们以奶牛和草为例:

奶牛和草形成了正负反馈。

系统动力学模型和复杂系统之间的对比:

  1. no heterogeneity within the boxes(box指的是:之前在例子中,奶牛和草都是用box框定的,box代表了实体,意思是实体内不含异质,这表明动态系统中,同一种实体之间是不存在差异的。而在复杂系统中,这个假设明显是错的。)
  2. (in system dynamics model ) “place” is not included(这在之前说过,一些模型是不考虑空间的。但实际上牛总不能只吃一块地上的草吧。)

The Sand Pile : Self-Organized Criticality

在这节课中将讨论复杂系统是如何产生大事件的。关于解释这个现象的理论被称为【自组织临界性】。如果个体行为聚合在一起就会在宏观上形成群体模式。

一个系统被称为是临界的,如果小行为触发了级联效应。比如萨拉热窝事件(斐迪南公爵被杀,导致一战)。
复杂系统有产生大事件的潜力,但这并不代表者复杂系统天天产生大事件。而正好与之相反,有这种潜力的复杂系统却经常产生很多很多小事件。
本课程目标:

  1. distinguish between normal distributions and long tailed distributions.
  2. describe a simple random walk model that produces a power law distribution.
  3. discuss the sand pile model consructed by Per Bak.
  4. introduce a tension between complex systems thinking and optimization thinking.

正态分布在现实生活中很常见,长尾的幂律分布也是。

Event sizes follow a power law if the probability of an event of size x is proportional to x raised to some negative power.如果大小为x的事件的概率与x的负次方成正比,则事件大小遵循幂律。

那么问题来了,我们是否可以搞出来一些模型能产生幂律分布?这似乎非常的逆向工程,而且科学家通常也不会这么做。

我们来做个无聊的游戏,扔硬币。正面你给我一块钱,反面我给你一块钱。那么硬币的序列可能是hhthtt,所以我的收益就是0,1,2,1,2,1,0。这被称为随机游走,因为是随机的。我们可以去数,多少轮投币会让收益回归到0,这个操作被数学家称为return time。那么return time 的分布就是幂律分布。同时我们也观察到,幂律分布有很多很多小事件,但同时也会有偶尔的大事件。但随机游走模型似乎并没有解释复杂系统产生大事件的现象。不过随机游走却能解释冰川分布问题。体会下图

但我们希望能够有更好的模型去解释复杂系统中的大事件。

Per Bak’s sand pile model of self-organized criticality
这个模型也是参见上图。那么在模型中我们能发现什么呢?物理学家Bak,汤超,Wiesenfeld用著名的”沙堆模型”(sandpile model)以形象地说明自组织临界态的形成及特点 。他们曾设想过一个理想实验:通过装置让沙子一次一粒均匀地落在桌上,形成逐渐增高的一小堆,借助慢速录像和计算机模仿等手段精确地计算沙堆顶部落下一粒沙会带动多少沙粒移动; 初始阶段,沙子下落对沙堆整体的影响不大; 当沙堆的高度达到一定程度以后,一颗沙子的落下可能引发整个沙堆的崩塌。 实验结果产生了”自组织临界”理论:沙堆达到”临界”状态后,所有沙都处于一个整体的状态, 新下落的沙子会在周围产生扰动,这些扰动虽微细,却能够在整个沙堆中传递,使得沙堆的结构产生变化, 沙堆的结构将随每粒新沙落下而变得愈加脆弱,最终发生沙堆的崩塌。在到达临界态后,沙崩规模的大小与其出现的频率呈幂函数关系。

然后是举了各种复杂网络中链式反应的例子,比如一战的开战顺序。
事件的链式反应揭示了同一个现象:我们有相对小的事件,可以出发更多的事件,因为复杂网络具有关联性和依赖性。在自组织临界模型中,小事件是可以触发大事件的。这告诉了我们,在自组织临界模型中,一些大事件也许并不是服从正态分布的。而且现在的世界也变得越来越联系紧密,内在依赖也越来越强,发生大事件的概率也就越来越小。

complexity versus uncertainty

(感觉本节课主要是讲如何对抗复杂系统的随机性。我觉得这是一个很重要的事情。)

本节课将关注概念性问题,将区分随机和复杂网络输出。股票是一个复杂系统,包括了股民股价投资策略,都会随着信息的变化而适应性变化。比如第一次美股崩盘,造成了大萧条,这在事先是没有任何人预测到的。那么这是随机发生的时间还是复杂网络的输出呢?

首先,随机性是从哪里来的?

  1. Engineered:这种随机性是人工的,比如投骰子和抛硬币。
  2. Disturbances:一些智能体的随机性是源于其他智能体的随机性所带来的干扰。这就好像,一个男孩儿问大人:先生,是什么支撑着我们站立?大人回答:哦,是大地,我亲爱的孩子。孩子又问,那是什么支撑着大地呢?大人回答:是一只乌龟,巨大的乌龟。孩子继续问:那是什么支撑着乌龟呢?大人回答:别问,问就是另一只乌龟。所以,干扰所产生的随机性也是一样的,这种干扰链如果想溯源是几乎不可能的。而其所产生的结果就是正态分布或者是幂律分布
  3. Fundamental preperty :这个就有点疯狂了,有点类似于量子力学,粒子的值本身是一种分布,而只有当你观测的时候,才会有具体的值。对于复杂系统来说,一些小事件服从分布,而只有当我们观测的时候,才会产生具体的值。
  4. interdependent rule:比如萤火虫,单独的萤火虫有两种状态,亮着和暗着。而萤火虫是否发光取决于它周围的萤火虫。所以,非常简单的规则就能产生大规模的,有规律的萤火虫“光舞”,虽然服从分布但是不可预测。此处的不可预测指的是,随机让一个种群的一个萤火虫发光,无法预测最终形成的特定模式,就像生命游戏那样。再比如投硬币,我们投十次,当我们知道前8次硬币的正反的时候,也不可能帮助我们预测第九次和第十次的正反。因为这是没有规律可循的,整个序列是完全随机的。即使写下全部出现的序列也不能(精准)预测,因为这是一个具有链式结构的过程。

Interdependent rules should be able to prodece randomness

如果一些算法在复杂系统中work了,但是我们也不要高兴的太早,因为复杂系统会很快适应算法work出来的结果;当然,如果一个算法不work,我们也不必沮丧,毕竟说不定什么时候就work了。

Harnessing Complexity

An actor in a complex system controls almost nothing but influences almost everything.

decision theory

下面来解释一下决策论为什么在复杂系统中不起作用。

  1. The model doesn’t take into account the behavior of other interested actors.
  2. The model translates complexity into uncertainty.
  3. The model is all exploitation.(既然结果都已经知道了,就不必探索了,我们只需要做出利益最大化的决定,显然这在复杂系统中是不正确的。)
  4. The model focuses on a sigle outcome,not on system properties like connectedness , interdependence , diversity , and rates of learning and selection.该模型关注的是单个结果,而不是系统属性,如连接度、相互依赖性、多样性以及学习和选择的速度。因此,模型是不会全面考虑这些性质的,系统看起来的样子是取决于你的行为的,因为你希望模型能够输出一些你觉得不错的结果,但实际上这会减少模型里的差异性。

The first step toward effective action in a complex world is recognition.
因此,我们必须弄清楚,什么时候情况是复杂的,什么时候不是。

An effect can be both linear and predictable.
An effect can be nonlinear and predictable.
We can have nonlinear effects that are unpredictable.
我们可以把复杂系统中的变量看作是 choice variables/levers,教授的意思是,这些变量实际上是在我们的控制之中的。想象之前的思维实验,四个旋钮是我们可以随意控制的。首先从多样性开始说起,我们都知道多样性是关键,能够产生诸如鲁棒性的好处,但如果复杂系统的多样性太大,那么处于其中的智能体就需要更多的探索,而智能体又必须平衡探索和利用,所以,我们鼓励多样性,但是不要太大。在一些复杂系统中,选择会筛选多样性,使之减少,但复杂系统中又会有一些力量平衡选择的作用,保持整体的多样性。
那么“不要你觉得,我要我觉得”的下场可以参考IBM。IBM的雇员都很聪明,但是他们因为太聪明了,在当时以为计算机的未来是大型机而忽视了PC,整个公司从上到下都开始迷信大型机,最终GG。这就个故事可以理解为多样性的减少导致系统崩溃。
“When people are free to do as they please , they usually imitate each other.”

多样性也可以防止出错。

Linus’s law : given enough eyeballs,all bugs are shallow.
与之同理的还有免疫系统。一旦免疫系统能够承当病毒,那么系统就会有正反馈,从而产生更多的抗体。只要抗体足够多样,那么就足够覆盖全部病毒。但HIV不一样,它能够适应免疫系统,从而自己进化。即使免疫系统能够识别1.0版本的HIV,但是HIV却能够进化成V2.0。所以,一个好的领导会鼓励多样性。

Keep an eye on the tails.
在社会系统中,即使大部分人感觉幸福,但并不代表社会稳定,因为复杂系统不care均值,处于底层,也就是尾端的人民也许就会暴动。

在复杂系统中,选择充当了筛选器的作用,如果一种基因不适应环境,那么它就会在进化过程中渐渐消失。公司里也有类似的机制,比如升值。但是如果公司觉得应该给表现最好的人升职的时候,就要考虑这个人是不是能够团队合作,如果自私的人得到了提拔,那么渐渐的,公司就会GG。

再比如karl sims,他写了一个模仿进化的仿真程序,让智能体在虚拟空间中移动,评价这个智能体优劣的标准就是测量质心移动的距离。

在这个过程中,他发现了一个非常神奇的现象:这个程序里面进化出了一个非常高的高塔,它通过倒下的方式前进,这似乎非常不可思议。但细究一下,这个模型用的是什么样的选择方式,智能体的表现如何评估,用的是什么lever(杠杆)。仔细一想,之前的高塔生物就很好解释了,因为程序是通过质心移动距离的方式对智能体的表现进行评估,所以高塔只需要倒下就能很快的前进了。
那么这是怎么解决的呢?作者修改了评估方法:通过计算生物体内的全部像素的最小移动距离来评估生物表现的好坏。最后就搞出了下图所示的情况:

This video shows results from a research project involving simulated Darwinian evolutions of virtual block creatures. A population of several hundred creatures is created within a supercomputer, and each creature is tested for their ability to perform a given task, such the ability to swim in a simulated water environment. Those that are most successful survive, and their virtual genes containing coded instructions for their growth, are copied, combined, and mutated to make offspring for a new population. The new creatures are again tested, and some may be improvements on their parents. As this cycle of variation and selection continues, creatures with more and more successful behaviors can emerge. The creatures shown are results from many independent simulations in which they were selected for swimming, walking, jumping, following, and competing for control of a green cube.

be careful how you define goals and incentives.小心你如何定义目标和激励

Orgel’s second law : evolution is smarter than you are.
因为进化过程能够实现很多很多很多组合,而且有足够的时间去试错。

接下来讨论内在依赖:

Don’t become so obsessed with making samll efficiency improvements that you push a system toward a critical state.不要过于执着于做出微小的效率改进,以至于将系统推向临界状态

内在依赖通常是通过联系来评估的。而当我们想增加系统内在的依赖的时候,有一下两个方法:

  1. make a new connection
  2. sever an existing connection

能够产生新协同的关联是应该鼓励的。就比如物理学家研究分形,这东西在生物学中又有了作用。我们可以看到,跨学科所产生的新力量,主要是一个“跨”,这就相当于复杂网络中的关联,即connection。

而当我们想减少依赖的时候(因为这些依赖会降低创造性):

Search for potentially synergistic links and cut off those that limit responsiveness.搜索潜在的协同链接,并切断那些限制响应的链接。

教授又说了很多例子,大概意思就是合理的内在依赖可以提升系统的鲁棒性。

Core Insights:

  1. Be careful how you set incentives.
  2. Encourage diversity.
  3. Keep an eye on the tails.
  4. Don’t get too much caught up in little efficiency gains.
  5. Sever unnecessary connections and encourage synergistic connections.

这个世界是复杂的。也许自顶而下的控制论可以帮助人们建立大桥,但只有自底而上的涌现性才能帮助人们生存。

as soon as there is life,there is dangerous.so,keep learning,keep adaptive.that’s all ,thank you.