问题解决的建模（二）：模型、框架与数据

2022-11-13 09:35:00来源：36氪

编者按：咨询是为别人出谋划策的工作，咨询就是为别人解决问题。一般来说，咨询都会有自己的方法论、流程与模型。但是这些方法论、流程和模型是否真的能够解决问题？如何才能知道它们解决了问题？或者它们解决的是不是对的问题？如果没有建立起一套科学的框架的话，很容易就会陷入思维定势，导致解决方案平庸。本文介绍了一个对问题解决进行建模的框架，希望能为你提供参考。文章来自编译，是系列文章的第二部分。

(相关资料图)

建模的艺术

在本文的上半部分中，我们跟随着专业问题解决者 Priscilla，围绕着问题解决解释循环进行了一番迭代的冒险。她从一个框架（角色）开始，然后用数据去“填充”，再将画面拉远，评估这个框架的解释或预测能力，然后决定拒绝这个框架，并转向一个新的框架（比方说观念模式）。

对问题解决地图及第一部分讨论的解释循环的回顾

全世界数以百万计的问题解决者每天都在遵循着类似的过程。只不过，大多数都只是下意识地遵循这个模型。

为了让问题解决成为一种严谨的、可以传授的技能，有必要弄清楚我们在解决问题时实际会发生什么，以及最佳实践是什么。

在上一篇文章中，我们一直在比较宽松地使用了模型、建模、心智模式与框架等术语，但有必要从模型开始澄清一下这些术语的具体含义。

模型在问题解决地图（PSM）当中处于中心位置，因为模型是在这种循环里面创建出来的知识的表达（正如我们所说那样，模型是主观的、是会不断演变的）。说得更宽泛一点，模型为知识创建提供了一个有趣的范式。模型有很多种定义，我的工作定义是：

该定义的含义如下：

选定（不是所有）的现实元素用彼此之间存在某种关系的变量来表示。

这种选择是目标驱动的。任何模型都具有目标驱动性，这一点与我们之前提出解释循环具有主观性是相关联的，可以很容易地以地图的例子来说明，这个模型是最优秀的。正如我们在下图中所看到那样，同一个地方根据目标的不同，可以用完全不同的方式来建模。

纽约市的模型：不同的目标造就了不同的模型

模型可以表述某个东西的本来面目或者可能的样子，模型既可以存在于想象中的世界，也可以存在于未来的某个时刻，并且一旦对模型做出解释，模型就可以告诉我们如何从当前状态到达目标状态。

模型最重要的一点也许可以用George Boxe的名言概括：“所有模型都是错的，但有些模型比较有用”。地图之所以有用，是因为它不是领土。或者，用博尔赫斯（Borges）短篇小说《论科学的精确》（On Exactitude in Science）里面的话来说：

根据定义，模型是不完美的，因为完美的模型会是一个副本。

那么模型是什么样的呢？好吧，模型有各种形式：

模型示例，从上到下，从左到右：1. 对领土建模的地图。2. 对建筑物建模的建筑模型。3. 对捕食者和猎物种群建模的洛特卡－沃尔泰拉方程（Lotka-Volterra equations），又称掠食者—猎物方程。4.对十二世纪的佛罗伦萨进行建模的但丁的《神曲》。 5. 对发生频率进行建模的统计分布。6. 对“公地悲剧”情况进行建模的系统图。7.对公司绩效进行建模的企业损益表。8.我们对系列政治问题的多面性与细微差别进行建模的左派与右派立场。9. 对人生进行建模的游戏《模拟人生》。10.对理想有机体进行建模的果蝇。11.个体的轻微歧视会导致群体极端歧视这一过程进行建模的谢林隔离模型。

正如我们在上图所看到那样，从地图到公式，从图纸到物理模型，从文学寓言到现实生活的有机体，从数字模拟到画质餐巾纸背面的草图，模型可以有多种形态。从某种意义上说，任何事物都可以成为任何事物的模型：生态系统的捕食者和猎物之间的关系可以用两个一组的方程式来建模，或者在更明确的层面上，可以通过十个一组的方程式来建模；但也可以通过图形模拟、隐喻、绘图或戏剧来建模。

另一方面，有些模型可以看作是指代现实当中的多个对象：比方说，《创世记》的第一章既可以看作是世界与人类早期诞生的模型，也可以看作是一套道德原则，用来说明如果你不遵守神圣的诫命会发生什么。或者当然，如果换一种分析层面，也许它根本就不能看作是模型；而只能看作是古代近东神话这个更大框架内的一个数据点。

所以“什么是什么的模型”这个问题的答案完全取决于建模者的意图、解释者的理解以及解释的分析层次。与此同时，有些模型当然可以比其他模型要好：比方说，作为测试空气动力学的模型，麻省理工学院的风洞大概要比一个人对着纸飞机吹气更好。但是，正如我们所看到那样，这完全取决于我们为自己设定的目标：比方说，如果我们的目标是向 5 岁的孩子解释飞机的工作原理的话，对着纸飞机吹气这个模型就更好。

作为知识的模型

就认识论而言，模型是一个很有趣的对象。一方面，我们普遍要依赖模型来产生科学与其他类的知识，不仅是通过操纵模型来产生，而且在我们创造模型的同时也产生了知识。可以说模型产生知识，模型本身就是知识。事实上，很多科学知识都是通过观察和操纵模型而获得，而不是直接从现实获得的。（注2）

另一方面，正如我们所说，模型并不是真实的，根据定义，模型是现实的简化（参见 Boxe 的话）。作为解释学解释循环不断演进的产物，模型代表了一种知识形式，这种知识形式整合了整体与部分、理论与观察，并且被我们（个人或群体）以前的知识和议程所过滤。因此，一方面，比方说即便是像物理学标准模型这样非常“可靠”的科学模型，在某种意义上也是理论和框架之间逻辑论证的结果，另一方面，发现和结果也是经过科学界的意图（对粒子和力进行分类的愿望）、科学范式（相对论、量子物理学等）与实践（公开讨论、同行评审等）的过滤。

对于科学来说，模型非常有用，因为它们解决了纯波普尔派证伪主义的错误脆弱性（error-fragility）问题。换句话说，就算我只有一个与理论相矛盾的经验实例，该理论也必须被否决，但模型就不是这样：模型只能被更好的模型——也就是一个对试图描述的问题的各个方面都更适合的模型——所代替。（注3）

模型的分类

政治学家托马斯·谢林（Thomas Schelling）是最早将建模看作是一种方法的人之一，他将模型分成了两种类型：

——托马斯·谢林（Thomas Schelling），1978

也有其他学者不同的方式对模型进行分类。为了帮助解决问题，我是这么对模型进行分类的：

对于模型的这种分类方法，我要特别感谢一下迈克尔·韦斯伯格（Michael Weisberg），他的《模拟和相似性》（Simulation and Similarity）体现了对作为方法的建模十分深入且严格的研究

简而言之，模型既可以代表静态系统，也可以代表动态系统。通过询问时间是否变量，我们可以轻松地将任何模型放进其中的一类（编者注：时间是变量则归为变化类模型，否则归为状态类模型）。在每一类里，我们还可以根据模型主要帮助我们做了什么，或者换句话说，模型的哪一部分承担了解释的重活，来对模型进行二次分类（变量主要承担解释工作则为结构类模型，关系主要承担模型的解释工作则为关系类模型）：

结构模型帮助我们了解问题的变量是什么。它们通常看起来像分类法或类型学：不妨想想 3C（公司本身、公司客户、竞争对手）、波特五力模型等。

关系模型更进了一步。给定一组变量后，关系模型可以告诉我们它们之间的关系。这些模型通常看起来像方程，等式左边往往是两个或多个变量，右边则是一个常数或者另一个变量等；但也有更多是定性的版本。一个很好的例子是那个经典的微观经济模型——价格作为供求关系的函数。

动力学是对变化建模的方法。在时间是变量之一的几乎所有模型当中，我们都要研究动力学。这一类模型包括了从业务预测到蒙特卡罗模拟，一直到粒子、流体或系统动力学的一切。

最后，计算也是模型，只不过在这种模型里，重要的不是变量本身、变量的关系或演化，而是最终结果或计算。这些模型通常是算法，一个很好的例子是前面提到的谢林隔离模型。

用这种分类法可以得出一组（非详尽的）模型原型：

心智模型原型

问题解决的模型

为什么这一切很有趣或有用呢？

模型是解释学循环的关键输出：通过将框架融入背景并整合数据进来，我们就为要分析的东西建立了一个模型。

在问题解决地图（PSM）上，模型是现实世界元素的表示

模型对于解决问题也很重要，因为它们可以让我们缩小了可能性的空间。我想要收集分析的数据浩如烟海，模型让我得到了一些可以理解问题的元素。

模型也是解决问题的下一步，也就是解决方案原型的跳板。虽然有些解决问题的项目可能就是以输出模型本身结束，但在大多数情况下，都需要对现实世界进行一些干预。一旦模型将框架与数据很好地整合到一起，我们往往会希望按照模型的规定做一个现实版，或者在某些情况下，将模型本身部署到现实世界之中。

最重要的是，模型让我们可以灵活地使用框架和变量。模型本来就是错的，会被废弃和替换。在大多数情况下，可以说无穷的模型也许有助于理解某个问题或数据集。问题解决者的核心技能就是建立合适模型的能力。

模型与投影有点像，因为投影合成了对象的相关维度及其主要组件，再投影到低维空间之中。但是，模型要比投影灵活，因为它可以忽略被认为不相关的部分数据。

模型 = 框架 + 数据 + 推理

正如我们所看到的那样，在建立模型的时候我们结合了两个关键输入：在顶部（也就是先验世界），框架把形式赋予模型；在底部（也就是经验世界），数据则将实质赋予模型。我们有意识的行动，则以推理的形式，让问题解决者将两者结合起来，挑选变量，选择框架并进行微调，再做出逻辑推理。

现在，我们要多花一点篇幅谈谈推理和数据的作用，对框架的全面讨论将是下一篇文章的主题。

推理与思维模式

有时候，专业问题解决者 Priscilla 和她的团队会遇到一些问题。比方说，对于某家美国连锁药店的目标市场，研究团队可能已经为一家美国连锁药店发现了两个可能且相悖的细分市场。其中一个也许要依赖于消费能力，而另一个可能要依赖于购物行为。在这样的情况下，Priscilla 告诉她的团队：“大家先停一停。我们应该往哪个方向思考？该往上走还是往下走？”

所谓往上走的意思是：如果将数据集视为给定，并相应地改变高层的框架会发生什么？比方说，能不能经过一番操作把购物行为和消费能力融合到一起？这么做的话，我们会丢掉了细分市场的规模，因为这两个细分市场不再是MECE（Mutually Exclusive Collectively Exhaustive，中文意思是“相互独立，完全穷尽”）；另一方面，它可以让我们将更丰富的角色组合到一起。如此一来，团队的想法就从特殊走到了一般，归纳出一个最顶层的类别，可以适应各种经验实例。（注4）

所谓向下走的意思是：不妨将问题陈述和框架视为给定，然后找出更好的方法来进行分解。对于我们要观察、解释或预测的东西来说，那两个数据集是更好的指标吗？我们是不是应该再找一个数据集吗？如此一来，团队的思维方式就变成了演绎，从一般走向特殊。

左：自顶向下思维（演绎/分解），中：自底向上思维（归纳/归并），右：横向思维（比较/类比）

当然，在建立并操纵模型时，我们所做的就不仅仅只是归纳或演绎思考了。 “横向思维”可以看作是一种独立的思维模式：我们不是直接对现有的分类进行分解，或者对现有的实例进行分类，而是通过实例具备的共同特征，将一个现有的分类与不相关的分类进行类比（或者反过来，对实例的不同集合进行类比）。而归纳和演绎推理本身牵涉到颗粒度更细的“思维模式”：对相同与不同的理解、对共现、时间顺序、因果关系的识别等。

自上而下与自下而上的思维模式之所以有趣，与其说是精确体现了我们的思维方式，或者对思维逻辑做出了详尽解释，不如说是当我们的项目陷入困境时，这两种思维模式是自我定位的有用手段。

数据与变量

在讨论了建模的第一个元素推理之后，现在我们再转到第二个元素，数据。作为熟悉不同方法或研究分析的专业人士，Priscilla 对处理各种数据已经驾轻就熟了：

定性数据：包括访谈记录、市场报告等内容，也包括任何感官输入、我们看到、听到、触摸到的任何东西等。

定量数据：包括数字分析、市场规模以及库存单位（SKU）数据库等。

数据可以有不同的形式：数据可以是离散的或连续的、结构化的或非结构化的、名义上的、有序的等等。这里就没有必要深入讨论每种类型了。

从建模的角度来看，所有数据都扮演着相同的角色，也就是作为解释循环的底部，必须整合到整体的那部分，是“形式”是框架的模型的“实质”部分，其实框架与数据讲的是同一个东西。就与数据的关系而言，我们只想指出两点：

数据是我们观察世界而获得的：数据不是世界本身。关于“事物本身”的可观察性仍有争论，但我们暂且不谈，关键是在大多数情况下，数据都不是中立的：我们要决定收集哪些数据，如何对数据进行切片，这些行为总能反应我们的议程、偏见以及高级框架。带种族歧视的人工智能，仅使用男性作为测试样本开发的汽车，这些例子现在已经广为人知。数据收集和操纵还存在其他一些常见的偏差，比如确认偏差、幸存者偏差、离群偏差等等。

数据以变量为中介：数据是独立实例的集合，而变量则是可归因到每一个实例的一系列（对待解决问题很重要的）特征。为了方便解释这两个概念，我们可以用 Excel 工作表来举例，从第2行开始的所有行都属于数据集；而第1行则表示变量。因此，变量是模型与数据之间的连接点。变量既可以自上而下，也就是从模型（还记得变量在对不同类型的模型进行分类当中所起到的作用吗？比如结构模型、关系模型等）出发靠近；也可以自下而上，也就是从给定的数据集出发靠近。这就是数据科学里面所谓的特征工程：把数据集视为给定，然后通过各种处理把数据推入对模型有用的变量里面。有时候可能要对变量进行合并，把重复或不相关的变量排除掉，或者在现有变量基础上添加新的变量，将一组变量“投影”到较低维的空间（又叫做主成分分析）等。

想法在项目空间的流动

我们在这篇文章中经常使用空间这个隐喻，并且讨论了自上而下、自下而上、垂直与横向思维等。我喜欢把想法看作是有体积、维度、方向与动量的，这种看法既具有象征性也很有用。想法移动的轴是我们在上一篇文章介绍过的那个轴：从整体到部分，从抽象到具体，从内部到外部，从先验到后验。我们就是通过这种持续不断的循环运动来获取知识和解决问题的。

从框架到数据，再从数据到框架

我们已经看到这些运动是如何在问题解决地图上表示的。当然，还有一种更加开放、更加“可行动”的方式将这些想法流可视化，那就是问题解决画布（Problem Solving Canvas）。这是一个旨在帮助我们在项目中定位自我，帮助我们以有序的方式跟踪框架与数据之间的迭代循环的框架。

问题解决地图

这张画布的细节我们到后面再讨论。现在，大概介绍一下这个框架就足够了：

在 y 轴上，我们会把用来绘制问题解决地图的整体/部分轴与经验/抽象轴叠合在一起

x 轴可以代表时间，因为我们是从左到右展示框架-数据-框架循环的连续迭代

右下角的块、模型、变量和数据、关系均已在前面描述过了。

在下一篇文章中，我们会专门讲框架和问题陈述。

概括一下，在本文中，我们研究了作为非经验主义者核心输出的模型，问题解决的迭代解释循环。我们归纳了模型的特征并对其进行分类，并深入探讨了其中的两个主要成分：推理与数据。在下一篇文章中，我们将聚焦在建模的第三个关键成分，也就是框架/心智模式上，并探索问题陈述，以及如何最确切地表述好问题。

注：

1、以下是来自文献的额外定义：

模型是用数学和图解表示的形式结构，可帮助我们理解世界。——《模型思考者》（The Model Thinker），Scott E. Page