深麦咨询
内容阅读

模型思维:简化的力量

1
发表时间:2024-07-26 15:39作者:马学海

面对复杂的大环境,模型思维有助于我们做好决策。模型和算法密切相关,模型是框架和结果,算法是步骤和规则。

关于模型思维的书,我看过两本。最近刚翻完的这本是龚才春的《模型思维:简化世界的人工智能模型》。我看得很快,跳过了大部分的技术细节,主要吸收的营养是书中对模型的定义和分类。

图片

什么是模型?书中给出的定义是:模型是客观事物的简化表示

“表”,意味着模型不是客观事物本身,而是用数学公式和图表展现的形式化结构,以帮助我们理解世界。简化”,意味着模型总是有所为有所不为,一目了然,形式优雅。这两点都是模型的精髓所在。

书中按照要处理的问题,把人工智能技术常见模型分为六大类:权重模型、状态模型、序列模型、表示模型、相似模型、分类模型(见下表)

模型类别

基本解释
书中介绍的模型
权重模型
权重问题就是计算特定状态下事物的重要性,是一个静态过程。我们只关心事物当前的重要性,而不关心事物过去或未来的重要性。权重问题或许是现实世界中最复杂的问题,但是把权重问题抽象后的权重模型是目前已知的最简单的模型。
- TF-IDF模型
- 线性回归模型
- PageRank模型
状态模型

状态问题就是刻画权重动态变化的过程。状态问题需要解决的是在当前状态下遇到某个特定的事件(如输入某个字符),系统的下一个状态是什么。

- 词法分析模型
- 字符串匹配模型
序列模型

状态在动态变化时,有些状态是可见的,有些状态是不可见的;同时,状态的转换很多时候并不是确定的,即在当前状态下遇到某个特定的事件(如输入某个字符)时,下一个状态很可能是不确定的,而是按照某种概率分布来转移的。序列问题是对状态问题在状态可见性和转移非确定性两个方面的延展。

- 隐马尔可夫模型

- 最大熵模型
表示模型

用于研究如何表示万事万物

-向量空间模型

-潜在语义分析(LSA)模型
相似模型

研究事物之间相似度或距离的计算过程

- 欧几里得距离

- 曼哈顿距离
- 切比雪夫距离
- 闵可夫斯基距离
- 马哈拉诺比斯距离
- 皮尔逊相关系数
- 杰卡德相似系数
- 余弦相似度
- 汉明距离
- KL散度
- 海林格距离
- 编辑距离
分类模型

根据相似性度量方法将若干事物分成若干类,使得类间事物相似度很小而类内事物相似度很大的过程。

- 感知机模型

- 逻辑回归模型
- 决策树模型
- 朴素贝叶斯模型
- 支持向量机模型


这6类模型之间的关系如下图所示:

图片

关于这本书就说这些。

我想重点推荐的是数年前看过的另一本书,美国密歇根大学教授斯科特·佩奇(Scott Page)教授的《模型思维》The Model Thinker: What You Need to Know to Make Data Work for You)。与上本书主要聚焦在人工智能技术领域不同,这本书展示的是模型的全景,通过24个模型的详尽介绍,阐述了如何利用多模型思维处理学习、工作、生活各个方面的各类问题。

图片

书中将模型的用途总结为7个方面(REDCAPE):

推理(Reason):识别条件并推断逻辑含义。
解释(Explain):为经验现象提供(可检验的)解释。
设计(Design):选择制度、政策和规则的特征。
沟通(Communicate):将知识与理解联系起来。
行动(Act):指导政策选择和战略行动。
预测(Predict):对未来和未知现象进行数值和分类预测。
探索(Explore):分析探索可能性和假说。

该书的配套课程在Coursera上搜“Model Thinking”就能找到。课程自上线以来受众已过百万,今年我也准备跟学一遍。

如今大家的注意力都被大语言模型吸引,但我觉得那些传统和经典的理论依然是最可靠的基础。无论技术如何演化,不管前沿多么炫目,人类智慧长期积累的、被一再证实了的成果,才是我们从根本上认识客观事物、理解现实社会运行逻辑的最可靠的钥匙。

一边跟学,一边重温此书,理解会更加深入,收获也会更多。后续我会不定期和朋友们分享学习心得。

图片


分享到: