毫无疑问,互联网已经深深嵌入了我们的生活。对于我们所处的时代,有很多的标签,比如数字时代、信息时代、知识时代,等等。大数据、云计算、人工智能、知识经济与知识管理之类的新词层出不穷。
那么,我们如何去理解一些非常基本的概念呢?本文就先从数据、信息与知识这三个概念开始,尝试做一些解读。
如果给你两个数字,0.717%与0.720%,你会想到什么?
实际上,不附加任何东西,凭空出现的这两个数字对你而言毫无意义。但是,如果我告诉你,这两个数字分别代表铀的同位素铀-235的丰度,0.717%是其在某处矿石中的丰度,而0.720%是铀-235天然的丰度,你会想到什么?
思考这个问题的同时,我们来听一个故事吧。
1972年,在法国的一个核燃料处理厂,一位员工发现了一件可疑的事情。他对铀矿的矿石进行常规分析,也就是分析其中铀的三种天然同位素的丰度,即铀-238、铀-234与铀-235,其中铀-235是维持链式核反应的关键核素。
他发现,一些从非洲加蓬奥克洛(Oklo)过来的样品有稍微的异常,其中铀-235的丰度为0.717%,这比天然的丰度0.720%要少上千分之四。
这么小的偏差通常容易被忽略掉。但对科学家而言,这个偏差十分可疑。进一步的分析表明,这批矿石比常规的矿石大概丢失了200千克的铀-235,这足够制造半打左右的原子弹了!
这让法国原子能委员会的专家们困惑了好几周。然后,他们想起了在此19年前发表的一篇预测:某些铀矿矿床有可能形成天然的核反应堆。
奥克洛的发现即证实了这一预测!人类发现了一座已经有18亿年历史的天然核反应堆——奥克洛反应堆。
现在再回顾一下前面的问题:有两个铀-235丰度的数值,0.717%与0.720%,你会想到什么?
显然,这两个数字现在对我们有了新的含义,它代表着奥克洛反应堆的发现,它已经不再是凭空冒出来的两个数字了。
我们再详细分析一下上述奥克洛反应堆的发现:
0.717%与0.720%,这两个是数据。
奥克洛铀矿中铀-235的丰度为0.717%,天然铀-235的丰度为0.720%,这两条是信息。
某些条件下,铀矿矿床会形成天然的核反应堆,这种天然反应堆燃烧后会导致铀-235丰度降低,奥克洛铀矿中铀-235丰度比天然丰度要低,通过这一结果,我们发现了在奥克洛存在一个天然的反应堆。这是上述的信息所告诉我们的知识。
通过这个例子,我们很容易发现:单纯的数字几乎毫无意义,将数字与具体的东西结合起来才能代表特定的含义,而如何去解读这些含义,则需要的是知识。
在信息处理中,数据、信息与知识是有明确区别的:
数据,只是单纯的数字。比如,0.717%与0.720%。
信息,是包含特定含义的数据,通常要包含有若干个W,即是谁(Who)、是什么(What)、 何时(When)、何地(Where)、何种方式(How)等。没有特定含义的数据是无用的。
知识,是对信息的解释。
实际上,对任何一条信息的解释,其背后都有一套知识体系在支持。
以奥克洛反应堆为例,要解释0.717%与0.720%这中间千分之四的差异,则需要有核裂变、丰度、质能转换、反应堆的条件、统计学等方面的知识。还要知道这两个数字是铀-235的两种不同丰度,如果缺少这套知识体系,这条信息也毫无意义。
信息是包含有特定含义的数据,而知识则是对信息的解释,它往往是整套知识体系的一角。不管是叫数据时代、信息时代还是知识时代,对数据、信息与知识这三个基本概念,我们都要能区分开来。