活动一:数据收集——测试你的打字速度

在金山打字通中分别测试一下英文、中文的打字速度和正确率

在以下在线表格中登记

打字速度统计 - Synology Office 电子表格

本课基本概念

概念

释义

数据

数据是一组有意义的符号

数据无处不在,只是它们没有实体。

过去,人们习惯把数字的组合称为数据。但在今天,这样的理解显然不够全面。那么是否可以把数字、字符、字母的集合称为数据?也不准确。

在今天“大数据”的语境中,数据是可以被记录和识别的一组有意义的符号,一般可通过原始的观察或度量得到。数据是对客观事物的逻辑归纳,可以用来表示一个事实、一种状态、一个实体的特征,或一个观察的结果,有些是用于描述某个对象的事实性数据,有些则是通过观察、分析、归纳得到的总结性数据。

数据可以是连续的,比如无线电通信时在空气中传输的电磁波,它们是模拟数据;数据也可以是离散的,比如在计算机中存储的文档和照片,它们是数字数据。

承载数据的形式有很多,不仅包括文字、数字、符号、图像、语音、视频,也可以是对某个事物的属性、数量、位置、关系的抽象表示。大气的温湿度、汽车的行驶路线、学生的档案记录、商务的合同,这些都是数据。

我们平时用电子设备看新闻、拍照片、买东西、打游戏,本质上都是在和数据打交道。在计算机中,它们是一连串包含有0和1的二进制数的组合。

信息

信息是用来消除不确定性的

现在我们来明确一下什么是数据,什么是信息。当人们在研究甲骨文时,上面记录的符号仅仅是一些数据。要读懂这些数据,就必须了解数据背后要表达的含义。一旦对数据做出解释,我们就能得到甲骨文上的信息。

数据与信息既有联系,又有区别。数据是信息的载体,信息则需要依托数据来表达。它们是形与质的关系,两者密不可分。

信息由数据加工得来,它可以由数字和文字表达,也可以表现为其他具有意义的符号,其承载形式不重要,重要的是信息能让我们了解一些事情、鉴别一些真伪、佐证一些观点。也就是说,尽管数据存在的形式多种多样,但我们真正想要获得的是信息。

“信息”作为科学术语最早出现在哈特莱1928年撰写的论文《信息传输》中,在该论文中他首次提出了将信息定量化处理的设想。1948年,信息论创始人、美国数学家香农发表了一篇有着深远影响的论文—《关于通信的数学原理》,他明确指出了“信息是用来消除随机不确定性的东西”。

在香农看来,一旦我们想要对信息进行量化和比较,我们就不要去关注这些信息到底承载了什么内容,而是要看这条信息出现后,是否改变了某些不确定性事件的概率。今天这一定义已经被看作是对“信息”的经典定义,在各种场合不断被人引用。

无论是数字、字符或它们的组合,如果我们无法解读,就不能称其为信息。有一个重要的判断标准是,看它是否承载了有用的内容。无论是石头上刻的画、纸上写的字、墙上的涂鸦还是电脑中的文件,只要它们能表达确切的含义,就能认为是信息。

一串11位数字的号码,如果它是随机数字,则谈不上是信息。如果我告诉你,这串数字是我的手机号,它就消除了不确定性,它便是一种信息。信息是把人们不清楚的给说清楚的那些内容,如果已经知道了,就不能算作新的信息。

举例来说,今天任何一个小学生都知道地球是圆的,地球自转产生了白天和黑夜。这在今天看来是一个基本常识,但我们的祖先并不知道。如果我们把发明文字作为人类文明的起点,那么大约经过5000多年,也就是直到15世纪,人们才开始接受地球是一个大圆球的观点。

虽然“地球”对于今天的小学生来说不算是新的信息,但是对于古人来说,它不仅是信息,而且信息量巨大。

你或许已经发现了,信息会因场景而定,因每个人的主观认识而定。同一条信息,对一些人是有用的,对另一些人或许就没用了。

知识

知识是对信息的总结和提炼

随意给出3个数字:68、21、192。这3个数字仅仅是数据。现在给它们加上一些说明,比如:衣服的价格是68元,今天的气温是21摄氏度,小明爸爸的体重是192斤。这些数据有了明确表达的含义,它们就是信息。

不仅如此,我们还能基于这些信息给出一些判断:衣服不是很贵,天气有点凉爽,男人该去减肥了。做出这些判断,需要依赖我们平时生活中积累的经验和常识,即知识。

知识是对信息的提炼和概括,它是高度概括的信息。如果说信息可以解答一些简单的问题,比如“谁”“在哪里”“做什么”,那么知识可以回答一些更具深刻认知的问题,比如“怎样”“为何”。

日常生活中最基本的知识是常识。比如明火不能碰、热油不能遇水、人有生老病死、月有阴晴圆缺,它们大部分来自生活,是大家认为都该懂得、不言自明的知识。今天很多约定俗成的常识,是由我们的祖辈口口相传、代代相承而来。人并不是天生就有常识,知道火为何物、火可伤人、火可熟食。很多道理都是从生活实践中总结而来的。

现如今,对于人工智能来说,要解决的核心问题是让计算机具有常识。很多常识背后有着复杂的知识体系,机器必须真正“理解”知识,而不是“记忆”它们。

举例来说,计算机或许能通过数据样本学习,知道人类有头、手、脚等身体部位,但它很难理解既然这些部位都长在人体上,为何只有头上有眼睛,手和脚上却没有?又比如,计算机学会并知道了“人有2只眼睛”,但它无法判断这个世界上是否存在“有1只眼睛的人”和“有3只眼睛的人”。

如今的人工智能只能从数据中学习到数据之间的联系,它还不能很好地处理有关常识的问题,这方面人们还有很长的研究之路要走。

数据、信息、知识三者密不可分。

  • 数据是一组有意义的符号,它是信息的载体,是知识的来源;

  • 信息赋予了数据含义,信息消除了不确定性;

  • 知识从实践、经验中得到,它由数据记录,从信息中提炼。

活动二:制作问卷

问卷目标:调查同学们打字速度慢的原因

思考:哪些因素可以用于分析

问卷系统使用方法

1.问卷系统地址:wj.cqljxdfz.com

2.注册

建议使用自己的姓名注册,以便找回密码

请牢记登录账号和密码!

该系统和其他系统账号不通用

牢记登陆账号和密码

3.创建问卷

4.编辑问卷

5.发布问卷、保存链接为文件

提示:可以从电子设备的使用类型、使用时长、使用目的等方面设置问题以分析

拓展知识:DIKW模型

DIKW模型,是一种经济术语。是一个可以很好的帮助我们理解数据(Data)、信息(Information)、知识(Knowledge)和智慧(Wisdom)之间的关系的模型。