工控网首页
>

新闻中心

>

业界动态

>

大数据之结构化数据是怎么一回事

大数据之结构化数据是怎么一回事

2020/1/11 12:34:53

数值计算是人类在科技能力低下时代的选择,结构化数据是大的进步,其实并没有多么超越过去。它要从我出发,为世界设计一个框架,厘清对象的关系,以获得问题的求解。无论世界多么复杂,它都要抽取某些特征来研究,只关注最关键的点位;不管世界的变迁,它要维持一个稳定的体系。


正如医学上,不管个性化的生命,抽取一些显著特征,展开标准化的研究;不管丰富的内外影响,用有限的关系去应对;不管生命如何变化,不管医学需求如何改变,它都要维持一个静态的模型。人类要进步,医学要发展,就应当脱离过去的温柔约束,打破结构化数据的框架,进化到大数据模式。它有开放的基因,基于互联网运作,一切力量都可加入进来,所有需要计算的都可以纳入,任何需求都可以满足。


以前的结构化数据库采用了集中的方法,以高效地提供运算需要的数据,比如把亿万人的身高存到数据库中,以快速计算平均值。现在我们进步了很多,不使用这种数据存储也是可以的,可存储为文件系统中的一个个节点,寄存于世界的每个传感器中,放置到每个人的手机中,根据需要和权限,检索了集中到一起进行运算。


大数据之结构化数据是怎么一回事


最初,我们接触的是分隔的,离散的,有限的数据,要测量土地的面积,运作帝国的税收体系,我们发展了数值计算的方法,依靠筹码、算盘、纸笔等完成任务。第二个阶段随着现代化而不断开启,世界变得复杂,结构化的数据应用得以产生,并不断发展壮大。所谓结构化数据,是定义某个研究目标的特性,形成列,然后采集不同的个体,形成行,行和列就形成了矩阵的结构,可以有效地展开各种工作。迄今为止,我们还享受着这一先进信息化体系带来的好处,全球联网的股票交易系统、现代化的大生产体系,都得益于这强劲而有效的数据处理系统。第三个阶段正在开启,我们正在拥有海量的、多类别的数据,要求我们改进认识,发展新的数据分析体系。


只要我们根据某种规则,能从某个端口获得数据,并且能满足一定的响应速度就可以,不管这个数据是如何来的,不管它是传统数据库的记录,还是传感器的测量值,还是X光片的识别结果。数据存放在世界各处,根据需求取用,这是互联时代唯一可行的方案,以往的方案中,数据要运转到某个集中的地方,规范化地组织,显然无法应对海量的数据。


一切可能影响生命和疾病的因素都可参与进来,只要它能获得人们的认可,只要我们发展了相应的测量方法。世上一切可以计算的单元都可参与进来(比如调用每个空闲的运算单元),只要它能正确地根据动态逻辑输出运算结果。世界上一切能思考的存在都可参与进来(包括人工智能),鼓励民众根据他们的理解组织数据运算,集结民众智慧来探索真知。这是对科学的扩展,理解世界的主角就从科学时代的少数人扩展到全体民众。


这是要打造平台,以引入所有的智慧因素,鲜明区别于以往身先士卒的科学思路。这是当下的生产力水平下,人类可能做到的最好。结构化数据要求权威的团队定义一切,不允许其他人修改调整;大数据体系不一样,允许每个人添加新的项目,定义各项目之间的关系,定义哪些项目需要整合了体现新特性。我们可提供图形化的界面,便于每个人理解和操纵各种数据项目。只要这种改进得到别人的认可,就可流传开去。


结构化数据体系在强化中心,存在一个数据中心,所有数据都汇总到中心,并从中心发出,哪怕数据可以映射到各地,也是要维护中心的威严,不许可人们自由行事。现在,这种中心消解了,数据之间的交互是人们自由发起的,涉及的数据范围由人们自由定义,触发条件也是个性化的。


结构化数据要求专业人员的思考,体现了科学的价值观和方法论,大数据方法要体现每个人的思维,它要复制人理解世界的模式,通过对世界的真实模拟来帮助思考,比如,列出最近一段时间的舌苔变化,同步显示所有影响舌苔的因素,以启发人的洞察力。


计算是人的本能,一切工具都是这个本能的扩展,筹码和算盘就是明显例子,古时候能力有限,只能应对关键需求,比如人口、田亩、兵力。计算机是大的进步,它极大地扩展了数据量和运算速度,完全超越人类,但它被征用来运算结构化数据,这是统治时代的思维,凸显少数人的重要性,只能应对少数重要特征,如此做出关于人类命运的决定。


回过头去理解当下的关于大数据的定义,就能明白,它们几乎都是思维古板的科学时代的人们从自身角度出发的见解,比如能容纳海量数据,高并发低延时。这是发自技术思维的,一些庸俗化的认识,试图把世界框进过去的模式,根本没有触及互联的精髓,不理解人类的未来,也就低效于人类迫切需要解决的问题。


在生机勃勃的互联时代,大数据会快速进化。它很可能是正确的方向,它是我们所能达到的最新认识,重大进展还没有取得,那是因为我们的认识还不够深入。当数据获得方法、存储方式、处理思路、和如何解读结论等多个环节都有长足进展后,大数据将发挥其真正价值,推进人类发展。


随着大数据的发展,科技就从以自我为中心转向以对象为中心。这种体系用于医学,能真正以生命为中心,看到生命的流淌,感知到每一次内外刺激,体会生老病死,真正走入人的世界,感知喜怒哀乐,协同每个人展开。从数值化的计算,到传统的统计分析,到大数据;从孤立的数据,到结构化数据,到非结构化数据,已经昭示了科学的发展轨迹。

审核编辑(
李娜
)
投诉建议

提交

查看更多评论
其他资讯

查看更多

英孚康是罗克韦尔的替代品?不止如此

14位特邀嘉宾强势坐镇2024电子峰会!

意法半导体的RS-485收发器兼备传输稳定性与速度,适用于工业自动化、 智能建筑和机器人

美的工业技术:技术领跑、性能升级

​伊行四海 万象兴龙 | 2024 伊顿低压电气中国行在北京盛大启程