kaiyun官网
News Center
新闻中心
新闻中心 您的位置: 首页 > 新闻中心
数据大数据技术人工智能的哲学四论
2023-11-27 19:05:19 作者: 新闻中心

  这篇内容的生产是痛苦的,许多哲学理论并不是我擅长的,再者要把这些哲学理论适用性地应用在科学技术领域上,确实艰难。

  但又不得不做,因为以往写了不少关于 大数据,人工智能,数字化相关的内容,其中或多或少也都涉及到了认识论和方法论,冥冥之中两者之间已形成了很多细微的关联,轻易放弃这些关系线索,很不舍得,所以不得不突破难产。

  这篇内容讨论的基本概念有:数据,大数据技术,人工智能,本体论,认识论,方法论和实践论,前三者是属于科学范畴,后四者属于哲学基本范畴。

  我想论述的是数据,大数据技术和人工智能,三者的本体论,认识论,方法论和实践论的思考;其本质是科学与哲学关系的思考,科学是通过现象发现事物运动变化的根本规律,即通过现象看本质。哲学是研究本质的学科。

  对数据,大数据技术和人工智能的四论的论述,我假设了两种思路:其一是针对每一种科学内容做四论的分析;另一种是在一论下讨论三种科学内容。

  前者是对每一种科学内容做全面的理解,侧重在对同一内容四论的综合分析;后者是对三种不同科学内容做单独的理解,侧重在对三种内容一论的对比分析。综合思考下来,选择了后者,我更倾向于对三种科学内容做对比分析。

  数据的本体是事实的表征;大数据技术的本体是关系,其中数据是质料,技术是动力;人工智能的本体是知识,是从数据中提取的概念化的知识。

  数据对应的是传统认识范式;大数据技术对应的是大数据认识范式;人工智能对应的传统认识+大数据认识的双驱动的认识范式。

  数据对应的方法是逻辑思维和模拟,仿真,计算机实验方法;大数据技术对应的方法是描述/预测模型的大数据方法;人工智能对应的方法是逻辑思维+大数据方法的双驱动方法。

  数据在实践中辅助思维,与行为是独立的;大数据技术在实践中实现了思维和行为的一体化,以及现实虚拟化;AI在实践中实现了行为思维化和思维行为化,以及全面智能化。

  本体论,是17世纪德国经院学者郭克兰纽提出,简单地说就是有关于存在以及存在之所以存在的学说,本体论又称为存在论。

  关系论认为数据就是信息,或信息的表示方式,该观点重视数据内的关联。表征论认为数据是事实的收集,数据表征了基本经验证据,基于这些证据可以开展推理。

  两种观点可以表述为数据是事实的表征,且体现了事物之间的关系。这两种观点的结合与大数据本体的意义有直接关联。

  根据数据的本质,即事实的表征,数据是在大数据时代深度认识世界的本源,数据是大数据技术成为可能的质料,大数据的价值要被通过大数据技术表达出来。

  技术是大数据技术本体的形式和动力,是帮助大数技术存在的目的。大数据技术并不是抽象的概念,而是真实存在的,如,网络设施,智能终端,智能手机等。

  大数据技术是以海量的数据作为基本质料,经过对海量数据的发现和挖掘,揭示已完成的事实之间的相互关系,以及挖掘事实中藏匿着的知识的使命,关系才是大数据技术的本体。

  人工智能是计算机科学的一个分支,是研究,开发用于模拟,延伸人的智能的理论,方法和技术及应用的一门新的技术科学。

  斯坦福大学的人工智能专家Tom Gurber认为,在AI领域中,本体论是指使程序和人们共享知识信息的概念模型的规范说明。

  1980年,人工智能之父约翰.麦肯锡,认识到哲学本体论和AI的逻辑理论构建活动之间的重叠,提出以逻辑概念为基础的智能系统必须列出所有存在的事物并构建一个本体描述我们世界。

  人工智能是通过专门领域的知识表达来支持自动推理:一个可能世界的本体,尽可能包含世界的所有事物,它们之间的联系以及相互影响的方式。

  人工智能的本体论代表一种特殊的知识,即概念化,范畴化及能全球共享的领域知识,建构人工智能的本体论实质是人工智能知识工程的组成部分。

  人工智能的本体论是从全世界或某个特定领域的数据文档中提取含有标准和规范的概念化知识,形成关于其存在对象及其规范关系和规范行为的概念图式。

  认识论是关于认识的本质和产生发展规律的哲学理论,即讨论人类认识的本质,结构,认识与客观存在的关系,认识发展,过程以及规律的学说。

  《经验主义与推荐引擎》:从这篇内容开始,经验主义,即认识论的相关联的内容开始步入我的视野,我开始把认识论与大数据关联在一起,那时,我对理性主义和经验主义,实证主义的理解还是很肤浅的。

  从这篇内容,我对认识论的理论(经验主义,理性主义,具象主义,观念主义)以及认识论的发展,有了全面的认识,理解了对大数据技术,人工智能,或者模型观的认识基础就是认识论。

  传统的科学知识是被逻辑经验主义解释的,知识的可靠性是被逻辑形式上的可靠性所支撑。

  在传统认识中,认识主体对数据的认知是次要的,对数据本体与认识的讨论往往也是细枝末节的。传统的理论驱动方法需要预设理论原则,数据在其中仅起到假设检验的作用。

  大数据科学是科学研究的第四范式,大数据具有认知力,能够在使用不相同方法论工具与理论框架的研究群体之间架起桥梁。大数据技术能提高科学发现的准确性和预测能力。

  大数据科学要求数据,统计与计算机工程等技能的结合,发展出一种特定的认识论研究,这一认识论强调研究手段-建模,统计,模拟等方法。

  这三篇内容都是关于传统认识范式和大数据范式范式的内容,三者有先后顺序,能够准确的看出我对这部分内容理解的过程。

  这张图也清晰的揭示了两种认识范式的对比,不仅有主要几对重要概念的对比(因果关系和相关关系,理论驱动和数据驱动,理性主义和实证主义)还有两种认识范式过程的一系列对比。

  有时,重新回看以往的内容或图表,我也曾经怀疑或诧异,真的是自己思考的结果么?

  人工智能是对人类智能的一种模拟和扩展,其核心是思维模拟。(这个部分内容需要持续思考)

  虽然表面上我想讨论的是三种模型观,其实现在看,还是肤浅了,狭隘了,三种内容的结合没错,但其实并不是什么模型观,就是三种认识范式,即传统认识范式,大数据认识范式,以及两者的结合-双驱动认识范式。

  方法论是人们认识世界,改造世界的一般方法,是用什么样的方式,方法来观察事物和处理问题,方法论主要是解决怎么办的问题。

  传统的方法论是基于知识的,是从大量的实践中抽象和总结出一般规律性的知识(原理,规律,模型,方法论等)然后再用这些知识去解决问题。

  数据在这样的一个过程中是一种辅助资源,例如,传统科学中的统计分析工具,是对问题做出一定的假设,以及抽取一定样本做检验假设分析。

  这张科学研究方法论体系图中,四层不一样的方法论,我个人觉得都属于传统的方法,如,逻辑和非逻辑思维方法,模拟,仿真,计算机实验方法等。

  其中数据作为信息的载体,能应用在不同方法中,尤其是在计算机实验方法中,但只作为辅助资源,而不是主要驱动力。

  大数据技术作为一种新的研究方法,主要研究方法是数据挖掘,基本目标有:描述和预测,通过描述海量数据中潜在的模式,并依据数据中的潜在模式来进行预测,从而发现数据中的有价值的模型和规律。

  大数据模型与传统模型比较:大数据模型中数据占主导地位,且是海量数据,模型的驱动方式是数据驱动,可更新。

  大数据方法与计算机仿真比较:大数据方法是数据驱动,计算机仿真是模型驱动,前者是归纳逻辑,后者是演绎逻辑,前者说明力较低,后者说明力较高。

  这两张图对比了大数据方法与计算机仿真,大数据模型与统计模型的区别,从四者的对比可以揭示数据与大数据技术之间方法论的区别:

  (1)大数据技术方法是以海量数据驱动的,数据占主导地位,数据的驱动,建模和预测都是自动的;而传统方法中数据模型的数据是辅助地位,数据是定量的。

  (2)传统方法和大数据技术方法中都包含了基本逻辑思维的应用,如,大数据方法是归纳逻辑,计算机仿真是演绎逻辑。

  这篇内容也是综合,覆盖了传统方法和大数据方法,例如,假设检验,以及统计方法都属于传统方法,且数据在统计方法中完全应用。

  但统计方法在两个大数据中都发生了变形应用,成为大数据方法其中一个和多个环节,例如,推荐系统中就包括了统计方法和大数据方法的结合应用。

  符号主义:基于逻辑推理的智能模拟方法,又称逻辑主义,即在计算机上用逻辑演绎的方式来实现人工智能。

  连接主义:把人的智能归结于人脑的活动,强调智能是有大量简单的单元通过复杂的相互联结和并行运行的结果。如,深度神经网络。

  行为主义:是基于感知-行动的行为智能模拟方法,源于控制论,即感知外界环境并反馈正确的动作。如,智能控制和智能机器人的研究。

  因果关系和相关关系这两种形式逻辑都在人工智能上有结合应用,且在上图的基于因果逻辑原理-控因致果的方法论中,因果关系占到主导作用,可见形式逻辑方法也可以在人工智能中的应用。

  这篇内容在这里的作用是构建了一门体系化的学科方法,即数据科学,包括了大数据技术和人工智能,以及两个场景的应用,数字产业化和产业数字化。

  实践是理论,方法得以具体化或实现的过程,是人类能动性地改造世界的物质活动。

  在实践活动中,通过实验,观察,分析等方法获取数据和信息,通过实践来检验和修正科学理论,数据在其中辅助了科学理论方法的实践。

  其一,思维和行为,在传统实践中,实践的主体与客体是分离的,即思维和行为的分离的;而大数据技术的实践中,主体与客体融为一体,数字化成为了思维行为化的中介,即行为也是思维,行为思维化。

  其二,现实和虚拟,在传统实践中,活动存在于现实环境中,而大数据技术的实践,大数据的虚拟化和智能化使得实践的环境从现实变成了虚拟环境,从存在的事物过渡到不存在的事物。

  劳动是人类最基本的生存方式,也是人类区别动物的本质之一。大数据技术的数字化革命使得机器可根据人的思维进行活动,已经根本上改变了人类的劳动方式和内容。

  人类进入智能化劳动时代,机器拥有了超过人的智慧化能力,还可以取代人类,实现生产的全部过程的全面智能化。

  智能机器人是人的思维行为化过程或人的思维延伸,即机器人拥有自我学习能力;生物机器人最终走向实现行为思维化和思维行为化的双向统一。

  关于数据,大数据技术和人工智能的实践应用,集中在两个领域:产业数字化和ChatGPT,我对两个领域的灵感都来自于陆奇的演讲。

  陆奇的第一份演讲,其实就整体覆盖了这两个领域,只不过我的注意力集中在了产业数字化,陆奇明确定义了数字化的四个阶段:信息时代,网络时代,移动时代和智能时代。

  现在来看,这四个阶段就包含了数据,大数据技术,人工智能的实践过程,数据在实践中的应用即信息时代,大数据技术在实践中的应用是网络时代和移动时代,AI在实践中的应用是智能时代。这样归属的意义是能清楚三者的实践论与案例结合。

  例如,信息时代,数据在ERP或管理系统中作为信息的载体发挥辅助作用,思维与行为之间是分割的,数据只作为决策的依据。

  网络时代和移动时代,大数据技术在线上电商或移动APP中作为工作流,信息流和数据流结合存在,符合大数据技术的两个特征,即思维和行为一体化,虚拟大于现实化。

  智能时代,AI在智能产品或自动化工厂发挥取代人类劳动的作用,即包括了脑力和体力劳动的全面智能化。

  陆奇的演讲《我的大模型世界观》中的模型和自动化,这两个概念引起了我的注意:

  其一,模型在大数据技术和人工智能中的作用,也使得我后期完成了一系列关于大模型观的内容。

  其二,智能化和自动化的关系,智能化是通过自动化来表现的,信息系统 + 模型系统 + 行动系统 =智能化 + 自动化,从这个公式就能够准确的看出,人工智能实践论的特征,即行为思维化和思维行动化,两者的一体化。

  这篇内容很有意义,这是我在分析上世纪6-70年代的工程技术方法时感兴趣的一种行动研究方法,竟然大胆的将其应用在了SaaS数据系统的分析中,对比了智能化和自动化两者的关系,现在来看,那时就铺垫了智能化和自动化两者一体化的思路。

  2. 系统论和系统科学:《系统方法论》《向钱学森学习》《系统论和系统科学》《系统科学-金字塔体系》

  3. 科学方法研究:《1.观察 实验 定义 概念》《2.逻辑和非逻辑思维》《2.逻辑学看ChatGPT》《3.模型 模拟 仿线.科学研究方法论》《科学发现方法论书籍》

  《我的大模型=知识模型+能力模型+素质模型》《如何建构知识模型》《知识怎么样转化为能力》《经验怎么样转化为知识》

  《范畴-学习》《结构-范畴》《关系-范畴》《哲学范畴系统化》《唯物辩证法的范畴论》《辩证唯物主义要素结构功能》《商业范畴系统化》