kaiyun官网
News Center
新闻中心
新闻中心 您的位置: 首页 > 新闻中心
AI人工智能
2023-12-02 03:13:46 作者: 新闻中心

  人工智能(Artificial Intelligence),英文缩写为AI。它是

  人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出一定的反应的智能机器,

  早在通用计算机问世前的1943年,神经科学家沃伦·麦卡洛克和沃尔特·彼茨就提出了一种大胆假说,描述了

  1965年,A.G.伊瓦赫年科提出建立多层人工神经网络的设想,这种基于多层神经网络的机器学习模型后来被人们成为“深度学习”,

  与人工智能不同的是,数十年里,深度学习及相关的人工神经网络技术由于种种原因,蛰伏于人工智能兵器库的一角,默默无闻。

  当时的深度学习理论还没有办法解决网络层次加深后带来的诸多问题,计算机的计算能力也远远达不到深度神经网路的需要。

  是一种用数学模型对真实世界中的特定问题进行建模,以解决该领域内相似问题的过程

  深度学习是一种机器学习,和我们人类学习过程有一定的相似情况。就像人类认字一样,基础原理就是从简单到复杂,看每个汉字的写法,看得多了就记住了,下次再看到就认出来了。

  而教计算机认字,差不多也是一样,计算机要先把每个字的图案反复看很多遍,然后总结出一个规律,以后计算机只要看到类似的图案,符合之前总结的规律,计算机就知道了图案到底是什么字。计算机要先把每个字的图案反复看很多遍,然后总结出一个规律,以后计算机只要看到类似的图案,符合之前总结的规律,计算机就知道了图案到底是什么字。

  ,在训练数据集中提前做好记号(希望计算机能识别出来的)的图片就是“标注数据”,这样的一个过程就是“标注”,在“训练数据集”标注图片和未标注图片之间的区别是“特征”,

  机器学习是一类算法的总称,这些算法企图从大量历史数据中挖掘出其中隐含的规律,并用于预测或者分类,更具体的说,机器学习可以看作是

  要注意的是,机器学习的目标是使学到的函数很好地适用于“新样本”,而不仅仅是在训练样本上表现很好。

  学到的函数适用于新样本的能力,称为泛化(Generalization)能力。

  决策树是机器学习的一种传统算法(传统算法包括决策树学习、推导逻辑规划、聚类、分类、回归、强化学习和贝叶斯网络等等)。

  深度学习是一个比较新的概念,严格地说是2006年提出的。深度学习是用于建立、模拟人脑做多元化的分析学习的神经网络,并模仿人脑的机制来解释数据的一种机器学习技术。它的基本特点,是

  深度学习又分为卷积神经网络(Convolutional neural networks,简称CNN)和深度置信网(Deep Belief Nets,简称DBN)。其主要的思想就是模拟人的神经元,每个神经元接受到信息,处理完后传递给与之相邻的所有神经元即可。

  神经网络的计算量非常大,事实上在很久里由于基础设施技术的限制进展并不大。而

  如果说机器学习模拟的是人的决策判断机制,那么知识图谱模拟的是人的知识记忆。

  计算机本身是没有因果判断和逻辑推理能力的,就像一个刚出生不久的婴儿没办法做出有意识的理性判断和推断一样。

  高级的决策判断和推理,必须建立在知识和记忆的基础之上,这就是知识图谱在AI领域的重大意义——让计算机能够得到基于知识和记忆的高级判断、推理能力。

  在整个人类历史上以语言文字形式记载和流传的知识占到知识总量的80%以上。

  用于数学计算的仅占10%,用于过程控制的不到5%,其余85%左右都是用于语言文字的信息处理。

  处理包含理解、转化、生成等过程。自然语言处理,是指用计算机对自然语言的形、音、义等信息进行处理,

  机器翻译、文本摘要、文本分类、文本校对、信息抽取、语音合成、语音识别等

  可以说,自然语言处理就是要计算机理解自然语言,自然语言处理机制涉及两个流程,包括

  自然语言的理解和分析是一个层次化的过程,许多语言学家把这一过程分为五个层次,能更好地体现语言本身的构成,五个层次分别是

  语音分析是要根据音位规则,从语音流中区分出一个个独立的音素,再根据音位形态规则找出音节及其对应的词素或词。

  句法分析是对句子和短语的结构可以进行分析,目的是要找出词、短语等的相互关系以及各自在句中的作用。

  语义分析是找出词义、结构意义及其结合意义,从而确定语言所表达的真正含义或概念。

  自然语言处理的发展历程,资料来源:Kamp;amp;amp;I

  1950 年图灵提出了著名的“图灵测试”,这一般被认为是自然语言处理思想的开端,20 世纪 50 年代到 70 年代自然语言处理主要采用基于规则的方法,研究人员们认为自然语言处理的过程

  ,开发者不仅要精通计算机还要精通语言学,因此,这一阶段虽然解决了一些简单的问题,但是

  70年代以后随着互联网的高速发展,丰富的语料库成为现实以及硬件不断更新完善,自然语言处理思潮由经验主义向理性主义过渡,基于统计的方法逐渐代替了基于规则的方法。

  ,由最初的词向量到 2013 年的 word2vec,将深度学习与自然语言处理的结合推向了高潮,并在

  把输入到输出对的数据准备好,设计并训练一个神经网络,即可执行预想的任务。

  已经是自然语言处理最常用的方法之一,GRU(门控制单元)、LSTM(L

  (1)词法、句法及语义分析词法分析的主要任务是词性标注和词义标注。词性是词汇的基本属性,词性标注就是在给定句子中判断每个词的语法范畴,确定其词性并进行标注。解决兼类词和确定未登录词的词性问题是标注的重点。进行词性标注通常有基于规则和基于统计的两种方法。一个多义词往往可以表达多个意义,但其意义在具体的语境中又是确定的,词义标注的重点就是解决如何确定多义词在具体语境中的义项问题。标注过程中,通常是先确定语境,再明确词义,方法和词性标注类似,有基于规则和基于统计的做法。判断句子的句法结构和组成句子的各成分,明确它们之间的相互关系是句法分析的主要任务。句法分析通常有完全句法分析和浅层句法分析两种,完全句法分析是通过一系列的句法分析过程最终得到一个句子的完整的句法树。句法分析方法也分为基于规则和基于统计的方法,基于统计的方法是目前的主流方法,概率上下文无关文法用的较多。完全句法分析存在两个难点,一是词性歧义;二是搜索空间太大,通常是句子中词的个数n的指数级。浅层句法分析又叫部分句法分析或语块分析,它只要求识别出句子中某些结构相对简单的成分如动词短语、非递归的名词短语等,这些结构被称为语块。一般来说,浅层语法分析会完成语块的识别和分析、语块之间依存关系的分析两个任务,其中语块的识别和分析是浅层语法分析的主要任务。语义分析是指根据句子的句法结构和句子中每个实词的词义推导出来能够反映这个句子意义的某种形式化表示,将人类能够理解的自然语言转化为计算机能够理解的形式语言。句子的分析与处理过程,有的采用“先句法后语义”的方法,但“句法语义一体化”的策略还是占据主流位置。语义分析技术目前还不是十分成熟,运用统计方法获取语义信息的研究颇受关注,常见的有词义消歧和浅层语义分析。(2)知识图谱知识图谱在表现形式上与语义网络比较类似,不同的是,语义网络侧重于表示概念与概念之间的关系,而知识图谱更侧重于表述实体之间的关系。现在的知识网络被用来泛指大规模的知识库,知识图谱中包含的节点有以下几种:实体:指独立存在且具有某种区别性的事物。如一个人、一种动物、一个国家、一种植物等。具体的事物就是实体所代表的内容,实体是知识图谱中的最基本元素,不同的实体间有不同的关系。语义类:具有同种特性的实体构成的集合,如人类、动物、国家、植物等。概念主要指集合、类别、对象类型、事物的种类,例如人物、地理等。内容:通常是实体和语义类的名字、描述、解释等,变现形式一般有文本、图像、音视频等。属性(值):主要指对象指定属性的值,不同的属性类型对应于不同类型属性的边。关系:在知识图谱上,表现形式是一个将节点(实体、语义类、属性值)映射到布尔值的函数。

  资料来源:AMiner知识图谱表示、构建和应用涉及很多学科,是一项综合的复杂技术。知识图谱技术既涉及自然语言处理中的各项技术,从浅层的文本向量表示、到句法和语义结构表示被适用于资源内容的表示中,分词和词性标注、命名实体识别、句法语义结构分析、指代分析等技术被应用于自然语言处理中。同时,知识图谱的研究也促进了自然语言处理技术的研究,基于知识图谱的词义排岐和语义依存关系分析等知识驱动的自然语言处理技术得以建立。

  资料来源:摄星智能3、NLP的应用技术随着自然语言处理技术不断提升,众多类型智能应用需要自然语言处理技术帮助其实现智能化,如文本领域的搜索引擎、信息检索、机器翻译、自动摘要、文本分类、意见挖掘、舆情分析、自动判卷系统、信息过滤和垃圾邮件处理等应用;语音领域的语音助手、智能客服、聊天机器人、自动问答、智能解说和智能远程教学与答疑等应用均需自然语言处理技术理解或生成自然语言。自动问答自动问答应用涉及自然语言的词法、句法、语义等分析问题,是自然语言理解与生成技术应用的集中体现。自动问答系统能自动回答用户提出的问题,反馈给用户基于自然语言表述的答案,不再是简单的基于关键词匹配排序的文档列表,系统在生成答案的操作中需要正确理解用户所提出的问题,抽取用户问题中的关键信息,进而检索语料库或知识库,将可匹配的最佳答案用自然语言的形式反馈给用户,完成自动问答任务。信息检索信息检索是计算机自主从文档集合中查找用户所需信息的过程。信息检索系统将信息标引、描述以及组织整理后存在于数据库中,将用户输入的检索关键词与数据库中信息的标引词匹配,实现用户的信息检索要求。信息检索要求计算机理解用户输入的自然语言信息,自动将自然语言信息与数据库中的标引信息进行比对,以达成检索任务。如谷歌搜索引擎可通过理解用户输入的自然语言关键词,反馈给用户一个检索目标页面列表,用户可在列表中选择能够满足自己信息需求的页面加以浏览。因为搜索引擎无法通过简单的关键词表达体会用户真正的查询意图,只能将所有可能满足用户需求的结果集合以列表的形式提供给用户。情感分析情感分析(意见挖掘),是计算机系统自主对文本的情感倾向(如主观/客观,积极/消极,喜欢/讨厌等)进行挖掘和分析的过程。情感分析能帮助商家自动处理用户评论,将分析过的评论按照排序规则进行展示,帮助商家获得广告营销效果,如淘宝、天猫等电商平台、携程、爱彼迎等旅游住宿平台的商家在评论区可设置自动置顶反映积极情绪的用户评论,置后部分反映负面信息的用户评论,达到吸引用户眼球的效果。情感分析是自然语言处理中的一个重要研究方面,主要是对带有感彩的主观性文本做多元化的分析、处理、归纳和推理。情感分析的发展得益于社交媒体的兴起,产生了大量个体参与的、对于人物、事件和产品的评论信息,通过机器学习,得出可量化的数据结论。

  资料来源:《中国证券》,中泰证券4、自然语言处理产业链自然语言处理产业链上游市场由基础资源供应商组成,涉及网络设备、服务器、芯片、存储、云服务、数据库等软、硬件供应商,负责为自然语言处理技术和产品开发商提供必要的资源支持。自然语言处理产业链中游市场主体主要有自然语言处理算法提供商、解决方案提供商以及应用产品开发商。目前中国的自然语言处理厂商较多集研发算法、解决方案以及应用产品功能于一身,厂商自主研发自然语言处理算法,形成一整套自然语言处理关键技术方案,并将自主研发的自然语言处理算法和技术方案内嵌于自有应用产品体系中,典型代表有百度、阿里巴巴和腾讯。NLP产业链下游为各类型用户,包括企业用户和个人用户,企业用户主要购买行业应用,如智能客服产品、舆情分析产品、文本分类产品等,帮企业用户提升业务处理的智能化水平,目前的B端市场是自然语言处理厂商竞争的焦点,部分产品已经实现商业化。个人用户使用较多的私手机语音助手、机器翻译软件、信息检索和互联网搜索等服务。个人用户使用的自然语言处理技术产品较多是免费使用。

  【AI、开源芯片、量子、脑机接口…2017-2020 全球信息技术领域热点回顾丨趋势观察 - 今日头条】

  【什么是机器学习、人工智能、深度学习,三者又是啥关系? - 今日头条】【今日头条】

  【AI就是机器学习?3000字给你讲清楚,机器学习到底是怎么一回事 - 今日头条】

  谷歌的最新NLP模型,现在能陪你从诗词歌赋谈到人生哲学 - 今日头条】清华大学ai学生

  【人工智能核心技术之一!大连理工大学连续取得3项重大研究,引发国际关注! - 今日头条】

  本课程将重点讲解人工智能基本算法、模型和理论。内容最重要的包含以符号主义为核心的逻辑推理、以问题求解为核心的探询搜索、以数据驱动为核心的机器学习、以行为主义为核心的强化学习和以博弈对抗为核心的决策智能等算法以及AI与科学计算相结合算法。

  机器学习、计算机视觉、自然语言处理等技术持续不断的发展,优化技术慢慢的变成为人工智能领域的重要数学基础。本课程从凸优化入手,介绍优化核心原理、基本方法和前沿技术,为智能方向的科学探索做理论准备。本课程将帮助学习者正确理解优化复杂度的概念,掌握分析凸优化复杂度的基本方法,了解一阶、二阶方法在不同问题类上的求解性能,熟悉包括免疫算法、粒子群算法等的多种优化方法的基本思路,不断提高分析解决实际问题的能力。

  本课程致力于介绍经典的机器学习算法,让学生初步掌握机器学习领域的基本方法与蓝图。通过掌握机器学习的算法与理论知识,能查阅并理解相关领域的前沿文献,同时熟练使用相关的机器学习算法,解决流行的AI领域应用问题,为今后在深度学习相关教学、科研和项目开发工作中深入解决实际应用问题打好基础。

  计算机视觉是关于如何使机器“看”的科学和技术,通过对采集的图片或视频做处理以获得相应场景的三维信息,是人工智能的重要分支,在无人驾驶、虚拟现实、生物识别、安全监控、智能制造等领域发挥着重要的作用。本课程首先介绍计算机视觉领域的发展历史和主要应用,之后讲解计算机视觉的主要任务和应用场景,包括成像原理、边界和曲线、图像分类、图像分割、目标检测、形状分析、纹理分析、图像重构、图像生成、人脸识别等;着重介绍以上主要任务中的关键技术难题、重大技术突破,针对这些任务的主流方法,特别是基于统计模式分类和人工神经网络的方法。

  自然语言处理是关于实现人与计算机之间用自然语言进行相对有效通信的各种理论和方法,是人工智能的重要研究内容,在网络搜索、广告、电子邮件、客户服务、语言翻译、医疗诊断等领域得到普遍应用。课程详细的细节内容包括自然语言处理中的词法分析、句法分析、语义分析以及语用分析等基本任务,情感倾向分析、文本摘要、对话系统、问答系统、机器翻译等自然语言处理重要应用所要解决的基本问题和难点,以及如何利用机器学习、深度学习等手段求解各种自然语言处理问题。

  本课程是神经认知科学的入门课程,包含了认知心理学、神经科学、计算机科学及其他基础科学等多学科的交叉和融合。首先介绍神经认知科学的基本概念、历史和发展现况,进一步讲解基于认知活动的脑机制,即人类大脑如何调用其各层次上的组件,包括分子、突触、细胞、脑组织区和全脑去实现各种认知活动,最后介绍相关的计算模型和算法。

  课程将从细胞机制和神经元模型、大脑的结构和功能组织、感知原理及模型、记忆的基础理论及模型、学习机制及学习算法、脉冲神经网络的概念、结构和应用等方面做展开,旨在加深同学对认知神经科学的理解。通过对这门课程的学习,学生应该掌握认知神经科学的基本内涵,熟悉借鉴大脑机制的学习、记忆等计算模型及算法,同时启发同学们对AI在可解释性、自适应学习和非完备信息推理等基础理论的瓶颈问题的思考。

  本课程将对AI系统的安全问题、常见的攻防方法和人工智能技术引起的伦理道德问题进行介绍,同时探讨相应的治理技术。通过本课程的学习,使学生能了解人工智能技术的安全和伦理问题,并了解相关的治理规范和防御方法,助力人工智能技术的健康发展。

  机器人是人工智能的重要载体,机器人学是一门高度交叉的前沿学科。本课程讲解机器人和控制领域基础知识和最新研究成果,最重要的包含机器人运动学、动力学,基于视觉、激光、超声等多传感器信息的场景感知技术,利用最新的人工智能方法实现机器人智能控制等。

  (六)人工智能架构与系统本课程讲解支持深度学习的计算机系统架构和设计方法,包括AI算法硬件加速、软硬件协同智能计算架构、云-边缘-端智能系统、后摩尔时代智能计算发展趋势等。