2024-12-19
人工智能
00

目录

人工智能
机器学习
深度学习
神经网络
总结
疑问
神经网络属于机器学习的哪种学习方式?
监督学习
无监督学习
强化学习
神经网络如何学习?

整理一下跟人工智能领域相关的一些专业名词:

  • 人工智能
  • 机器学习
  • 深度学习
  • 神经网络

人工智能

image.png 人工智能是一门广泛的学科,旨在让计算机系统能够模拟人类的智能,包括学习、推理、解决问题、理解语言、识别图像等多种能力。它的目标是创建智能机器,使其能够像人类一样思考和行动。

人工智能的范畴非常广泛,包含了众多的子领域和技术。例如,专家系统是一种早期的人工智能应用,它通过预定义的规则来解决特定领域的问题,如医疗诊断系统根据症状和医学知识来判断疾病。另外,自然语言处理用于处理和理解人类语言,机器人学则涉及到物理机器人的设计和控制等诸多方面。

机器学习

机器学习是人工智能的一个子领域,它专注于让计算机系统从数据中自动学习模式和规律,而不是通过显式编程来规定任务。 从根本上讲,机器学习模型是一种软件应用程序,它封装一个函数用于根据一个或多个输入值计算输出值。 定义该函数的过程称为训练。 定义函数后,可以使用它在称为“推理”的过程中预测新值。

machine-learning.png

机器学习有多种学习方式,如监督学习、无监督学习和强化学习。

  1. 监督学习是指计算机根据带有标记(正确答案)的数据进行学习,例如在图像分类任务中,给计算机提供大量已标记好类别(如猫、狗等)的图像,让它学习如何分类。

  2. 无监督学习则是处理没有标记的数据,比如对一组用户的购物行为数据进行聚类,找出具有相似购物模式的用户群体。

  3. 强化学习是让计算机在环境中采取行动,并根据行动的反馈(奖励或惩罚)来学习最优的行为策略,例如训练一个机器人在迷宫中找到出口,它会根据是否接近出口得到奖励或惩罚,从而不断调整自己的行动策略。

machine-learning-types.png

深度学习

深度学习是机器学习的一个分支,它基于人工神经网络,特别是具有多个层次(深度神经网络)的神经网络。这些神经网络能够自动从大量数据中学习复杂的特征表示,从而进行更准确的预测和分类等任务。

image.png

模型结构特点:深度学习模型通常具有非常复杂的架构,包含多个隐藏层。

例如,在一个典型的卷积神经网络(CNN)用于图像识别时,它可能有多个卷积层、池化层和全连接层。

卷积层用于提取图像的局部特征,池化层用于减少数据维度,全连接层用于进行分类等操作。

与传统的机器学习方法相比,深度学习能够学习到数据中更抽象、更高级的特征。

神经网络

神经网络是一种模仿生物神经网络(如人脑神经元网络)的计算模型。它由大量的神经元(节点)相互连接而成,每个神经元接收输入信号,通过激活函数处理后产生输出信号,并将输出信号传递给其他神经元。 image.png

神经网络有多种结构,如

  • 简单的感知机(只有一个神经元的神经网络),
  • 多层感知机(包含多个隐藏层的神经网络)、
  • 循环神经网络(RNN)用于处理序列数据,像文本、语音等,因为它能够考虑数据的先后顺序。
  • 卷积神经网络(CNN)专门用于处理具有网格结构的数据,如图像和视频等。

总结

人工智能:是一个广泛的领域,涵盖了所有与模拟人类智能相关的技术和方法。

机器学习:是实现人工智能的一种方法,它让计算机从数据中自动学习。

深度学习:是机器学习的一个高级形式,利用深层神经网络来自动学习数据的复杂特征。

神经网络:是实现机器学习和深度学习的核心技术,通过模拟人脑的结构来学习数据中的模式。

疑问

神经网络属于机器学习的哪种学习方式?

神经网络本身不是一种学习方式,而是一种模型结构,但它在机器学习的多种学习方式中都有应用。

监督学习

在监督学习中,神经网络被广泛用于分类和回归任务。

例如,在图像分类任务中,输入是图像数据,输出是图像所属的类别(如猫、狗等)。

以一个简单的手写数字识别为例,我们有一个包含大量手写数字图像(MNIST 数据集)及其对应的正确数字标签(0 - 9)的训练集。通过构建一个多层神经网络(如多层感知机),将图像的像素值作为输入层的输入,经过隐藏层的神经元对特征进行提取和转换,最后在输出层得到一个概率分布,表示输入图像属于每个数字类别的概率。在训练过程中,根据预测结果与正确标签之间的误差(如交叉熵损失),使用反向传播算法来调整神经网络的权重,使模型的预测越来越准确。

对于回归任务,比如预测房价。输入可能是房屋的面积、房间数量、房龄等特征,输出是房屋的价格。

神经网络可以学习输入特征和房价之间的复杂关系,通过最小化预测房价与真实房价之间的均方误差来训练模型。

无监督学习

神经网络也可用于无监督学习中的聚类和特征提取等任务。

例如自编码器(Auto - Encoder)是一种神经网络结构,它由编码器和解码器两部分组成。

以图像数据为例,编码器将输入的图像压缩成一个低维的表示(潜在空间表示),解码器则尝试从这个低维表示中重建出原始图像。在训练过程中,通过最小化重建误差,自编码器可以学习到图像的有效特征表示。这些特征表示可以用于数据的降维、聚类或者作为其他机器学习模型的输入。

另一个例子是深度信念网络(DBN),它可以通过无监督的方式学习数据的层次化特征表示,用于对未标记的数据进行聚类或分类的预处理。

强化学习

在强化学习中,神经网络可以作为策略网络(用于决定智能体的行动)和价值网络(用于评估状态的价值)。

策略网络:例如,在训练一个机器人在复杂环境中导航时,策略网络根据环境状态(如机器人的位置、周围障碍物的位置等)输出机器人的行动(如前进、后退、左转、右转等)。

价值网络:价值网络则评估机器人处于某个状态的好坏程度。通过智能体在环境中的不断探索和与环境的交互,根据奖励信号(如成功到达目标位置获得正奖励,碰撞障碍物获得负奖励)来更新神经网络的参数,使智能体能够学习到最优的行动策略。

例如深度 Q - 网络(DQN)及其扩展算法就是利用神经网络在强化学习中取得了很好的成果,用于游戏等领域的智能体训练。

神经网络如何学习?

  1. 定义训练和验证数据集,并将训练特征馈送到输入层。
  2. 网络每一层的神经元应用其权重(它们最初随机分配)并通过网络馈送数据。
  3. 输出层生成一个矢量,其中包含 ŷ 的计算值。 例如,企鹅类预测的输出可能是 [0.3. 0.1. 0.6]。
  4. 损失函数用于将预测的 ŷ 值与已知的 y 值进行比较,并聚合差异(这被称为损失)。 例如,如果在上一步中返回输出的事例的已知类是 Chinstrap,则 y 值应为 [0.0, 0.0, 1.0]。 此值与 ŷ 向量之间的绝对差值为 [0.3, 0.1, 0.4]。 实际上,损失函数会计算多个事例的聚合方差,并将其汇总为单个损失值。
  5. 由于整个网络本质上是一个大型嵌套函数,因此优化函数可以使用微分计算来评估网络中每个权重对损失的影响,并确定如何调整它们(增加或减少)以减少整体损失量。 特定的优化技术可能会有所不同,但通常会涉及梯度下降法,即每个权重都会增加或减少,以最小化损失。
  6. 权重的更改会回传到网络中的各个层,并替换以前使用的值。
  7. 此过程会在多次迭代(称为“时期”)中重复,直到将损失降到最低且模型能够在可接受的准确范围内进行预测。 image.png

参考链接

机器学习基础知识:https://learn.microsoft.com/zh-cn/training/modules/fundamentals-machine-learning/

AI 学习路线(详细资源整理)https://github.com/apachecn/ai-roadmap/blob/master/ai-union-201904/README.md

本文作者:Peter.Pan

本文链接:

版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!