什么是神经网络?它的运作方式与数字计算机有何不同?(换句话说,大脑像计算机吗?)

加入我们的科学爱好者社区!

Mohamad Hassoun,人工神经网络基础(麻省理工学院出版社,1995年)的作者,以及韦恩州立大学电气与计算机工程教授,改编了他书中引言部分来回应。

人工神经网络是并行计算模型,包含密集互连的自适应处理单元。这些网络由许多简单的处理器(相对于通常只有一个强大处理器的PC而言)并行运作组成,以模拟非线性静态或动态系统,其中输入与其相应的输出之间存在复杂的关系。

这些网络的一个非常重要的特征是它们的自适应性,其中“通过示例学习”取代了“编程”来解决问题。在这里,“学习”指的是系统参数的自动调整,以便系统可以为给定的输入生成正确的输出;这种适应过程让人联想到大脑中通过神经元突触效能的变化而发生的学习方式。这一特征使得这些模型在应用领域非常具有吸引力,在这些领域中,人们对要解决的问题知之甚少或了解不完整,但可以获得训练数据。


支持科学新闻报道

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您将帮助确保有关塑造我们当今世界的发现和想法的有影响力的故事的未来。


一个例子是教神经网络将印刷文本转换为语音。在这里,人们可以从报纸上挑选几篇文章,并生成数百个训练对——一个输入及其相关的“期望”输出声音——如下:神经网络的输入将是文本中给定单词的三个连续字母的字符串。然后,网络应该生成的期望输出可以是输入字符串的第二个字母的声音。然后,训练阶段将包括循环遍历训练示例并调整网络参数——本质上是学习——以便逐渐最小化所有输入示例的输出声音中的任何错误。训练后,网络可以在新文章上进行测试。其想法是,神经网络将通过能够正确地将新文本转换为语音来“泛化”。

另一个关键特征是固有的并行架构,当这些网络在并行数字计算机上实现,或者最终在定制硬件中实现时,它允许快速计算解决方案。然而,在许多应用中,它们被实现为在PC或计算机工作站上运行的程序。

人工神经网络是各种问题的可行模型,包括模式分类、语音合成和识别、人与复杂物理系统之间的自适应接口、函数逼近、图像压缩、预测和预报以及非线性系统建模。

这些网络之所以“神经”,是因为它们可能是受到大脑和神经科学的启发,但不一定是因为它们是生物、神经或认知现象的忠实模型。事实上,许多人工神经网络与传统的数学和/或统计模型(例如非参数模式分类器、聚类算法、非线性滤波器和统计回归模型)的关系比与神经生物学模型的关系更密切。

© . All rights reserved.