应用于隐藏层。输出层用于二分类(XOR),始终为 Sigmoid。
损失曲线
决定边界 (XOR)
在误差反向传播法中,损失 L 对权重 w 的梯度通过链式法则计算:
∂L/∂w = ∂L/∂a · ∂a/∂z · ∂z/∂w
XOR是线性不可分的,只能通过具有隐藏层的多层网络来解决。
实时可视化神经网络结构、前向传播和反向传播。通过XOR问题学习,直观理解神经网络工作原理。
应用于隐藏层。输出层用于二分类(XOR),始终为 Sigmoid。
在误差反向传播法中,损失 L 对权重 w 的梯度通过链式法则计算:
∂L/∂w = ∂L/∂a · ∂a/∂z · ∂z/∂w
XOR是线性不可分的,只能通过具有隐藏层的多层网络来解决。
CAE中的代理模型:汽车碰撞仿真或机翼空气动力学分析,一次FEM/CFD计算要花好几小时。把各种设计参数和结果喂给神经网络学习,就能快速预测,做成"代理模型",设计搜索速度能大幅提升。
物理信息神经网络(PINN):不仅靠数据驱动,还在损失函数里加入物理规律(比如Navier-Stokes方程)。这样用少量实验数据也能给出物理上有意义的预测,在流体分析和材料开发中很有前景。
图像识别与异常检测:工厂里用神经网络从产品外观图像自动检测缺陷。只用正常品图像训练,偏离的就是"异常"——这个思路也能用在验证CAE仿真结果上。
强化学习与最优控制:机器人手臂运动或建筑节能空调控制,神经网络学习复杂系统的最优动作。这是把CAE模型融入实际控制系统的基础技术。
用这个工具玩着玩着,容易产生一些误会。首先,"学习率η越大学习越快"——这只说对了一半。确实改大η会加大权重更新幅度,但比如设成0.5或1.0,损失曲线就会上下剧烈振荡,根本收敛不了。这是因为,你一不小心跳过了谷底,掉到对面的山坡上,再跳回去,就这样反复。实际工作的经验法则是,先从0.01或0.001这样的小值开始,逐步调整。
其次,"隐藏层和节点越多性能越好"——这也不全对。这个XOR问题,隐藏层1层、2个节点就够了。要是你偏要在工具里设成5层、每层10个节点这样的巨无霸网络,损失表面上掉到接近零,但决定边界会超级复杂,简直是对那4个训练点的"过度拟合"。这就是过学习。真实工作中,目标是找简洁但鲁棒的模型,对未知数据要稳定,所以网络深度和宽度都要精心选择。
最后一个坑:很多人觉得"Sigmoid函数是万能激活函数"。历史上确实用了很久,但深层网络里有大弱点。Sigmoid把输出压成0到1之间,导致梯度在反向传播时层层衰减,越往回传梯度越小——这就是著名的梯度消失问题。用工具把层数加深,会感觉学习变慢,那就是你在亲身体验梯度消失。现在深度学习主要用ReLU($f(x)=\max(0, x)$)这样的函数,就是为了解决这个问题。
隐藏层4个节点,学习率η=0.5,sigmoid激活函数的XOR问题学习:初始第1轮损失0.693、准确率50%,到第100轮时损失降至0.012、准确率100%。决定边界可视化中,非线性曲线逐步精确分割输入空间,隐藏层神经元间接线权重从[-2.5, 3.1, -1.8, 2.9]大幅更新至[-4.2, 5.7, -4.1, 5.6]