虽然符号人工智能系统通常接受明确的目标函数,但该范式也可以应用于神经网络和进化计算。强化学习可以生成智能Agent,其行为方式似乎旨在最大化“奖励函数”。有时,机器学习程序员不会将奖励函数设置为直接等于所需的基准评估函数,而是使用奖励塑造来最初为机器学习的增量进展提供奖励。 扬·乐昆2018 年表示,“人们提出的大多数学习算法本质上都是由最小化某些目标函数组成的。” AlphaZero国际象棋有一个简单的目标函数;每场胜利计为+1分,每场失败计为-1分。自动驾驶汽车的目标函数必须更加复杂。进化计算可以进化出智能Agent,这些智能Agent的行为方式似乎旨在最大化“适应度函数”,该函数影响每个智能体被允许离开的后代数量。