The algorithm tries to find the global optimum.
该算法试图找到全局最优解。
Because the loss function is non-convex, gradient descent may converge to a local optimum rather than the global optimum.
由于损失函数是非凸的,梯度下降可能收敛到局部最优而不是全局最优。
词源 Etymology
global 来自拉丁语 globus(“球体”),引申为“整体的、全局的”;optimum 来自拉丁语 optimus(“最好的”)。合在一起,“global optimum”字面即“整体范围内最好的结果”,在优化语境中指“全局范围内的最优解/最优值”。