凸函数与凹函数

对于 y = x 2 y=x^2 y=x2为凸函数一直 不理解,因为形状是凹的;后面才发现有特定的解释
在数学中,凸函数(Convex Function)和凹函数(Concave Function)的命名源于其几何性质,而非单纯依赖视觉上的“凸起”或“凹陷”。对于中文术语的困惑,主要源于以下几点:


1. 术语的起源与翻译

  • 英文术语:数学中的 “convex” 原意为“凸出的”,但定义核心是函数图像上方的区域是凸集(即任意两点连线完全位于区域内)。因此,开口向上的抛物线 f(x)=x2 是凸函数,因为其图像上方的区域(所有满足 y≥x2 的点)是凸集。
  • 中文翻译:将 “convex function” 直译为“凸函数”,但中文的“凸”常被理解为“向外凸起”,而开口向上的抛物线在视觉上可能更像“凹坑”,导致混淆。

2. 数学定义与直观形状的对应

  • 凸函数的定义:对任意两点 x1,x2 和 λ∈[0,1],满足
    f ( λ x 1 + ( 1 − λ ) x 2 ) ≤ λ f ( x 1 ) + ( 1 − λ ) f ( x 2 ) f(λx1+(1−λ)x2)≤λf(x1)+(1−λ)f(x2) f(λx1+(1λ)x2)λf(x1)+(1λ)f(x2).
    几何上,函数图像上任意两点的连线位于图像上方(如抛物线  f ( x ) = x 2 f(x)=x^2 f(x)=x2)。
  • 凹函数的定义:将不等式反向,连线位于图像下方(如抛物线  f ( x ) = − x 2 f(x)=−x^2 f(x)=x2)。
函数类型 图像形状(二维) 二阶导数符号 几何性质
凸函数 开口向上(如碗口朝上) f″(x)≥0 图像上方区域是凸集
凹函数 开口向下(如碗口朝下) f″(x)≤0 图像下方区域是凹集

你可能感兴趣的:(计算机视觉,算法,人工智能)