C++ 参考手册
- C++11
- C++14
- C++17
- C++20
- C++ 编译器支持情况表
- 独立与宿主实现
- C++ 语言
- 变量模板(C++14 起)
- 整数字面量
- 聚合初始化
- 比较运算符
- 默认比较(C++20 起)
- 转义序列
- for 循环
- while 循环
- 用户定义转换
- SFINAE
- 主函数
- ASCII 码表
- 标识符
- 类型
- 内存模型
- 对象
- 基本概念
- 表达式
- 声明
- 初始化
- 函数
- 语句
- 类
- 运算符重载
- 模板
- 异常
- 事务性内存
- 占位符类型说明符 (C++11 起)
- decltype 说明符
- 函数声明
- final 说明符 (C++11 起)
- override 说明符(C++11 起)
- 引用声明
- 移动构造函数
- 移动赋值运算符
- 枚举声明
- constexpr 说明符(C++11 起)
- 列表初始化 (C++11 起)
- 构造函数与成员初始化器列表
- using 声明
- nullptr,指针字面量
- 基础类型
- 类型别名,别名模版 (C++11 起)
- 形参包
- 联合体声明
- 字符串字面量
- 用户定义字面量 (C++11 起)
- 属性说明符序列(C++11 起)
- Lambda 表达式 (C++11 起)
- noexcept 说明符 (C++11 起)
- noexcept 运算符 (C++11 起)
- alignof 运算符(C++11 起)
- alignas 说明符 (C++11 起)
- 存储类说明符
- 基于范围的 for 循环 (C++11 起)
- static_assert 声明
- 隐式转换
- 代用运算符表示
- 自增/自减运算符
- 折叠表达式(C++17 起)
- 类模板实参推导(C++17 起)
- 模板形参与模板实参
- if 语句
- inline 说明符
- 结构化绑定声明 (C++17 起)
- switch 语句
- 字符字面量
- 命名空间
- 求值顺序
- 复制消除
- consteval 说明符 (C++20 起)
- constinit 说明符 (C++20 起)
- 协程 (C++20)
- 模块 (C++20 起)
- 约束与概念 (C++20 起)
- new 表达式
- do-while 循环
- continue 语句
- break 语句
- goto 语句
- return 语句
- 动态异常说明
- throw 表达式
- try 块
- 命名空间别名
- 类声明
- cv(const 与 volatile)类型限定符
- 默认初始化
- 值初始化(C++03 起)
- 零初始化
- 复制初始化
- 直接初始化
- 常量初始化
- 引用初始化
- 值类别
- C++ 运算符优先级
- 布尔字面量
- 浮点字面量
- typedef 说明符
- 显式类型转换
- static_cast 转换
- dynamic_cast 转换
- const_cast 转换
- reinterpret_cast 转换
- delete 表达式
- 构造函数与成员初始化器列表
- this 指针
- 访问说明符
- 友元声明
- virtual 函数说明符
- explicit 说明符
- 静态成员
- 默认构造函数
- 复制构造函数
- 复制赋值运算符
- 析构函数
- 类模板
- 函数模板
- 显式(全)模板特化
- 汇编声明
- C++ 的历史
- 作用域
- 生存期
- 定义与单一定义规则(ODR)
- 名字查找
- 有限定的名字查找
- 无限定的名字查找
- 如同规则
- 未定义行为
- 翻译阶段
- 常量表达式
- 赋值运算符
- 算术运算符
- 逻辑运算符
- 成员访问运算符
- 其他运算符
- sizeof 运算符
- typeid 运算符
- 指针声明
- 数组声明
- 语言链接
- 详述类型说明符
- 默认实参
- 变长实参
- 实参依赖查找
- 重载决议
- 重载函数的地址
- 注入类名
- 非静态数据成员
- 非静态成员函数
- 嵌套类
- 派生类
- 空基类优化
- 抽象类
- 位域
- 转换构造函数
- 成员模板
- 模板实参推导
- 部分模板特化
- sizeof... 运算符
- 待决名
- 函数 try 块
- 扩充命名空间 std
- 字母缩写
- RAII
- 三/五/零之法则
- PImpl
- 零开销原则
- 类型
- 隐式转换
- 注释
- C++ 关键词
- 预处理器
- C++ 标准库头文件
- 具名要求
- 功能特性测试 (C++20)
- 工具库
- 类型支持(基本类型、RTTI、类型特性)
- 概念库 (C++20)
- 错误处理
- 动态内存管理
- 日期和时间工具
- 字符串库
- 容器库
- 迭代器库
- 范围库 (C++20)
- 算法库
- 数值库
- 输入/输出库
- 文件系统库
- 本地化库
- 正则表达式库
- 原子操作库
- 线程支持库
- 实验性 C++ 特性
- 有用的资源
- 索引
- std 符号索引
- 协程支持 (C++20)
- C++ 关键词
未定义行为
若违反某些规则,则令整个程序失去意义。
解释
C++ 标准为不被归入下列分类之一的每个程序都精确定义了其可观察行为:
- 非良构(ill-formed)——程序拥有语法错误或可诊断的语义错误。遵从标准的 C++ 编译器必须为此给出诊断,即使它定义了为这种代码赋予了含义的语言扩展(例如用非常量长度数组)也应如此。标准文本用 shall(应当)、 shall not(不应当)和 ill-formed(非良构)给出了这些要求。
- 非良构而不要求诊断(ill-formed no diagnostic required)——程序拥有通常情况下可能无法诊断的语义错误(例如 ODR 的违规或者其他只能在连接时检测的错误)。若执行这种程序则行为未定义。
- 由实现定义的行为(implementation-defined behavior)——程序的行为随实现而变动,遵从标准的实现必须为每个这样的行为的效果提供文档。例如 std::size_t 的类型或字节中的位数,或者 std::bad_alloc::what 的文本。由实现定义的行为的一个子集是本地环境特定行为(locale-specific behavior),它取决于实现所提供的本地环境。
- 未指明的行为( unspecified behavior )——程序的行为随实现而变动,而不要求遵从标准的实现为每个行为的效果提供文档。例如求值顺序,等同的字符串字面量是否为相异对象,数组分配的开销,等等。每个未指明行为均产生合法结果集合中的一个结果。
- 未定义行为(undefined behavior,UB)——对程序的行为无任何限制。未定义行为的例子是数组边界外的内存访问,有符号整数溢出,空指针的解引用,在表达式中对同一标量多于一次的中间无序列点 (C++11 前)无序 (C++11 起)的修改,通过不同类型的指针访问对象,等等。不要求编译器诊断未定义行为(尽管许多简单情形确实会得到诊断),而且不要求所编译的程序做任何有意义的事。
UB 与优化
因为正确的 C++ 程序不含未定义行为,故在启用优化选项以编译确实含有 UB 的程序时,编译器可能产生不期待的结果:
例如,
有符号溢出
int foo(int x) { return x+1 > x; // 要么为 true 要么因有符号溢出而致 UB }
可编译为(演示)
foo(int): movl $1, %eax ret
边界外访问
int table[4] = {}; bool exists_in_table(int v) { // 在头 4 次迭代中返回 true,或因边界外访问而致 UB for (int i = 0; i <= 4; i++) { if (table[i] == v) return true; } return false; }
可能编译为(演示)
exists_in_table(int): movl $1, %eax ret
未初始化标量
std::size_t f(int x) { std::size_t a; if(x) // x 非零或 UB a = 42; return a; }
可能编译为(演示)
f(int): mov eax, 42 ret
以下给出的输出曾在旧版本 gcc 上观察到
运行此代码
可能的输出:
p is true p is false
非法标量
int f() { bool b = true; unsigned char* p = reinterpret_cast<unsigned char*>(&b); *p = 10; // 从 b 读取现在是 UB return b == 0; }
可编译成(演示)
f(): movl $11, %eax ret
空指针解引用
int foo(int* p) { int x = *p; if(!p) return x; // 要么如上产生 UB,要么不可能采用此分支 else return 0; } int bar() { int* p = nullptr; return *p; // 无条件 UB }
可能编译为( foo 用 gcc 、 bar 用 clang )
foo(int*): xorl %eax, %eax ret bar(): retq
访问已传递给 realloc 的指针
选择 clang 以观察所示输出
运行此代码
#include <iostream> #include <cstdlib> int main() { int *p = (int*)std::malloc(sizeof(int)); int *q = (int*)std::realloc(p, sizeof(int)); *p = 1; // UB :访问传递给 realloc 的指针 *q = 2; if (p == q) // UB :访问传递给 realloc 的指针 std::cout << *p << *q << '\n'; }
可能的输出:
12
无副作用的无限循环
选择 clang 以观察所示输出
运行此代码
#include <iostream> int fermat() { const int MAX = 1000; int a=1,b=1,c=1; // 无副作用的无限循环是 UB while (1) { if (((a*a*a) == ((b*b*b)+(c*c*c)))) return 1; a++; if (a>MAX) { a=1; b++; } if (b>MAX) { b=1; c++; } if (c>MAX) { c=1;} } return 0; } int main() { if (fermat()) std::cout << "Fermat's Last Theorem has been disproved.\n"; else std::cout << "Fermat's Last Theorem has not been disproved.\n"; }
可能的输出:
Fermat's Last Theorem has been disproved.
外部链接
- 每个 C 程序员都该知道关于未定义行为的事 #1/3
- 每个 C 程序员都该知道关于未定义行为的事 #2/3
- 每个 C 程序员都该知道关于未定义行为的事 #3/3
- 未定义行为能导致时间旅行(在所有事项中,时间旅行可是最惊人的)
- 了解 C/C++ 中的整数溢出
- 未定义行为与费马最后定理
- 空指针的趣事,第一部分 ( Linux 2.6.30 中空指针解引用所致的未定义行为所引发的局部滥用)