C++ 参考手册
- C++11
- C++14
- C++17
- C++20
- C++ 编译器支持情况表
- 独立与宿主实现
- C++ 语言
- C++ 关键词
- 预处理器
- C++ 标准库头文件
- 具名要求
- 功能特性测试 (C++20)
- 工具库
- 类型支持(基本类型、RTTI、类型特性)
- 概念库 (C++20)
- 错误处理
- 动态内存管理
- 日期和时间工具
- 字符串库
- std::basic_string
- std::basic_string_view
- 空终止字节字符串
- 空终止多字节字符串
- std::mbsinit
- std::mbtowc
- std::mbstowcs
- std::btowc
- std::c8rtomb
- std::mbrtoc8
- std::mbrtowc
- std::mbsrtowcs
- std::mbrtoc16
- std::mbrtoc32
- std::mblen
- std::wctomb
- std::wcstombs
- std::wctob
- std::wcrtomb
- std::wcsrtombs
- std::c16rtomb
- std::c32rtomb
- std::mbrlen
- std::mbstate_t
- 空终止宽字符串
- std::char_traits
- 注释
- 容器库
- 迭代器库
- 范围库 (C++20)
- 算法库
- 数值库
- 输入/输出库
- 文件系统库
- 本地化库
- 正则表达式库
- 原子操作库
- 线程支持库
- 实验性 C++ 特性
- 有用的资源
- 索引
- std 符号索引
- 协程支持 (C++20)
- C++ 关键词
std::mbrtoc8
定义于头文件 <cuchar>
|
||
std::size_t mbrtoc8( char8_t* pc8, const char* s, |
(C++20 起) | |
转换窄多字节字符为 UTF-8 编码。
若 s
不是空指针,则审视始于 s
所指向字符的多字节字符串的至多 n
个字节,以确定完成下个多字节字符所需的字节数(包含任何迁移序列)。若函数确定 s
中的下个多字节字符完整且合法,则将它转换成 UTF-8 并存储首个 UTF-8 编码单元于 *pc8 (若 pc8
非空)。
若 *s
中的多字节字符的 UTF-8 编码由多于一个 UTF-8 编码单元组成,则在首次调用此函数后更新 *ps
,以使得下次调用 mbrtoc8
会写出另外的 UTF-8 编码单元,而不考虑 *s
。
若 s
为空指针,则忽略 n
与 pc8
的值,而调用等价于 std::mbrtoc8(NULL, "", 1, ps) 。
若产生的 UTF-8 编码单元为 u8'\0' ,则转换状态 *ps 代表初始迁移状态。
此函数所用的多字节编码由当前活跃的 C 本地环境指定。
参数
pc8 | - | 指向将写入生成的 UTF-8 编码单元的位置的指针 |
s | - | 指向用作输入的多字节字符串的指针 |
n | - | s 中能检验的字节数上的限制
|
ps | - | 指向转译多字节字符串时使用的转换状态对象的指针 |
返回值
下列的首个成立者:
- 0 ,若从
s
转换(而若 pc8 非空则存储于 *pc8 )的字符是空字符。 - [1...n] ,从
s
成功转换的多字节字符的字节数。 - -3 ,若现在已将来自由多个编码单元组成的字符的下个 UTF-8 编码单元写入 *pc8 。此情况下不处理来自输入的字节。
- -2 ,若下
n
个字节组成不完整但到此仍合法的多字节字符。不写入任何内容到 *pc8 。 - -1 ,若编码错误出现。不写入任何内容到
*pc8
,存储值 EILSEQ 于 errno ,而 *ps 的值未指定。
示例
本节未完成 原因:暂无示例 |
参阅
(C++20) |
转换 UTF-8 字符串为窄多字节编码 (函数) |