C++ 参考手册
- C++11
- C++14
- C++17
- C++20
- C++ 编译器支持情况表
- 独立与宿主实现
- C++ 语言
- C++ 关键词
- 预处理器
- C++ 标准库头文件
- 具名要求
- 功能特性测试 (C++20)
- 工具库
- 类型支持(基本类型、RTTI、类型特性)
- 概念库 (C++20)
- 错误处理
- 动态内存管理
- 日期和时间工具
- 字符串库
- 容器库
- 迭代器库
- 范围库 (C++20)
- 算法库
- 数值库
- 输入/输出库
- 文件系统库
- 本地化库
- 正则表达式库
- std::sub_match
- std::match_results
- std::basic_regex
- std::regex_search
- std::regex_replace
- std::regex_iterator
- std::regex_match
- std::regex_token_iterator
- std::regex_token_iterator<BidirIt,CharT,Traits>::operator++, operator++(int)
- std::regex_error
- std::regex_traits
- std::regex_constants::syntax_option_type
- std::regex_constants::match_flag_type
- std::regex_constants::error_type
- 改 ECMAScript 正则表达式文法
- 注释
- 原子操作库
- 线程支持库
- 实验性 C++ 特性
- 有用的资源
- 索引
- std 符号索引
- 协程支持 (C++20)
- C++ 关键词
std::regex_token_iterator
定义于头文件 <regex>
|
||
template< class BidirIt, |
(C++11 起) | |
std::regex_token_iterator
是访问底层字符序列内每个正则表达式匹配的单独子匹配的只读遗留向前迭代器 (LegacyForwardIterator) 。它亦可用于访问不为给定的正则表达式所匹配的序列部分(例如作为记号化器)。
构造时,它构造一个 std::regex_iterator ,而在每次自增时,它走过请求的来自当前 match_results 的子匹配,并在自增离开上个子匹配时自增底层的 regex_iterator
。
默认构造的 std::regex_token_iterator
是序列尾迭代器。在抵达最后匹配的最后子匹配自增合法的 std::regex_token_iterator
时,它变得等于序列尾迭代器。进一步解引用或自增它引发未定义行为。
在恰好变为序列尾迭代器前,若请求的子匹配下标列表中出现 -1 (非匹配碎片),则 std::regex_token_iterator
可成为后缀迭代器。若解引用这种迭代器,则返回对应最后匹配和序列结尾之间的字符序列的 match_results 。
std::regex_token_iterator
的典型实现保有底层的 std::regex_iterator 、请求的子匹配下标的容器(例如 std::vector<int> )、等于子匹配下标的内部计数器、指向当前匹配的当前子匹配的指向 std::sub_match 指针和含有最近非匹配字符序列的 std::match_results 对象(用于记号化器模式)。
类型要求
-BidirIt 必须满足遗留双向迭代器 (LegacyBidirectionalIterator) 的要求。
|
特化
定义对常用字符序列类型的数个特化:
定义于头文件
<regex> | |
类型 | 定义 |
cregex_token_iterator
|
regex_token_iterator<const char*> |
wcregex_token_iterator
|
regex_token_iterator<const wchar_t*> |
sregex_token_iterator
|
regex_token_iterator<std::string::const_iterator> |
wsregex_token_iterator
|
regex_token_iterator<std::wstring::const_iterator> |
成员类型
成员类型 | 定义 |
value_type
|
std::sub_match<BidirIt> |
difference_type
|
std::ptrdiff_t |
pointer
|
const value_type* |
reference
|
const value_type& |
iterator_category
|
std::forward_iterator_tag |
regex_type
|
basic_regex<CharT, Traits> |
成员函数
构造新的 regex_token_iterator (公开成员函数) | |
(析构函数) (隐式声明) |
析构 regex_token_iterator ,包含缓存值 (公开成员函数) |
赋值内容 (公开成员函数) | |
(C++20 中移除) |
比较两个 regex_token_iterator (公开成员函数) |
访问当前子匹配 (公开成员函数) | |
推进迭代器到下一个子匹配 (公开成员函数) |
注意
程序员负责确保传递给迭代器构造函数的 std::basic_regex 对象活得久于迭代器。因为迭代器存储 std::regex_iterator ,它存储指向 regex 的指针,故在销毁 regex 后自增迭代器导致未定义行为。
示例
#include <fstream> #include <iostream> #include <algorithm> #include <iterator> #include <regex> int main() { std::string text = "Quick brown fox."; // 记号化(非匹配碎片) // 注意仅匹配二次 regex :在获得第三值时迭代器为后缀迭代器。 std::regex ws_re("\\s+"); // 空白符 std::copy( std::sregex_token_iterator(text.begin(), text.end(), ws_re, -1), std::sregex_token_iterator(), std::ostream_iterator<std::string>(std::cout, "\n")); // 迭代首个子匹配 std::string html = "<p><a href=\"http://google.com\">google</a> " "< a HREF =\"http://cppreference.com\">cppreference</a>\n</p>"; std::regex url_re("<\\s*A\\s+[^>]*href\\s*=\\s*\"([^\"]*)\"", std::regex::icase); std::copy( std::sregex_token_iterator(html.begin(), html.end(), url_re, 1), std::sregex_token_iterator(), std::ostream_iterator<std::string>(std::cout, "\n")); }
输出:
Quick brown fox. http://google.com http://cppreference.com