c++ - 从字符串中提取单词 - 棘手的问题

标签 c++ string word

我需要帮助从 C++ 中的字符串中提取单词。在我要完成的练习的定义中,单词是由非字母或数字字符(例如,标点符号、空格等)包围的任何字母和数字序列。例如:

This.Is.a.String 

我的程序应该创建一个字符串 vector ,其中 vector 的元素是所提到的字符串中的单个单词,在本例中为“This”、“Is”、“a”、“String”。

我尝试使用 for 循环遍历给定的字符串并检查一个条件,即只要我们现在所在的字符是(按 ASCII 值)A 和 Z(a 和 z)以及数字 0 和9、把它变成一个字符串。接下来,将该字符串放入 vector 中并将字符串的大小调整为 0(以便我们可以输入另一个词。)这似乎不起作用...

vector<string> Function(string s) {
    char letter;
    string r;
    vector<string> vector_string;
     for(int i=0; i<s.length(); i++) {
        letter=toupper(s.at(i));  // I do this so all letters are capital letters, so it's easier to compare them
        r.resize(0);
   while((letter>=65 || letter<=90) && (letter>=48 || letter<=57)) {

        r.push_back(s.at(i));

    }
        vector_string.push_back(r);




}

 return vector_string;
  }

附言我对 C++ 很陌生。我知道这离解决方案还很远,但我必须从某个地方开始。如果你们中的任何人能帮助我在这里做什么,我将不胜感激!这有点令人沮丧。

感谢并抱歉占用您的时间!

最佳答案

你有一个无限循环。它的条件不正确。

这里有一个改进:

vector<string> split(string s) {
    char letter;
    vector<string> vector_string;

    for(int i=0; i<s.length(); ) {
        if (isalnum(s[i])) {
            string r; 
            do {  
               r.push_back(s[i++]);
            } while(i<s.length() && isalnum(s[i]));
            vector_string.push_back(r);
        }
        else i++; 
    }
    return vector_string;
}

Online demo

本修订版使用预定 isalnum() 在单词中使用字母数字字符。

为了编写更清晰的条件,作为一般规则,更喜欢在 <cctype> 中使用标准的字符分类谓词或者更好,他们的 locale-aware counterparts .

编辑:如果你可以使用正则表达式?

不确定您是否被允许,但代码如下所示:

vector<string> split(string s) {
    regex word_definition("([a-zA-Z0-9]+)");
    auto words_begin = sregex_iterator(s.begin(), s.end(), word_definition);
    auto words_end = sregex_iterator();

    vector<string> vector_string;
    for(auto i = words_begin; i!=words_end; i++) {
        vector_string.push_back(i->str());
    }
    return vector_string;
}

关于c++ - 从字符串中提取单词 - 棘手的问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55563347/

相关文章:

c++ - 错误 : passing ‘const string {aka const std::__cxx11::basic_string<char>}’ as ‘this’ argument

r - 如何将 `chartr` 转换为 "-"(或转义范围)?

php - 使用 PHP、javascript 或 jQuery 使图像中的所有相对路径 URL 成为完整路径

c++ - 激活智能指针?

c++ - XP 嵌入式 CRT 版本问题..LoadLibraryEx 失败

c++ - 将单词转换为字母c++的字母值

search - 在vim中,如何进行自定义字边界运动?

C#:我希望单词的每个字母都以新行开头

c++ - 在 Win32 静态库中加载 XAML (WinRT/C++) 窗口

c++ - std::chrono 重复调用 QueryPerformanceFrequency?