c++ - boost::spirit::qi 性能

我有以下片段。

#include <iostream>
#include <sstream>
#include <chrono>

#include <boost/spirit/include/qi.hpp>
#include <boost/spirit/include/classic.hpp>

namespace qi = boost::spirit::qi;
namespace classic = boost::spirit::classic;

template<typename T>
void output_time(const T& end, const T& begin)
{
   std::cout << std::chrono::duration_cast<std::chrono::seconds>(
         end - begin).count() << std::endl;
}

template<typename Iter>
struct qi_grammar : public qi::grammar<Iter>
{
   qi_grammar():qi_grammar::base_type(rule_)
   {
      rule_ = *string_;
      string_ = qi::char_('"') >> *(qi::char_ - '"') >> qi::char_('"');
   }
   qi::rule<Iter> rule_;
   qi::rule<Iter> string_;
};

template<typename Iter>
struct classic_grammar : public classic::grammar<classic_grammar<Iter>>
{
   template<typename ScannerT>
   struct definition
   {
      definition(const classic_grammar&)
      {
         rule = *string_;
         string_ = classic::ch_p('"') >> *(classic::anychar_p - '"') >> classic::ch_p('"');
      }
      classic::rule<ScannerT> rule, string_;
      const classic::rule<ScannerT>& start() const { return rule; }
   };
};

template<typename Iter>
void parse(Iter first, Iter last, const qi_grammar<Iter>& prs)
{
   auto start = std::chrono::system_clock::now();
   for (int i = 0; i < 100; ++i)
   {
      Iter next = first;
      if (!qi::parse(next, last, prs) || next != last)
      {
         assert(false);
      }
   }
   auto finish = std::chrono::system_clock::now();
   output_time(finish, start);
}

template<typename Iter>
void parse_c(Iter first, Iter last, const classic_grammar<Iter>& prs)
{
   auto start = std::chrono::system_clock::now();
   for (int i = 0; i < 100; ++i)
   {
      auto info = classic::parse(first, last, prs);
      if (!info.hit) assert(false);
   }
   auto finish = std::chrono::system_clock::now();
   output_time(finish, start);
}

int main()
{
   qi_grammar<std::string::const_iterator> qi_lexeme;
   classic_grammar<std::string::const_iterator> classic_lexeme;
   std::stringstream ss;
   for (int i = 0; i < 1024 * 500; ++i)
   {
      ss << "\"name\"";
   }
   const std::string s = ss.str();
   std::cout << "Size: " << s.size() << std::endl;
   std::cout << "Qi" << std::endl;
   parse(s.begin(), s.end(), qi_lexeme);
   std::cout << "Classic" << std::endl;
   parse_c(s.begin(), s.end(), classic_lexeme);
}

结果是

forever@pterois:~/My_pro1/cpp_pro$ ./simple_j 
Size: 3072000
Qi
0
Classic
1

因此，qi 解析速度比经典解析速度快。但是当我将 string_ 规则的属性更改为 std::string() (即 qi::rule<Iter, std::string()> string_; )时，我有

forever@pterois:~/My_pro1/cpp_pro$ ./simple_j 
Size: 3072000
Qi
19
Classic
1

它非常非常慢。我做错了什么？谢谢。

编译器:gcc 4.6.3。 boost - 1.48.0。标志:-std=c++0x -O2。在 LWS 上结果相同。

使用 char_ 的语义 Action ，即

string_ = qi::char_('"') >> *(qi::char_[boost::bind(&some_f, _1)] - '"')
 >> qi::char_('"')[boost::bind(&some_clear_f, _1)];

boost 性能，但我也在寻找另一种解决方案(如果存在的话)。

最佳答案

我想我之前在 SO 上回答过一个非常相似的问题。遗憾的是，我找不到它。

简而言之，您可能更愿意在源数据中使用迭代器，而不是在每个匹配项上分配(和复制)字符串。

使用时

qi::rule<Iter, boost::iterator_range<Iter>()> string_;
string_ = qi::raw [ qi::char_('"') >> *(qi::char_ - '"') >> qi::char_('"') ];

我得到了(相当大 (16x) 的数据集):

Size: 49152000
Qi
12
Classic
11

其实把规则本身改成

之后

  string_ = qi::raw [ qi::lit('"') >> *~qi::char_('"') >> '"' ];

我得到了

Size: 49152000
Qi
7
Classic
11

所以……我想这很不错。在 LWS 上查看:http://liveworkspace.org/code/opA5s$0

For completeness, obviously you can get a string from the iterator_range by doing something like
const std::string dummy("hello world");
auto r = boost::make_iterator_range(begin(dummy), end(dummy));
std::string asstring(r.begin(), r.end());

诀窍是将实际的字符串构建延迟到需要的时候。您可能想让这个技巧自动发生。这就是 Spirit Lex 对标记属性所做的。您可能想调查一下。

关于c++ - boost::spirit::qi 性能，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/14398445/

c++ - boost::spirit::qi 性能

上一篇：c++ - Qt项目如何集成flex和bison？

下一篇：c++ - 如何异步关闭套接字