我想抓取 此页面上的单元格小部件 -> 数据网格: http://samples.gwtproject.org/samples/Showcase/Showcase.html#!CwDataGrid
理想情况下,我正在寻找 csv 样式的字符串输出,例如 (第一行和最后一行示例)
;Corey;Jenkins;63;Coworkers;438 Techwood St;
.... (many rows here)
;Yvonne;Morris;55;Family; 483 Third Pkwy;
(我正在使用 Firefox)
最佳答案
不确定您是否正在尝试执行此操作以在 gwt 网站上构建网站抓取工具。在上面的示例中,每一行在由 TR 标签表示的每个网格行中都有一个标识属性。对于第一个 TR 标记,您将拥有 __gwt_row="0"__gwt_subrow="0"
。
您还将拥有 __gwt_cell="cell-gwt-uid-29"
类型的单元格属性
行和单元格上的上述两个属性应该允许您轻松地进行 XPATH 查找和迭代以抓取页面并输出到 csv 文件中。
关于javascript - 从数据网格抓取/检索数据 - DOM 到 CSV 控制台输出,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30186042/