我尝试使用 PhantomJSDriver 来抓取此 URL:http://www.tsetmc.com/loader.aspx?ParTree=151311&i=67126881188552864
1) 首先,在此 URL 中,我们必须单击上方的蓝色链接,名为:Samboقه
2) 然后我想废弃这个 XPath: //*[@id="trade"]/div[2]/table/tbody/tr[9]/td[7]
这是我的代码,但此代码找不到所需的 XPath:
var driverService = PhantomJSDriverService.CreateDefaultService();
var driver = new PhantomJSDriver(driverService);
driver.Url = "http://www.tsetmc.com/loader.aspxParTree=151311&i=67126881188552864";
driver.Navigate();
var source = driver.PageSource;
driver.FindElementByXPath("//*[@id=\"tabs\"]/div/ul/li[3]/a").Click();
Thread.Sleep(5000);
try
{
var pathElement = driver.FindElementByXPath("//[@id=\"trade\"]/div[2]/table/tbody/tr[9]/td[7]");
MessageBox.Show(pathElement.Text);
}
catch
{
driver.Dispose();
this.Close();
}
driver.Dispose();
最佳答案
我建议直接点击此网址:
http://members.tsetmc.com/tsev2/data/InstTradeHistory.aspx?i=67126881188552864&Top=999999&A=0
然后解析这些值,因为这基本上包含所有 209 页上的所有值,因此它也可以省去您从第 1 页 -209 页移动的麻烦。
看起来很容易被 ; 分割给出所有行,然后用 @ 分割给出每列的值。
关于c# - 抓取 JavaScript 动态生成的数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52098584/