我正在尝试提取“KFC”等页面的母公司信息(在信息框 Pane 中)。
如果您访问
url...信息框包含属性(Parent = Yum! Brands)
..但是,当我通过 PHP API 访问时..不包含父信息。
我如何确保维基百科 API 也返回“Parent =”信息(对于“KFC”等品牌术语)。本质上,我想通过维基百科 API 提取 Yum Brands 是肯德基母公司的信息。
谢谢!
最佳答案
看看wikipedia wiki获取信息的官方方式。
我的建议是通过 PHP Simple HTML DOM Parser 使用屏幕抓取即使它已被弃用,它也永远是最好的。唯一的缺点是,如果维基百科改变了它的外观,您将不得不更新您的代码。
一个 guide PHP 简单 HTML DOM 解析器。
编辑:
至少我正在做一些事情,而不是链接到非工作资源并否决正确的答案......
下面是我使用 PHP 简单 HTML DOM 解析器从信息框 Pane 获取母公司信息的代码。
<?php
//The folder where you uploaded simple_html_dom.php
require_once('/homepages/../htdocs/simple_html_dom.php');
//Wikipedia page to parse
$html = file_get_html('http://en.wikipedia.org/wiki/KFC');
foreach ( $html->find ( 'tr th a[title=Holding company]' ) as $element ) {
$element = $element->parent;
$element = $element->parent;
$tabella = $element->find ( 'td', 0 );
//Now $parent contains "Yum! Brands"
$parent = $tabella->plaintext;
echo $parent;
}
?>
如果这个答案符合您的需求,请选择它为最佳答案并点赞,因为这花了我很多功夫,大约1个小时=/
谢谢;)
关于php - 维基百科 API - 从信息框获取完整信息,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21643142/