我有表结构:
<table class="c_order u_list">
<thead>
<tr>
</tr>
</thead>
<tbody>
<tr>
<td>
11.04.2017<br/>
18:20 </td>
<td><a target="_blank" href="/personal/order/detail/457/">A-457</a></td>
<td>+7 (917) 119-11-42</td>
<td>1685.20</td>
<td>
<a target="_blank" href="/resn/i/zda_2_1/">УШКА</a><br/>с. холмский, ул. Фрунзе, д. 11<br/>3477740087 </td>
<td>Принят</td>
</tr>
<tr>
<td>
11.04.2017<br/>
16:47 </td>
<td><a target="_blank" href="/personal/order/detail/47565/">A-47565</a></td>
<td>+7 (909) 556-77-99</td>
<td>2574.80</td>
<td>
<a target="_blank" href="/kir/a/an_10/">ООО "План"</a><br/>г. Омск, ул. 10-летия Победы, д. 3;<br/>8845701069 </td>
<td>Доставлен</td>
</tr>
</tbody>
</table>
我正在尝试使用我的 PHP 代码将其放入数组:
$page = curl_exec ($ch);
curl_close ($ch);
$dom = new DOMDocument();
libxml_use_internal_errors(true);
$dom->loadHTML($page);
libxml_clear_errors();
$xpath = new DOMXpath($dom);
$data = array();
// get all table rows and rows which are not headers
$table_rows = $xpath->query('//tr');
foreach($table_rows as $row => $tr) {
foreach($tr->childNodes as $td) {
echo $td->nodeValue;
$data[$row][] = preg_replace('~[\r\n]+~', '', trim($td->nodeValue));
}
$data[$row] = array_values(array_filter($data[$row]));
}
print_r($data);
但是我在数组中得到错误的结果(没有 href 标签),但我需要得到类似的结果,包括 td 元素中的所有标签:
Array
(
[0] => Array
(
[0] => 11.04.2017 18:20
[1] => <a target="_blank" href="/personal/order/detail/457/">A-457</a>
[2] => +7 (917) 119-11-42
[3] => 1685.20
[4] => <a target="_blank" href="/resn/i/zda_2_1/">УШКА</a><br/>с. холмский, ул. Фрунзе, д. 11<br/>3477740087
[5] => Принят
)
[1] => Array
(
[0] => 11.04.2017 16:47
[1] => <a target="_blank" href="/personal/order/detail/47565/">A-47565</a>
[2] => +7 (909) 556-77-99
[3] => 2574.80
[4] => <a target="_blank" href="/kir/a/an_10/">ООО "План"</a><br/>г. Омск, ул. 10-летия Победы, д. 3;<br/>8845701069
[5] => Доставлен
)
如何为数组键索引命名?因此,获取的不是 [0]
,而是 ['time']
。
最佳答案
在 DOMDocument
的构造函数中,将编码指定为 UTF-8
:
$dom = new DOMDocument('1.0', 'UTF-8');
要使 preg_replace()
函数安全地处理 UTF-8 字符串,您必须使用 u
修饰符:
$data[$row][] = preg_replace('~[\r\n]+~u', '', trim($td->nodeValue));
关于arrays - PHP Dom 解析表到数组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43372233/