php - xpath为波斯字符获取html

标签 php xpath unicode persian

我使用以下方法获取了波斯网页的内部html:

private static function getInnerHTML($node)
{
    $innerHTML = "";
    $children = $node->childNodes;
    foreach ($children as $child) {
        $tmp_doc = new DOMDocument();
        $tmp_doc->appendChild($tmp_doc->importNode($child,true));
        $innerHTML .= $tmp_doc->saveHTML();
    }
    return $innerHTML;
}


当我在浏览器中看到源代码时,发现以下波斯字符:

گزارش

如何将该编码转换为常规波斯字符?

例如,此字符必须为:
گزارش

抱歉,我不知道该编码是什么,所以我之前无法搜索它。

谢谢。

最佳答案

根据我的评论,您需要的是html_entity_decode

$innerHTML .= html_entity_decode($tmp_doc->saveHTML());


DEMO

关于php - xpath为波斯字符获取html,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21822579/

相关文章:

php - 哪个更好? MySQL 中的磁盘文件缓存或临时表缓存

php - 使用 Paypal 引用付款创建结算协议(protocol)问题

Python打印Unicode字符

php - c# php 列出选定目录中的文件

xml - 在 XPath 中选择相反的条件?

xml - 如何将文字和变量放入标签中?

xml - 如何使用xpath检索节点的第X个特定位置?

java - 当我尝试包含乌尔都语字符串时,为什么会出现编译错误?

java - 如何使用 RandomAccessFile 读取 UTF8 编码的文件?

php - 尝试在使用回显行时将发送者和接收者与内部联合表分开