好吧,我放弃了。 我一直在想方设法从目标网站检索数据,该网站包含繁体中文编码 (charset=GB2312) 的信息。
我一直在像往常一样使用 simple_html_parser,但它似乎没有返回汉字,事实上我得到的只是一些嵌入在菱形形状内的奇怪问号。 ("��������ѯ�zh��֣�"像这样)
声明 php 文件的编码除了去掉页面开头显示的一些不需要的字符外没有做任何事情。
通过声明我的意思是:
header('Content-Type', 'text/html; charset=GB2312');
我无法获取任何用中文编写的数据,同样幸运地尝试了 file_get_contents
。我可能遗漏了一些明显的东西,因为我在其他地方找不到任何相关的讨论。
提前致谢。
最佳答案
您是否尝试过使用 mb_convert_encoding 转换编码?或 iconv ,例如
$str = mb_convert_encoding($content, 'UTF-8', 'GB2312');
或
$str = iconv("UTF-8", "GB2312//IGNORE", $content);
关于php - 获取带有汉字的PHP源码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2248532/