我需要一个 PHP 脚本,它获取一个网页的 URL,然后回显一个词被提及的次数。
例子
这是一个通用的 HTML 页面:
<html>
<body>
<h1> This is the title </h1>
<p> some description text here, <b>this</b> is a word. </p>
</body>
</html>
这将是 PHP 脚本:
<?php
htmlurl="generichtml.com";
the script here
echo(result);
?>
所以输出将是这样的表格:
WORDS Mentions
This 2
is 2
the 1
title 1
some 1
description 1
text 1
a 1
word 1
这就像搜索机器人在网上冲浪时所做的那样,所以,知道如何开始,或者更好的是,您是否有一个已经执行此操作的 PHP 脚本?
最佳答案
在从您的字符串中去除所有 HTML 标签后,下面的一行将不区分大小写地计算字数。
print_r(array_count_values(str_word_count(strip_tags(strtolower($str)), 1)));
要获取页面的源代码,您可以使用 cURL或 file_get_contents()
$str = file_get_contents('http://www.example.com/');
由内而外:
- 使用strtolower()使所有内容都小写。
- 使用 strip_tags() 剥离 HTML 标签
- 使用 str_word_count() 创建一个单词数组.参数
1
返回一个数组,其中包含在字符串中找到的所有单词。 - 使用array_count_values()通过计算单词数组中每个值的出现次数来捕获多次使用的单词。
- 使用print_r()显示结果。
关于php - 使用 php 计算 html 网页上的字数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3485673/