php - 使用 php 计算 html 网页上的字数

标签 php html scripting bots

我需要一个 PHP 脚本,它获取一个网页的 URL,然后回显一个词被提及的次数。

例子

这是一个通用的 HTML 页面:

<html>
<body>
<h1> This is the title </h1>
<p> some description text here, <b>this</b> is a word. </p>
</body>
</html>

这将是 PHP 脚本:

<?php
htmlurl="generichtml.com";
the script here
echo(result);
?>

所以输出将是这样的表格:

WORDS       Mentions
This        2
is          2
the         1
title       1
some        1
description 1
text        1
a           1
word        1

这就像搜索机器人在网上冲浪时所做的那样,所以,知道如何开始,或者更好的是,您是否有一个已经执行此操作的 PHP 脚本?

最佳答案

在从您的字符串中去除所有 HTML 标签后,下面的一行将不区分大小写地计算字数。

Live Example

print_r(array_count_values(str_word_count(strip_tags(strtolower($str)), 1)));

要获取页面的源代码,您可以使用 cURLfile_get_contents()

$str = file_get_contents('http://www.example.com/');

由内而外:

  1. 使用strtolower()使所有内容都小写。
  2. 使用 strip_tags() 剥离 HTML 标签
  3. 使用 str_word_count() 创建一个单词数组.参数 1 返回一个数组,其中包含在字符串中找到的所有单词。
  4. 使用array_count_values()通过计算单词数组中每个值的出现次数来捕获多次使用的单词。
  5. 使用print_r()显示结果。

关于php - 使用 php 计算 html 网页上的字数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3485673/

相关文章:

php - HTML 不显示字符

html - 将没有固定宽度或高度的 div 中的内容居中

javascript - 如何使用其他 Javascript 数组 li 动态加载 Li 元素

javascript - POST 后隐藏 DIV

php - 在 php 中自动刷新而不提交任何内容..?

java - 如何在同一个面板 Extjs 4.2 中多次使用相同的 xtype?

sql - 在脚本中运行 sql 查询时抑制消息

c - C 中的 gets 函数不通过命令行读取脚本 perl 或 python

php - 如何使用 PHP 高效地将数百万个数据集插入 MySQL 数据库?

javascript - 带有视差的页面加载位置奇怪