html - 每天从另一个网站抓取内容

标签 html parsing rss sync

这是我的问题。我正在创建一个具有“新闻”选项卡的网站。我在新闻标签上想要的是来自另一个新闻网站的更新内容。

有什么方法可以抓取其他网站上发布的纯文本,将其发布到我网站的新闻标签上,并在网站发布新内容时自动更新?任何人都可以将我推向正确的方向,以便我可以学习如何做到这一点吗?

我非常了解 HTML,但缺乏 PHP 和 Javascript 技能。我需要学习什么才能实现这一目标?

最佳答案

查找 Curl... 它在 php 中。 http://php.net/manual/en/book.curl.php

这里有一个不错的视频,可能与您想要实现的目标有关。 http://www.youtube.com/watch?v=PvEJz6du7R0

这里还有一些代码,使用curl获取网站的源代码。

<?php

$ch = curl_init("http://www.example-webpage.com/file.html");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_BINARYTRANSFER, true);
$content = curl_exec($ch);
curl_close($ch);
echo $content;

?>

做你想做的另一种方法是在 div 中使用 iframe...

<html>
<head>
<title></title>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">

<style type="text/css">
<!--
#container{
    width:300px;
    height:100px;
    border:1px solid #000; 
    overflow:hidden;
    margin-left:50%;
    margin-top:5%;

}
#container iframe {
    width:1000px;
    height:750px;
    margin-left:-734px;
    margin-top:-181px;   
    border:0 solid;
 }
-->
</style>

</head>
<body>

<div id="container">
<iframe src="http://www.w3schools.com/" scrolling="no"></iframe>
</div>

</body>
</html>

有些网站不允许您为他们的网站添加 iframe,因此这可能行不通。例如,您不能使用 iframe google、youtube、yahoo 和其他网站。

希望这对您有所帮助 :D

关于html - 每天从另一个网站抓取内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14388709/

相关文章:

javascript - 使用 Knockout 将 optionsText 绑定(bind)到具有对象数组的属性?

PHP 解析错误 : syntax error, 意外的 T_STRING,期待 T_FUNCTION

wcf - Rss20FeedFormatter 忽略 SyndicateItem.Summary 的 TextSyndicateContent 类型

javascript - 使用 Google Feeds API 访问远程 RSS 提要

javascript - 使用 Javascript 解析 Google 新闻 RSS

php - 嵌入式视频不显示

html - H3 比封闭的 div 占用更多空间

javascript - 如何重新加载javascript而不是页面

C++:解析一个 132x65 的二进制文件

python - 如果-else if-else语句,您将如何解析标准? (使用RPLY)