Javascript:如何从网页中检索文本

标签 javascript html dom text web

我想以字符串的形式检索网页中的文本。这可能吗? 我是 Javascript 的新手。

例如:

var url = "http://en.wikipedia.org/wiki/Programming";
var result = url.getText();  <---- stores text as a string
document.write(result);

如何编写 getText 方法?整个 HTML 源代码(我可以用它来获取文本)或只是文本。我想在 Web 浏览器中执行此操作。

我试过了,我能够得到一个索引号:

var url = "http://www.youtube.com/results?search_query=cat&page=2";
var result;
function go(){
    result = url.search(/cat/i);
    document.write(result);
}

这给了我 44 的索引。这意味着可以读取页面。我可以反其道而行之,输入索引来检索文本吗?

最佳答案

如果 Ajax/跨域情况对您来说不是问题,您可以提取网页的文本

var el = document.body; // or some other element reference
var text = el.innerText || el.textContent;

如果您需要从与您的应用程序位于同一域的页面中读取文本,您可以直接使用 Ajax。

如果您需要从域外的页面读取文本,则必须跳过一些额外的步骤,例如设置代理服务器或处理 CORS - http://en.wikipedia.org/wiki/Cross-origin_resource_sharing

关于Javascript:如何从网页中检索文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13205289/

相关文章:

javascript - 如何通过三元运算符使用多个条件

javascript - jQuery:将 img alt 标签更改为列表值

javascript - 为什么这个函数返回真?

html - Bootstrap css navbar-inverse 下拉列表如何更改复选框标签文本的颜色

javascript - 使用纯JS找出点击了哪个DOM元素

javascript - 无法读取 Google Oauth 中未定义的属性 'authorize'?

html - 多页粘性页脚

html - 背景 100%

javascript - UIWebView stringByEvaluatingJavaScriptFromString 问题

java - cvc-复杂类型.3.2.2 : Attribute xsi:schemaLocation is not allowed to appear in <people> in Java DOM