我想以字符串的形式检索网页中的文本。这可能吗? 我是 Javascript 的新手。
例如:
var url = "http://en.wikipedia.org/wiki/Programming";
var result = url.getText(); <---- stores text as a string
document.write(result);
如何编写 getText 方法?整个 HTML 源代码(我可以用它来获取文本)或只是文本。我想在 Web 浏览器中执行此操作。
我试过了,我能够得到一个索引号:
var url = "http://www.youtube.com/results?search_query=cat&page=2";
var result;
function go(){
result = url.search(/cat/i);
document.write(result);
}
这给了我 44 的索引。这意味着可以读取页面。我可以反其道而行之,输入索引来检索文本吗?
最佳答案
如果 Ajax/跨域情况对您来说不是问题,您可以提取网页的文本
var el = document.body; // or some other element reference
var text = el.innerText || el.textContent;
如果您需要从与您的应用程序位于同一域的页面中读取文本,您可以直接使用 Ajax。
如果您需要从域外的页面读取文本,则必须跳过一些额外的步骤,例如设置代理服务器或处理 CORS - http://en.wikipedia.org/wiki/Cross-origin_resource_sharing
关于Javascript:如何从网页中检索文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13205289/