我在下面使用这段代码,但生成的图像已损坏。我认为可能是因为渲染选项。有人知道发生了什么事吗?
package webpageprinter;
import java.net.URL;
import java.awt.image.BufferedImage;
import javax.imageio.ImageIO;
import java.beans.PropertyChangeListener;
import java.beans.PropertyChangeEvent;
import javax.swing.text.html.*;
import java.awt.*;
import javax.swing.*;
import java.io.*;
public class WebPagePrinter {
private BufferedImage image = null;
public BufferedImage Download(String webpageurl) {
try
{
URL url = new URL(webpageurl);
final JEditorPane jep = new JEditorPane();
jep.setContentType("text/html");
((HTMLDocument)jep.getDocument()).setBase(url);
jep.setEditable(false);
jep.setBounds(0,0,1024,768);
jep.addPropertyChangeListener("page",new
PropertyChangeListener() {
@Override
public void propertyChange(PropertyChangeEvent e) {
try
{
image = new
BufferedImage(1024,768,BufferedImage.TYPE_INT_RGB );
Graphics g = image.getGraphics();
Graphics2D graphics = (Graphics2D) g;
graphics.setRenderingHint(RenderingHints.KEY_ANTIALIASING, RenderingHints.VALUE_ANTIALIAS_ON);
jep.paint(graphics);
ImageIO.write(image,"png",new File("C:/webpage.png"));
}
catch (Exception re)
{
re.printStackTrace();
}
}});
jep.setPage(url);
}
catch (Exception e)
{
e.printStackTrace();
}
return image;
}
public static void main(String[] args) {
new WebPagePrinter().Download("http://www.google.com");
}
}
最佳答案
我认为该代码中存在 3 个问题和一个脆弱性:
问题
JEditorPane
从未打算成为浏览器。setPage(URL)
异步加载。有必要添加一个监听器来确定页面何时加载。- 您可能会发现某些网站会自动拒绝与 Java 客户端的连接。
脆弱性
setBounds()
的调用包含脆弱性。使用布局。
400x600 图片
但是看这张图,好像3在这里不适用,2不是问题。归结为第 1 点。JEditorPane
从未打算用作浏览组件。底部的那些随机字符是 JavaScript,JEP 不仅没有编写脚本,而且在页面中显示不正确。
关于screenshot - 如何截取网页截图?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7032556/