我正在研究 2 pdf Compare,其中 1st 我提取 PDF 以获得 PDF 样式。PDF 样式被提取并转换为 html。最后我比较了 2 个 HTML 文本。
对于 PDF 提取,我使用了 itextsharp
这是代码
this.result.AppendFormat(
"<tr><td>{0}</td><td>{1}</td><td>{2}pt</td><td>{3}</td><td>{4}</td><td>",
Form1.j, curFont, font_size_client, fontweight, fontstyle);
}
this.result.Append(renderInfo.GetText());
}
public string GetResultantText()
{
if (result.Length > 0)
{
result.Append("<tr><td></td><td></td>");
}
return result.ToString();
}
这是我用于转换的代码。我的问题是一个示例 PDF,我使用 HTML 教科书本身来比较文本。在 HTMLbook 中有一些样式,如背景颜色,字体大小附加到文本。它采用了样式而不是文本。你能告诉我如何提取样式吗?是我选择比较 2 个 PDF 的方法是错误的。或任何其他方法。
最佳答案
关于c# - 两个 HTML 的比较,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16910208/