如何在 Delphi 中将带有图像的 RichText (RTF) 文档转换为 HTML? | 珊瑚贝

How to convert RichText (RTF) document with images into HTML in Delphi?


我一直在努力寻找一个免费的(最好是开源的)组件或库,它允许将带有嵌入图像的 RTF 文件转换为 HTML 文件和图像文件或更好的 HTML 和图像流。

无论是 DLL 库还是 Delphi 组件,完美的解决方案都允许使用回调将数据流式传输到 IStream/TStream,因此我将能够将图像转换并保存为选择的格式,返回图像文件相对名称用于将 RTF 解析器包含在生成的 HTML 文件中,但按原样保存也很好,尤其是在代码开源时。

我遇到过商业解决方案,但我很难考虑它们,因为(相对)简单地将一种文档类型转换为另一种文档类型的价格非常高,而且这两种格式都有 20 年的历史,这表明必须有现有的库(本地、未管理)进行此类转换。

如果我找不到解决方案,我可能会将此代码转换为 Delphi dll 并使其可用,但也许有人已经这样做了?

编辑:

我们决定使用前面提到的 .Net RtfConverter 编译为 DLL,从中生成 Delphi TLB 单元并强制客户安装 .Net 框架(嵌入在安装程序中)。现在转换就像一种魅力,另一个迹象表明是时候从 Delphi 转到 .Net…

  • RTF 规范并不简单,转换也不像看起来那么简单。实际的 RTF 文档比带有一些粗体和斜体的简短文本片段更复杂。考虑 Unicode 和本地化以及多种字体和 CSS 以及页眉和页脚以及段落格式以及表格和嵌套表格等。除了一些将 RTF 转换为 HTML 的商业软件工具之外,并非所有的商业软件工具都物有所值。我还没有写过一个,但我用过一个,它的价格是 499 美元,现在可以在托管代码版本(100% C#)中使用。
  • 对于这种转换,也许简单不是正确的描述,但是 RTF 标记列表非常有限,Windows 和 Delphi 都有处理国际字符的工具。我也考虑使用转义 < 和 > 字符的 unicode 格式保存 HTML 文件。我在问题中提到的库是托管 C# 代码中的一个工作解决方案,我试图避免使用它来保持应用程序依赖关系尽可能低。
  • 商业 RTF 到 HTML 转换器的起价约为 130 美元(无版税) – 包括完整的 Delphi 源代码
  • mjn:您想发布对这个商业 Delphi 转换器的参考吗?如果没有免费的开源 Delphi/C 转换器,并且将 codeproject.com/KB/recipes/RtfConverter.aspx 转换为 Delphi 会出现问题,我肯定会考虑将其作为最后的手段。


用于将 RTF 转换为 HTML 4.01 / HTML5 和将 RTF 转换为各种 XHTML 风格的商业转换器是用于 Delphi 的 ScroogeXHTML。 5.0 版包括改进的图片支持,以及 WMF 到 PNG 转换的示例代码。 (我是这个组件的开发者,也是 Java 平台对应的组件)。

  • 谢谢你的链接。我将等待更长的时间来寻找可能的免费解决方案,因为它看起来很有希望。你有任何计划包括表格/列表支持吗?
  • 支持简单的编号和未编号列表,但表格不太适合内部中间文档表示,需要重新设计(但正在考虑中)


如果您可以使用 microsoft office 打开 RTF 然后在后台将其另存为 HTML,那么我相信这是您最好的解决方案,只需使用 OLE 在后台启动 Microsoft Word 实例,加载 RTF 然后导出它作为 HTML…

  • 不幸的是,这需要在机器上安装价值几百美元/英镑/……的商业产品。
  • 我对此表示同意 110%,但是大多数用户倾向于安装 Office,因此如果您的目标是特定客户并且他拥有 Office 套件,那么我建议您使用此功能,否则您将不得不进行更多搜索并自行实施。 ..
  • @PA取决于toos的截止日期和其他东西,你可以称之为”两个问题”或(永久/临时)”胜利”
  • 我可能假设客户已经安装了 Office 套件,以实现对 Office 的这种转换依赖,不管保证的兼容性和转换质量(如果您可以将 Word 生成的 HTML 视为兼容且质量好)可能被视为不必要的复杂性,并且可能被视为替代本机代码转换器应该在两种格式存在 2 年之后才存在。它也可能是 RTF -> DOC -> HTML 路径,因为 DOC 更受欢迎。
  • @too 你可能也想看看 Open Office 套装,它可能有一些 *.DLLs 可以进行转换


P.S:我是这个产品的开发者。

这是一个将 RTF 转换为 HTML 3.2、4.01、XHTML 1.01 和 HTML 5 的商业 .Net 库。它

支持转换表格和嵌套表格、有序列表和项目符号列表、嵌入 HTML、Unicode、特殊 HTML 符号等的图像。

这是 C# 中的示例代码:

1
2
3
4
        SautinSoft.RtfToHtml r = new SautinSoft.RtfToHtml();
        r.OutputFormat = SautinSoft.RtfToHtml.eOutputFormat.HTML_5;
        r.ImageStyle.IncludeImageInHtml = true;
        r.ConvertFile(@“d:\\document.rtf,@“d:\\html5.htm);
  • 链接坏了。自 2012 年以来,作者一直没有上过 SO。这个答案应该被删除。


来源:https://www.codenong.com/4667658/

微信公众号
手机浏览(小程序)

Warning: get_headers(): SSL operation failed with code 1. OpenSSL Error messages: error:14090086:SSL routines:ssl3_get_server_certificate:certificate verify failed in /mydata/web/wwwshanhubei/web/wp-content/themes/shanhuke/single.php on line 57

Warning: get_headers(): Failed to enable crypto in /mydata/web/wwwshanhubei/web/wp-content/themes/shanhuke/single.php on line 57

Warning: get_headers(https://static.shanhubei.com/qrcode/qrcode_viewid_9578.jpg): failed to open stream: operation failed in /mydata/web/wwwshanhubei/web/wp-content/themes/shanhuke/single.php on line 57
0
分享到:
没有账号? 忘记密码?