使用PDF4NET实现双层PDF的制作

原创|其它|编辑:郝浩|2012-10-18 14:28:03.000|阅读 697 次

概述:所谓双层PDF就是每一页都包含两层,上层是图像,下层是该图像对应的文字。既可以像图像一样浏览,又可以像文字一样复制、查找。这样兼顾了阅读的效果和使用方便性。

所谓双层PDF就是每一页都包含两层,上层是图像,下层是该图像对应的文字。既可以像图像一样浏览,又可以像文字一样复制、查找。这样兼顾了阅读的效果和使用方便性。

在Google里面搜索,大多数双层PDF制作方法都是使用OCR技术实现的。这些方法的制作前提是,原始的数据只是图片,不存在对应的文字版。这不在本文的讨论范围内,本文主要探讨如何对已经拥有文字版的word或者其他文件的情况下,制作双层PDF。具体来说就是存在一个排版好的word文件,将这个word文件制作成一个双层PDF。

闲话少说,具体的制作过程如下

1、将文字版的文件(word)转换为以文本方式存储的PDF文件,这个使用PDFCreator采用虚拟打印的方式即可实现。这里暂定该文件的名称为"w.pdf"。

2、将创建的的文本方式的存储的PDF文件(w.pdf),转换为以图片方式存储的PDF文件。这个可以用PDFCreator的虚拟打印机,先打印成TIFF格式的文件,再将这个TIFF文件虚拟打印成一个PDF的方式实现,这里暂定该图片方式的PDF文件名为“p.pdf”。

3、将文字方式存储的PDF文件和图片方式存储的PDF文件采用按页合并的方式生成一个新的PDF文件,其中图片方式的PDF在上层。这个采用PDF4NET 3.3.6 进行二次开发的方式实现。以下代码为visual studio 2005环境下,使用C#编写。

(1)将O2S.Components.PDF4NET.dll添加到工程的引用中

(2)添加命名空间的引用

using O2S.Components.PDF4NET;
using O2S.Components.PDF4NET.PDFFile;
using O2S.Components.PDF4NET.Graphics;

(3) 编写代码如下:

string startTime = System.DateTime.Now.ToString();

            //File1为文字格式的PDF文件
            PDFFile File1 = PDFFile.FromFile(@"d:/w.pdf");
            //File2为图片格式的PDF文件
            PDFFile File2 = PDFFile.FromFile(@"d:/p.pdf"); 
            if(File1.PagesCount!=File2.PagesCount){
                MessageBox.Show("Two pdf files with diffrent pages");
                return;
            }
            PDFDocument doc = new PDFDocument(); 
            for (int i = 0; i < File1.PagesCount; i++)
            {
                PDFImportedContent ic1 = File1.ExtractPageContent(i);
                PDFImportedContent ic2 = File2.ExtractPageContent(i);
                PDFPage NewPage = doc.AddPage();
                PDFLayer NewLayer = NewPage.Canvas.Layers.Add("Page" + i.ToString());
                NewLayer.Canvas.DrawImportedContent(ic1, ic1.X, ic1.Y, ic1.Width, ic1.Height);
                NewLayer.Canvas.DrawImportedContent(ic2, ic2.X, ic2.Y, ic1.Width, ic1.Height);
                doc.AddPage(NewPage);
            }
            //不知道为什么,合成后的PDF的同一页都包含两份,因此这里需要依次移除其中的一个
            if (doc.Pages.Count == File1.PagesCount * 2)
            {
                for (int i = doc.Pages.Count - 1; i > 0; i -= 2)
                {
                    doc.Pages.RemoveAt(i);
                }
            }
            //保存合成后的PDF到文件
            doc.SaveToFile(@"d:/123.pdf");
            MessageBox.Show("开始时间:" + startTime + "结束时间:" + System.DateTime.Now.ToString());

 PS:试用版的PDF4NET会每一页的顶部添加一行红色的字。PDF4NET还有很多其他的功能,很强大的哦。



标签:

本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动成果

文章转载自:Togis的专栏——CSDN

登录 慧都网发表评论


暂无评论...

为你推荐

  • 推荐视频
  • 推荐活动
  • 推荐产品
  • 推荐文章
  • 慧都慧问
相关厂商
相关产品
PDF4NET

PDF4NET是一种.NET库,它能够对运行中的任意.NET应用程序进行创建、编辑和填充PDF文档。

在线
客服
在线
QQ
电话
咨询
400-700-1020
购物车 反馈 返回
顶部
在线客服系统
live chat