INFORMATION

首页   /   印刷知识

INFORMATION

首页   /   新闻中心

断版书的数据处理技术要点

发布时间:2020/10/20

按需出版印刷是近年来热议的话题。数字印刷技术改变了先印后卖的传统出版模式,降低了库存成本,同时也满足了印制需求小的专业性图书的出版,以及馆藏古籍书的再版,使得有价值的文献资料得以延续供更多人学习借鉴。纸张易风化、霉变、蛀虫,因此纸质图书的存储条件要求高,特别是年代较长的馆藏书,如保管不善,就可能造成文化的遗失,所以有关机构发起了数字出版项目,筛选有价值的断版古籍书进行数字化复制,一是建立电子图书数据库,二是根据市场需求,提供按需印刷服务。


  图书数字化大致有影印出版和电子出版两种类型。影印出版指的是将图书扫描或拍照,生成图像格式文件,经图像修复处理后生成电子书。该类型的复制书与原版基本无差别,生产成本较低,缺点是不能进行内容检索。电子出版指的是使用OCR(光学字符识别)技术,把纸质图书资料转化为多种格式的原式原样的电子图书,通过先进的生产流程管理系统,将文本的错误率控制在一定范围内,达到出版质量的水平。电子出版的图书可实现全文内容检索,但是工序多、工艺复杂、成本高。本文将重点探讨断版书影印出版的数字化复制。


  影印出版的数据处理流程包含图书扫描、图像数据处理、文件串联、文件存储等步骤。


  一、图书扫描


  1.选择适宜的扫描设备


  扫描是数据处理的第一步,也是最关键步骤。通过扫描获得的原始数据质量的好坏决定了最终成书的质量高低。因此,我们要根据图书的特性选择适宜的扫描设备,尽量做到在保证数据质量的同时提高扫描效率。


  (1)对于可复原的图书,如图书完整,纸张性能较好,采取线装、平订、无线胶订等装订方式的图书,经拆书后使用自动扫描仪扫描。自动扫描仪一般速度较快,设定好参数即可自动进纸,每分钟约扫描60~80页A4幅面,大大节省了人力和时间。


  (2)对于不可复原的图书,如采取锁线胶订、精装等装订方式的图书,使用零边距平板扫描仪。这种扫描仪扫描速度相对较慢,生产成本较高。


  (3)珍贵的善本或破损严重的图书,则建议使用数码相机进行拍照或使用非接触式扫描仪获取图像,以免对图书造成破坏。


  2.扫描分辨率的设定


  按需印刷的图书一般使用数字印刷设备进行印制。目前数字印刷机中设定的模拟加网线数有120lpi、150lpi、175lpi、200lpi等,对于再版图书,我们用175lpi输出即可满足印制要求,因此,扫描时的输入分辨率可设定为300~350dpi。


  3.其他扫描注意事项


  (1)图书中有幅面较大、超出扫描仪范围的文件时,可分为几部分扫描,最后使用Photoshop等软件进行拼接处理,形成完整的图像。


  (2)可拆卷处理的图书加工过程中应注意不伤及页面、损坏原文、不丢页、混页。对原书页面的褶皱、折角、折痕要提前进行平整处理,对破损部分进行裱糊处理,以防止在扫描工序中对纸张造成二次伤害。


  (3)特殊页扫描:筒子页中存在透纸现象时,可以在筒子页中间插入白纸后进行扫描,有条件时,可选择插入宣纸。插入时注意不要破坏筒子


  页,造成纸张撕裂。


  4. 扫描后的检查


  扫描后应对原始数据进行检查,查看扫描数据与提供的书目目录是否一致。重点需检查的内容包括:图书数据所在文件夹号、书名、著译者、出版地、出版单位、出版时间、页数、开本等。还有图书的必备部件(包括封面、封底、扉页、目录、内文、版权页、插页)是否完整;图片文件质量是否合格,分辨率、图像色彩模式是否正确。


  二、图像数据处理


  (一)封面文件处理


  1.在制作之前需确定开本、装订方式以及装订方向。可以根据内文信息把不同开本、装订方式的书目在清单中用不同颜色标记,减少出错率,再根据内文总页数和正式印刷时所用纸张材料来大致推算书脊厚度,为封面制作做好准备工作。


  2.将封面文件提取并存储为单页的Tiff文件,使用Photoshop软件进行处理。如没有封面,可查看扉页是否可以替代封面文件。


  3.封面处理注意事项


  (1)去网处理:图书作为印刷品原稿,本身有加网,我们通过去网处理,以消除网点痕迹,使复制书具有较好的图像效果。


  (2)断版书多数是旧书、古籍书,纸张年久发黄,扫描得到的图像偏黄,需通过图像调节中“色阶”功能将图像调成白底。


  (3)一些残缺或有脏点的地方可用“仿制图章”或“修复画笔”来修复图像或去除脏点。用这两个工具时要注意画笔的软硬程度,尽量选择软画笔,保持图像的自然过渡。


  (4)封一、封四分开扫描时,可能颜色存在偏差,可用“色相饱和度”工具调节,尽量保持一致。同时注意,扫描的数据没有出血,必须扩大页面尺寸将出血做好,以方便后加工。如封面为纯色底图,可直接将四周颜色外延添加出血;若是图案或渐变等不宜制作的文件,可略微等比例扩大图像尺寸,保证有1.5~2mm左右出血量。


  (5)书脊内容(书名、著作者、出版社)被标签遮挡,应从封面、版权页或书目清单上查看是否有相关信息,然后手动录入添加。


  (6)条形码制作:扫描的条形码清晰度较差,建议使用专用条形码生产软件重新制作。以上修复的过程中要遵循一个原则:尽量与原


  书保持一致。


  (二)内文数据处理


  1.版面去脏:周空去脏,版心行间大污点去除。图书若为图书馆藏书,内文中可能会有馆藏红章等标记,应注意去除。


  2.调整版面尺寸:统一版面尺寸,特别对于套装图书、系列图书,必须保证尺寸一致。


  3.按标准进行版面纠偏:调整版心角度,将扫描中产生的偏差修正,一般不超过1度。对方向不正确的图像进行旋转还原。


  4.版心对齐:将全书数据的版心按统一标准对齐。


  5.图像清晰度:图像页面中出现的影响图像质量的杂点如黑点、黑线、黑框、黑边等应进行去污处理。


  6.文字处理:采用锐化功能,清晰字迹笔画。保证无断划、缺划。在正常电分(为传统印刷准备)时USM sha画册印刷rp的数值大约为5~6,在为数字印刷准备图片时需增加到7~8。


  7.插页处理:在扫描时,为提高效率,白页可能会直接跳过,所以,在处理内文数据时,需要特别注意确认在文中哪些需要背白的位置应插入空白页。原则为:


  (1)扉页在前且后面无版权页时,在扉页后插入白页。


  (2)前言、目录、序、正文、后记等大的图书组件的起始页如位于偶数页码时,在其前面插入空白页。


  (3)单页插图如位于奇数页时,后面插入空白页;集中式插图的最后一幅插图如位于奇数页,在其后面插入空白页。


  三、文件串联


  顾名思义,文件串联即将处理好的内文数据组合成完整的电子书。串联时注意检查图书各部分内容是否完整,保证无缺页、重页、页码顺序颠倒的情况。为方便印刷和装订环节的封面与内文配套,以及数据核对,可将书目名称或对应的编号作为暗码添加在文件的裁切线外作为标识。


  串联后,还应对数据进行抽查。抽查内容包括:检查去脏质量,包括周空、行间大污点;检查版面尺寸是否标准、统一;检查版心是否对齐;检查数据存储方式是否正确。


  四、数据文件存储


  数据文件存储包含:图书扫描原始数据和处理后可印刷数据。如在印刷环节发现处理后数据存在质量问题,可立即调出扫描原始数据重新进行图像处理。一般可印刷数据存储为PDF格式。存储后应检查是否有坏死文件、是否携带病毒。


  断版书的数据处理是一项较为复杂的工作,除了文中提及的印刷专业操作外,还要做好数据库平台的搭建、数字化工作流程的优化等,才能使得图书的数字化进入规模化生产。影印出版相对于电子出版工艺较简单,多用于断版古籍书的再版。目前,熟练的图像数据处理员一天能处理1000~1500页数据,然而,他们在筛选、调用、检查相应的书目时却要耗费很长时间。由此可见,断版书再版的技术难题,不在于图像数据处理,不在于选用何种输出设备,而在于如何管理好图像数据,保证在客户需要定制时,第一时间响应。因此,我们仍需继续努力攻坚克难,让更多更好的文化精髓为世人传承,做一名真正的印刷人。


按需出版印刷是近年来热议的话题。数字印刷技术改变了先印后卖的传统出版模式,降低了库存成本,同时也满足了印制需求小的专业性图书的出版,以及馆藏古籍书的再版,使得有价值的文献资料得以延续供更多人学习借鉴。纸张易风化、霉变、蛀虫,因此纸质图书的存储条件要求高,特别是年代较长的馆藏书,如保管不善,就可能造成文化的遗失,所以有关机构发起了数字出版项目,筛选有价值的断版古籍书进行数字化复制,一是建立电子图书数据库,二是根据市场需求,提供按需印刷服务。


  图书数字化大致有影印出版和电子出版两种类型。影印出版指的是将图书扫描或拍照,生成图像格式文件,经图像修复处理后生成电子书。该类型的复制书与原版基本无差别,生产成本较低,缺点是不能进行内容检索。电子出版指的是使用OCR(光学字符识别)技术,把纸质图书资料转化为多种格式的原式原样的电子图书,通过先进的生产流程管理系统,将文本的错误率控制在一定范围内,达到出版质量的水平。电子出版的图书可实现全文内容检索,但是工序多、工艺复杂、成本高。本文将重点探讨断版书影印出版的数字化复制。


  影印出版的数据处理流程包含图书扫描、图像数据处理、文件串联、文件存储等步骤。


  一、图书扫描


  1.选择适宜的扫描设备


  扫描是数据处理的第一步,也是最关键步骤。通过扫描获得的原始数据质量的好坏决定了最终成书的质量高低。因此,我们要根据图书的特性选择适宜的扫描设备,尽量做到在保证数据质量的同时提高扫描效率。


  (1)对于可复原的图书,如图书完整,纸张性能较好,采取线装、平订、无线胶订等装订方式的图书,经拆书后使用自动扫描仪扫描。自动扫描仪一般速度较快,设定好参数即可自动进纸,每分钟约扫描60~80页A4幅面,大大节省了人力和时间。


  (2)对于不可复原的图书,如采取锁线胶订、精装等装订方式的图书,使用零边距平板扫描仪。这种扫描仪扫描速度相对较慢,生产成本较高。


  (3)珍贵的善本或破损严重的图书,则建议使用数码相机进行拍照或使用非接触式扫描仪获取图像,以免对图书造成破坏。


  2.扫描分辨率的设定


  按需印刷的图书一般使用数字印刷设备进行印制。目前数字印刷机中设定的模拟加网线数有120lpi、150lpi、175lpi、200lpi等,对于再版图书,我们用175lpi输出即可满足印制要求,因此,扫描时的输入分辨率可设定为300~350dpi。


  3.其他扫描注意事项


  (1)图书中有幅面较大、超出扫描仪范围的文件时,可分为几部分扫描,最后使用Photoshop等软件进行拼接处理,形成完整的图像。


  (2)可拆卷处理的图书加工过程中应注意不伤及页面、损坏原文、不丢页、混页。对原书页面的褶皱、折角、折痕要提前进行平整处理,对破损部分进行裱糊处理,以防止在扫描工序中对纸张造成二次伤害。


  (3)特殊页扫描:筒子页中存在透纸现象时,可以在筒子页中间插入白纸后进行扫描,有条件时,可选择插入宣纸。插入时注意不要破坏筒子


  页,造成纸张撕裂。


  4. 扫描后的检查


  扫描后应对原始数据进行检查,查看扫描数据与提供的书目目录是否一致。重点需检查的内容包括:图书数据所在文件夹号、书名、著译者、出版地、出版单位、出版时间、页数、开本等。还有图书的必备部件(包括封面、封底、扉页、目录、内文、版权页、插页)是否完整;图片文件质量是否合格,分辨率、图像色彩模式是否正确。


  二、图像数据处理


  (一)封面文件处理


  1.在制作之前需确定开本、装订方式以及装订方向。可以根据内文信息把不同开本、装订方式的书目在清单中用不同颜色标记,减少出错率,再根据内文总页数和正式印刷时所用纸张材料来大致推算书脊厚度,为封面制作做好准备工作。


  2.将封面文件提取并存储为单页的Tiff文件,使用Photoshop软件进行处理。如没有封面,可查看扉页是否可以替代封面文件。


  3.封面处理注意事项


  (1)去网处理:图书作为印刷品原稿,本身有加网,我们通过去网处理,以消除网点痕迹,使复制书具有较好的图像效果。


  (2)断版书多数是旧书、古籍书,纸张年久发黄,扫描得到的图像偏黄,需通过图像调节中“色阶”功能将图像调成白底。


  (3)一些残缺或有脏点的地方可用“仿制图章”或“修复画笔”来修复图像或去除脏点。用这两个工具时要注意画笔的软硬程度,尽量选择软画笔,保持图像的自然过渡。


  (4)封一、封四分开扫描时,可能颜色存在偏差,可用“色相饱和度”工具调节,尽量保持一致。同时注意,扫描的数据没有出血,必须扩大页面尺寸将出血做好,以方便后加工。如封面为纯色底图,可直接将四周颜色外延添加出血;若是图案或渐变等不宜制作的文件,可略微等比例扩大图像尺寸,保证有1.5~2mm左右出血量。


  (5)书脊内容(书名、著作者、出版社)被标签遮挡,应从封面、版权页或书目清单上查看是否有相关信息,然后手动录入添加。


  (6)条形码制作:扫描的条形码清晰度较差,建议使用专用条形码生产软件重新制作。以上修复的过程中要遵循一个原则:尽量与原


  书保持一致。


  (二)内文数据处理


  1.版面去脏:周空去脏,版心行间大污点去除。图书若为图书馆藏书,内文中可能会有馆藏红章等标记,应注意去除。


  2.调整版面尺寸:统一版面尺寸,特别对于套装图书、系列图书,必须保证尺寸一致。


  3.按标准进行版面纠偏:调整版心角度,将扫描中产生的偏差修正,一般不超过1度。对方向不正确的图像进行旋转还原。


  4.版心对齐:将全书数据的版心按统一标准对齐。


  5.图像清晰度:图像页面中出现的影响图像质量的杂点如黑点、黑线、黑框、黑边等应进行去污处理。


  6.文字处理:采用锐化功能,清晰字迹笔画。保证无断划、缺划。在正常电分(为传统印刷准备)时USM sha画册印刷rp的数值大约为5~6,在为数字印刷准备图片时需增加到7~8。


  7.插页处理:在扫描时,为提高效率,白页可能会直接跳过,所以,在处理内文数据时,需要特别注意确认在文中哪些需要背白的位置应插入空白页。原则为:


  (1)扉页在前且后面无版权页时,在扉页后插入白页。


  (2)前言、目录、序、正文、后记等大的图书组件的起始页如位于偶数页码时,在其前面插入空白页。


  (3)单页插图如位于奇数页时,后面插入空白页;集中式插图的最后一幅插图如位于奇数页,在其后面插入空白页。


  三、文件串联


  顾名思义,文件串联即将处理好的内文数据组合成完整的电子书。串联时注意检查图书各部分内容是否完整,保证无缺页、重页、页码顺序颠倒的情况。为方便印刷和装订环节的封面与内文配套,以及数据核对,可将书目名称或对应的编号作为暗码添加在文件的裁切线外作为标识。


  串联后,还应对数据进行抽查。抽查内容包括:检查去脏质量,包括周空、行间大污点;检查版面尺寸是否标准、统一;检查版心是否对齐;检查数据存储方式是否正确。


  四、数据文件存储


  数据文件存储包含:图书扫描原始数据和处理后可印刷数据。如在印刷环节发现处理后数据存在质量问题,可立即调出扫描原始数据重新进行图像处理。一般可印刷数据存储为PDF格式。存储后应检查是否有坏死文件、是否携带病毒。


  断版书的数据处理是一项较为复杂的工作,除了文中提及的印刷专业操作外,还要做好数据库平台的搭建、数字化工作流程的优化等,才能使得图书的数字化进入规模化生产。影印出版相对于电子出版工艺较简单,多用于断版古籍书的再版。目前,熟练的图像数据处理员一天能处理1000~1500页数据,然而,他们在筛选、调用、检查相应的书目时却要耗费很长时间。由此可见,断版书再版的技术难题,不在于图像数据处理,不在于选用何种输出设备,而在于如何管理好图像数据,保证在客户需要定制时,第一时间响应。因此,我们仍需继续努力攻坚克难,让更多更好的文化精髓为世人传承,做一名真正的印刷人。

上海贯宣印务科技有限公司(http://www.shguanxuanys.com)集设计、制版、印刷、印后加工于一体,实力雄厚,完全满足现代印务优质、高效、快捷的要求。 上海贯宣印务科技有限公司是上海专业的宣传页印刷,画册样本印刷,包装彩盒印刷,上海手提袋印刷,上海不干胶印刷公司。021-51033748 我们深刻认识到先进的硬件设施固然重要,而具有专业知识和超强的团队精神更能为客户提供周到的服务,满足客户的要求才是企业的立足之本。

联系我们

上海贯宣印务科技有限公司

服务热线:021-51033748

Q    Q:1945283883 \ 739294663

联 系 人:汪经理

联系手机:15900898861

邮   箱:wangcao183@163.com

地   址:上海市宝山区大康路241号

快速链接

沪ICP备18008002号-1