【A11】PDF文本格式到EPUB电子图书格式的自动转换工具【超星集团】
发布时间: 2021-11-17 18:03:32

1.命题方向

企业服务

2.题目类别

应用类

3.题目名称

PDF文本格式到EPUB电子图书格式的自动转换工具

4.背景说明

【整体背景】

移动电子设备的迅速普及和日益多样化改变了与生活息息相关的各行各业,人们不再满足于纸质阅读,开始追求更加方便高效的电子书阅读方式。PDF是传统PC阅读模式下常用的文档和图书格式,EPUB是移动阅读常用的图书格式。EPUB格式能够在移动设备上带给读者优质的阅读体验。

为了使传统的电子图书更好地满足移动互联时代的阅读需求,出版和阅读服务行业需要研制开发便捷高效的PDF到EPUB的转换工具,快速将海量的PDF图书转换成为EPUB格式。这项工作将极大拓展高校图书馆和公共图书馆等文化单位的阅读服务能力,助力全民阅读活动的推广和持续进行。

【公司背景】

超星集团成立于1993年,通过20多年的不断努力,建立了全球最大的中文数字图书馆——“超星数字图书馆”。超星目前是国内最大的中文电子书提供商,国内最大的学术视频供应商和国内最大的中文学术搜索提供商,公司已经形成了良性的企业经营模式。

超星集团坚持自主技术开发的发展模式,经过20多年的发展,在数字出版和在线教育领域已经获得3项专利,6项新技术新产品证书和29项软件著作权证书。

在传统的PC数字阅读时代,超星自主研发的PDG格式电子书曾经广泛服务于高校图书馆和公共图书馆。随着移动阅读的蓬勃发展,EPUB电子图书的阅读服务已经成为公司的重要发展方向。超星集团在电子图书格式领域有多年的技术积累,同时也迫切希望有更多新技术和新开发力量的加入。

【业务背景】

超星集团是中国数字图书领域的开创者,业务服务范围基本覆盖全国的高校和公共文化服务机构。电子书格式标准是数字图书产业发展重要的技术规范,EPUB格式将是超星集团为千万计用户提供数字阅读服务的载体模式,拥有广泛的市场需求和发展空间。

5.项目说明

【问题说明】

解决PDF文本格式到EPUB电子图书格式的自动(批量)转换问题。

【用户期望】

开发完成的作品可以作为独立工具运行;也可作为服务运行,支持分布式任务调用。

6.任务要求

【开发说明】

开发PDF文本格式到EPUB电子图书格式的自动转换工具,实现PDF到EPUB的批量转换服务;转换时需保留原有PDF文档的排版样式、标题格式和目录格式;转换后的文档支持保留原文件名和重新命名;转换过程有完整日志记录便于查看转换完成进度。

【技术要求与指标】

开发完成程度指标:完成主体功能开发,可实现单个文件转换和批量文件转换。

【提交材料】

1)项目概要介绍; 

2)项目简介 PPT; 

3)项目详细方案; 

4)项目演示视频; 

5)企业要求提交的材料:

1简要描述开发过程遇到的困难及解决过程。

6)团队自愿提交的其他补充材料。

【任务清单】

1)开发PDF文本格式到EPUB电子图书格式的自动转换工具,实现PDF到EPUB的批量转换服务;

2)转换任务需完整完成,提供进度查看和故障查看日志;

3)原有PDF文档的排版样式、标题格式和目录格式需保留;

4)可以作为独立工具运行;也可作为服务运行,支持分布式任务调用。

【开发工具与数据接口】

开发技术路线采用JavaEE

运行操作系统为linux发行版本centOS 6.6及以上64位版本

运行数据库为MySQL

无需数据接口

7.其他

8.参考信息

9.评分要点

赛题评分要点见附件:A类初决赛阶段评分表。

订阅号