【A10】教学视频语音提取文本系统 TEFS【文思海辉】
1. 命题方向
智能计算
2. 题目类别
计算类
3. 题目名称
教学视频语音提取文本系统 TEFS
4. 背景说明
【整体背景】
目前在线录播的教育视频中的课件内容、人工语音往往是作为一个整体出现,当视频需要处理时,往往需要更专业的多媒体工具和团队来完成处理。目前什么知识点需要讲解多久、需要编码演示案例多久,语言组织是否合理,没有更有效的工具辅助分析,并且往往录播人员在出现语言组织错误之后,往往重新录制,无法更有效的去除录播中不适当或者不自然的发音部分,需要一种系统能够提取语音片段,允许录播人员观察并仔细审核语音转变为文本的片段流,并且针对已经录播发现不适当的语音片段进行重新录制。
【公司背景】
文思海辉技术有限公司Pactera Technology International Ltd.是咨询与科技服务提供商,公司拥有超强的全球运营能力、严格的质量标准和高效的交付流程,致力于成为全球企业“新时代的合作伙伴”,为客户成功保驾护航。
1995年以来,文思海辉一直致力于为全球客户提供世界领先的商业/IT咨询、解决方案以及外包服务,凭借专业的交付能力,文思海辉帮助客户在全球市场中赢得成功,并且获得合作伙伴和行业分析师的高度认可。通过的业界领先的质量与安全认证包括CMM Level 5、CMMI-SVC Level 3、六西格玛、ISO 27001、ISO9001:2008、SAS70和PIPA等。
【业务背景】
文思海辉智慧课堂旨在推动教育行业信息化、数字化和智能化转型,以全流程数据聚合及智能运用,实现高效互联互通。智慧课堂包括智慧教务、智慧备课、资源库、课堂互动及移动应用等核心模块,通过数字化分析,形成以“教、学、练、评、测、管”六大环节数据,真正实现教学标准化和个性化相结合,为数字化教学提供辅助工具。本系统主要为在线课堂中的授课讲师提供分析、修改音频的解决工具。
5. 项目说明
【问题说明】
文思海辉拥有自主的在线学习平台,目前支持录播视频上传到服务器,而平台缺少对视频语音文本审计和提取的功能,更缺乏针对已有视频录播视频分析的功能。因此,需要特殊化的视频语音提取工具和系统,完善在线学习平台。
【用户期望】
采用BS架构,可以采用其他语言扩展开发支持功能。如java/python/c++
工具可以支持多种常见web格式视频中的语音识别,如mp4/ogg/webm等,最好也能支持AVI,QuikTime的rm格式的。提取的文本格式采用标准方法统一化如JSON/XML等。
6. 任务要求
【开发说明】
视频语音提取工具针对web格式视频ogg/webm/mp4可以提取语音变成格式化的文本如json/xml等,工具还提供录音功能,可以指定替换那段文本,并将替换后的文本合成到视频中。工具提供审计功能以报表和web图形化方式展现。
工具可以批量处理视频,批量审计。
【技术要求与指标】
推荐使用但不限于python,c++,java等语言以及工具。
在此项目中要求详细阐述所支持的视频格式中语音提取的计算方法以及视频合成的计算方法。
【任务清单】
(1)工具交互原型设计稿件
(2)视频提取语音并转换格式化文本模块的开发,视频时间线、帧码率与语音文本的展示,替换语音文本模块,视频合成模块开发。
(3)单点用例测试、模块测试、系统测试。
【提交材料】
(1)项目概要介绍;
(2)项目简介PPT;
(3)项目详细方案;
(4)项目演示视频;
(5)企业要求提交材料:
Ø 需求设计说明书
Ø 概要设计说明书
Ø 详细设计说明书
Ø 测试用例
Ø 系统测试报告
Ø 算法详细的说明材料
(6)团队自愿提交的其他补充材料。
【开发工具与接口】
(1)开发工具:python以及其工具包 / java以及其工具包/c++等
(2)部署环境 麒麟操作系统、CentOS,Ubuntu等,推荐麒麟操作系统。
(3)数据接口:企业提供已有在线教育平台的在线课程视频。
7. 参考信息
无
8. 评分要点
本赛题评分要点参考附件一:A类企业命题统一评分标准。