科大讯飞实习报告

上传人:飞*** 文档编号:24489230 上传时间:2017-12-05 格式:DOC 页数:23 大小:44KB
返回 下载 相关 举报
科大讯飞实习报告_第1页
第1页 / 共23页
科大讯飞实习报告_第2页
第2页 / 共23页
科大讯飞实习报告_第3页
第3页 / 共23页
科大讯飞实习报告_第4页
第4页 / 共23页
科大讯飞实习报告_第5页
第5页 / 共23页
点击查看更多>>
资源描述

《科大讯飞实习报告》由会员分享,可在线阅读,更多相关《科大讯飞实习报告(23页珍藏版)》请在金锄头文库上搜索。

1、1科大讯飞实习报告篇一:毕业实习报告实习报告关于在安徽科大讯飞科技信息科技股份有限公司单位从事语音资源整理数据标注的实习报告实 习 单 位: 安徽科大讯飞信息科技股份有限公司实 习 时 间:实 习 岗 位: 语音资源整理数据标注学 生 姓 名: 苏 晓 文 学 号:1 0 4 2 1 5 2 1 3 1 院 系: 信 息 工 程 学 院 专 业:信 息 管 理 与 信 息 系 统年 月 日关于在安徽科大讯飞科技信息科技股份有限公司单位从事语音资源整理数据标注的实习报告一、实习单位及岗位简介(一)实习单位的简介安徽科大讯飞信息科技股份有限公司是一家专业从事智能语音及语言技术研究、软件及芯片产品开

2、发、语音信息服务及电子政务系统集成的国家级骨干软件企业。公司智能语音核心技术代表了世界的最高水平。2008 年,科大讯2飞在深圳证券交易所挂牌上市,股票代码:002230。科大讯飞成立于 1999 年,是我国产业化实体中,在语音技术领域中基础研究时间最长、资产规模最大、历届评测成绩最好、专业人才最多及市场占有率最高的公司。语音技术实现了人机语音交互,使人与机器之间沟通变得像人与人沟通一样简单。语音技术主要包括语音合成和语音识别两项关键技术。让机器说话,用的是语音合成技术;让机器听懂人说话,用的是语音识别技术。此外,语音技术还包括口语评测、语音编码、音色转换、语音消噪和增强等技术,有着广阔应用空

3、间。科大讯飞作为中国最大的智能语音技术提供商,在智能语音技术领域有着长期的研究积累,并在语音合成、语音识别、口语评测、自然语言处理等多项技术上拥有国际领先的成果。科大讯飞是我国唯一以语音技术为产业化方向的“国家 863 计划成果产业化基地”、 “国家规划布局内重点软件企业”、 “国家高技术产业化示范工程”,并被原信息产业部确定为中文语音交互技术标准工作组组长单位,牵头制定中文语音技术标准。2003 年、2011 年,科大讯飞两次荣获“国家科技进步奖”;2005 年、2011 年两次获得中国信息产业自主创新最高荣誉“信息产业重大技术发明奖”。2006 年至 2012 年,已连续七届英文语音合成国

4、际大赛(Blizzard Challenge)荣获3第一名。2008 年至 2011 年,连续四年在国际说话人、语种识别评测大赛中名列前茅。2011 年, “国家智能语音高新技术产业化基地”、 “语音及语言信息处理国家工程实验室”相继落户合肥,有利于进一步汇聚产业资源,提升科大讯飞产业龙头地位。基于拥有自主知识产权的世界领先智能语音技术,科大讯飞已推出从大型电信级应用到小型嵌入式应用,从电信、金融等行业到企业和消费者用户,从手机到车载,从家电到玩具,能够满足不同应用环境的多种产品。科大讯飞已占有中文语音技术市场 70%以上市场份额,开发伙伴超过8000 家,以讯飞为核心的中文语音产业链已初具规

5、模。随着移动互联网“语时代”的到来,科大讯飞率先发布了全球首个提供移动互联网智能语音交互能力的“讯飞语音云”平台,并持续升级优化。基于该平台,科大讯飞相继推出了“讯飞语音输入法”、 “讯飞语点”等示范性应用,并与广大合作伙伴携手推动各类语音应用深入到手机、汽车、家电、玩具等各个领域,引领和推动着移动互联网时代大潮下输入和交互模式的变革。(二)实习岗位的简介我所从事的是数据标注,这是一份看似简单却充满技术性的工作,该工作主要针对公司的产品需求,按照资源的整理格式,通过网络及相关渠道进行大量的文本资源的收4集、分类和整理。整理的主要内容是对资源名称进行别称简称及是否歧义的整理。根据规范对文本信息资

6、源进行标注,内容资源数据的后期制作及数据标注工作。公司实行每周五天,每天八小时工作制。首先是三天的试用期,主要是适应工作环境,了解工作内容,学习工作方法,熟悉公司的各个部门。三天后办理入职手续领取工作证,签劳动合同。在主管的安排下我被分到了语音资源部数据标注组,我拥有自己的格子间和办公电脑,我们所做的工作都是为了讯飞语点服务的。首先我们的组长向我介绍了我们的组员以及它们各自所分配的任务,并且告诉我工作期间的交流都是通过飞信进行的,还有上班下班的时间,吃饭时间及打卡的时间,上下班的班车路线等。然后他向我介绍了工作的内容,如何登陆讯飞内部网络,如何进入标注平台。接着他让我先学习标注规范和平台的使用

7、说明了解我们的工作。每天早上要签到,下班前要及时撰写工作日报。最后他向我强调了公司的规章制度以及我入职之后所要从事的工作,包括线网内的数据抓取和修改,测试集的修改与汇总,数据的标注,语音的测试,语音识别,资源整理等。同时,在空余时间要协助其他组完成相应的任务,相互合作共同进步,定期和本组同事相互交流相互按时撰写日报和工作心得。5二、实习内容及过程1、标注标注规范包括手机语点标注规范,车载标注规范,商旅标注规范,电视标注规范等。在做一项任务之前都要了解他的规范,标注规范是进行语点标注的准则,标注规范由协议框架协议组成,语义框架包括四部分内容:focus, action, object, cont

8、ent。我们判断一句话的内容找出他的兴趣点也就是所表达的意思来选择相关的协议,再看看根据兴趣点所发出的动作和对象来辨别是否符合标注规范的要求。过一段时间我们会根据实际的需求对标注规范进行,以适应当前的实际需求,在修改的过程中有些业务需要扩充,有些业务需要转移,甚至有时会增加一些新的兴趣点等等。此规范主要是针对生活中的一些相似或者相同场景进行细化从而避免由于引擎跑错地方而导致语点不能更好地服务于用户,再者一些语句对于业务来说是错误的或者是一些闲聊的话语使得引擎无法识别从而不能满足用户的需求。由于时代在发展,科技在进步我们的标注规范也在不断的更新,我们会每隔一段时间更新一次标注规范,是为了更好地服

9、务于相关工作的进行。在对数据进行标注之前,掌握标注细则是非常重要的,它关系到我6们后期标注工作的正确性和可靠性,每天的工作中我都会先熟悉标注细则然后再进行标注,我们标注数据的准确性可能会对上面技术部门的工作造成一定的影响。2、语音合成技术语音合成和语音识别技术是实现人机语音通信,建立一个有听和讲能力的口语系统所必需的两项关键技术。使电脑具有类似于人一样的说话能力,是当今时代信息产业的重要竞争市场。和语音识别相比,语音合成的技术相对说来要成熟一些,并已开始向产业化方向成功迈进,大规模应用指日可待。我们会每天接听大量的语音信息,把语音信息中不清楚的信息保留下来进行分析与修正。3、语音识别技术自动语

10、音识别技术(Auto Speech Recognize,简称 ASR)所要解决的问题是让计算机能够“听懂”人类的语音,将语音中包含的文字信息“提取”出来。ASR 技术在“能听会说”的智能计算机系统中扮演着重要角色,相当于给计算机系统安装上“耳朵”,使其具备“能听”的功能,进而实现信息时代利用“语音”这一最自然、最便捷的手段进行人机通信和交互。我们与机器对话让机器辨别我们所要求的内容并进行相应的操作。4、语音评测技术语音评测技术,又称计算机辅助语言学习(Computer 7Assisted Language Learning)技术,是一种通过机器自动对发音进行评分、检错并给出矫正指导的技术。语音

11、评测技术是智能语音处理领域的一项研究前沿,同时又因为能显著提高受众对语言(口语)学习的兴趣、效率和效果而有着广阔的应用前景。5、自然语言自然语言是几千年来人们生活、工作、学习中必不可少的元素,而计算机是 20 世纪最伟大的发明之一,如何利用计算机对人类掌握的自然语言进行处理、甚至理解,使计算机具备人类的听说读写能力,一直是国内外研究机构非常关注篇二:暑假实践报告之科大讯飞培训暑假实践报告科大讯飞培训报告今年的这个暑假是大学三年最充实的一个暑假收获最多的一个暑假。在上学期学期结束之前,报名参加了一个科大讯飞的一个培训照片,很幸运的通过了测试。这是一个软件编程培训,免费的,但也要付出一定代价的:培

12、训期间考核通过就要和科大讯飞公司签两年就业合同。这也相当于找到工作了,只是岗前培训的时间比较长而已。在参加这个招聘测试之前,我也到这家公司做了一定的了解。 科大讯飞是8一家发展前景很好、专业语音信息从事智能及语音技术研究、软件及芯片产品开发、语音服务的国家级骨干软件企业,主要股东包括:中科大资产经营有限公司、上海广信、联想投资、盈福泰克等。在语言技术领域是基础研究时间最长、资产规模最大、历届评测成绩最好、专业人才最多及市场占有率最高的公司,其智能语音核心技术代表了世界最高水平。员工的工作待遇方面也是很不错的。工资水平也是在安徽中排在全省前列的,五险一金比较齐全,福利方面也比较丰富。不仅这些,他

13、还为员工提供了很多深造的机会,让员工在工作中提升自己的各种能力。听上届的学长说,这个公司是理想的就业目标。综上以上信息,我就参加了这次招聘,也借此多学些专业知识,为以后的工作打下基础。7 月 4 号的时候,离开了学校,到了科大讯飞专门安排的一个合肥的学校安徽影视广播职业技术学院,一个很偏僻的学校。这天安排好一切后就一定下午四点多了,才开始那天的第一顿饭(早上赶火车没吃,中午忙着报道也没吃) 。公司人员很负责,安排了我们住宿和上课的条件。第二天我们就开始上课了。上课地点环境很好,是在学校的图书馆一楼的位置,很9安静。每人一台电脑,都是全新的,刚配置的。无论在哪里上课,都有一个流程的,流程的第一步

14、就是自我介绍。不过由于我们学校去的学生很多,所以我们班几乎都是我们学校的人,而且是一个学院的,认识的也很多。所以我们很快就彼此之间有了了解和熟悉,较快的进入了学习状态。虽然这个培训是费的,但我们压力很大,因为我们几乎是每个星期都有一次对这一星期学习成果的考核。而且淘汰机制也从开始培训开始正式开始。淘汰机制内容:每两次考核不通过淘汰,一次阶段性考核不过淘汰(这个培训包括三个阶段,暑假期间只是第一阶段) 。我们既然决定来这边培训了,几乎没有人不愿意离开的,都想考出好的成绩。所以每个同学都很努力的学习,包括在学校不用功学习的同学。我们星期六和星期天是不上课的,平时上课时间也就是从早上 9 点到上午

15、11 点 50,从下午 2 点到下午 4点 50,从晚上 7 点到 9 点。但没有人遵守这个时间,因为这个时间对我们来说就是浪费时间。我们真正的每天作息上课时间是从早上 8 点多点就到教室了,然后上午放学之后吃过饭就回教室了,一直到下午放学,吃过饭继续回教室,然后一直到 10 点 30 才回宿舍洗洗睡觉。一天内最少有 14 个小时对着电脑,而且几乎没人在玩,都是对着电脑学习。星期10六和星期日的时候如果没什么事,大多数同学都会到教室了学习。学习氛围在大学里几乎是不能看到的,我们仿佛又回到了高中时代。我们的学习进度也不是一般的快啊!平均起来每星期我们能结束一种计算机语言。这个暑假我们上课时间只有

16、六个星期,但我们却在这六个周中先后学习了 C#、SQL Server 2008、ADO 、java 和 JDBC 五种计算机语言。在大学期间我们花一个学期才学完一种语言,和这个进度真是天壤之别啊。而且每天我们都有很多练习的作业,由于不熟悉编写语言和写法思路,所以每天都要做到很晚才能做完。但这阶段我们都有一个共同的看法,就是在这阶段我们所写的代码是我们大学三年所写代码的总和还要多的多。考核的严格度也不是一般的大啊!在大学三年从没尝试过不及格的滋味,到了那里的第一场考核就让我的遗憾给弥补了,竟然考核不及格。考核不及格的可不只是我自己,全班将近四十位同学只有两个同学考核几个了。试卷就五题,难易程度还可,我把它们都做出来了,如果在学校不说是满分,那也要九十多啊。可在那边就是不及格。那边的考核不仅考的是编写程序的能力,更重要的是考核编程的规范化,这就让我们平时编程规范不注意的同学受苦了。11不过在这么大压力的学习下,我们不仅收获了知识和编程能力,同时我们也收获了快乐。每

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号