语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面,其中,最基础的就是语音识别单元的选取。
数据都是由一系列不同的应用程序、设备和地理研究活动生成的。大数据的应用就是从收集到的海量数据中提取有价值的信息用于天气预报、灾害评估、犯罪侦测和健康产业等。在全球人口随着人类寿命的延长而持续增加的同时,疾病治疗的思路和方法也正在迅速进化,而这些快速变化背后的一些决策必须基于大数据。
科大讯飞股份有限公司成立于1999年,是一家专业从事智能语音及语言技术、人工智能技术研究,软件及芯片产品开发,语音信息服务及电子政务系统集成的国家级骨干软件企业。科大讯飞在智能语音核心技术研究领域,一直秉承“从市场中来、到市场中去”,“用正确的方法、做有用的研究”等核心理念,致力于建立智能语音及语言核心技术和核心技术应用产业化两大方面的竞争力。科大讯飞的核心技术主要包括:语音识别技术、语音合成技术、自然语言理解技术、语音评测技术、声纹语种技术、手写识别技术等。科大讯飞始终坚持提供国际领先的语音及语言整体解决方案,不断推出符合国家和社会需求的智能语音及语言技术产品及应用服务。
所谓语音识别,就是将一段语音信号转换成相对应的文本信息,系统主要包含特征提取、声学模型,语言模型以及字典与解码四大部分,其中为了更有效地提取特征往往还需要对所采集到的声音信号进行滤波、分帧等预处理工作,把要分析的信号从原始信号中提取出来;之后,特征提取工作将声音信号从时域转换到频域,为声学模型提供合适的特征向量;声学模型中再根据声学特性计算每一个特征向量在声学特征上的得分;而语言模型则根据语言学相关的理论,计算该声音信号对应可能词组序列的概率;最后根据已有的字典,对词组序列进行解码,得到最后可能的文本表示。
语音合成(Text To Speech,TTS)技术能够自动将任意文字实时转换为连续的自然语音,是一种能够在任何时间、任何地点,向任何人提供语音信息服务的高效便捷手段,非常符合信息时代海量数据、动态更新和个性化查询的需求。科大讯飞语音技术历经20年不懈创新,自90年代中期以来,在历次的国内国外评测中,各项关键指标均名列第一。
上世纪90年代, 国内语音分为“南北二王”,“南”指的是中国科技大学的王仁华教授;“北”则是清华大学的王作英教授。刘庆峰正是在这个时期被选中加入了王仁华教授的人机语音通信实验室,并牵头做一个语音合成系统,该系统不但保证了音质,还具备了优良的语音自然度,合成的语句近乎“人声”,成为1998年国家“863计划”成果比赛中最为轰动的科研成果。同年,IBM发布了语音系统,首次靠说话就能让电脑完成指令,被评为当年科技界十件大事之一。面对国内空白的语音市场,IBM、微软、英特尔、摩托罗拉等纷纷抢占布局,在中国成立研究院。在这样的背景下,刘庆峰产生了创业的想法。1999年6月,安徽硅谷天音信息科技有限公司成立,半年后,改名科大讯飞。
目前,科大讯飞在汽车领域的落地的产品可以暂且被分为三种。 一种是后装硬件,即在今年 8 月发布的「小飞鱼」车载智能语音助手,它通过蓝牙和手机连接,依靠手机网络接入科大讯飞服务,同时依靠 FM 发射功能连接车内音响。它还有一个重要功能,就是降噪,提高语音识别率。这可以看做是科大讯飞对后装市场的一次「试水」。
讯飞听见M1转写机器人是一款以专业录音及转文字为核心功能的智能转写机器人,可满足会议、采访、课程培训等多种场景下的录音整理需求,1小时音频5分钟出稿。
请完善以下信息,我们的顾问会在1个工作日内与您联系,为您安排产品定制服务