网站首页
产品目录
芯片技术资料
联系我们
Chinese SimplifiedChinese Traditional
芯片技术资料
Sensory语音技术及RSC系列单片机简介
Sensory公司成立于1994年,是美国一家私立的风险投资公司。公司旨在为市场创建一种高质量低成本的语音识别产品。因其使用了独到的语音技术,在8位机语音识别的应用领域内该公司的产品一直占据着领先地位。在欧美市场已面市的带有语音识别功能的产品中,大多数都采用了Sensory公司的产品,如Textronix的示波器、Kenwood的电话(IS-A17)、Sony的车载收音机等。
通常所提到的Sensory语音技术主要包括以下几种:
SS ―― 语音合成(Speech Synthesis)使用该技术能播放编程前已编辑好的语音,如一段话等。
SD――特定人的识别模式(Speaker Dependent speech recognition) 在这种识别模式下,使用人要先进行训练,产生一个可供日后进行识别用的模板。因此,其使用对象是特定的,谁训练的就只能谁使用,此所谓特定人识别。
SI ― 非特定人识别模式(Speaker Independent speech recognition)此识别模式下,使用人非特定,无需训练。识别用的模板是预先定做的针对大众的统一模板,任何人都可使用。此谓非特定。
SV ― 身份验证(Speaker Verification)该识别模式类似于SD模式,但识别算法更严格。包括对说话者的语音语调都要进行检验。
DRT ― 双识别模式(Dual Recognition Technology)该模式结合了SD和SI的技
术。说话者在使用前要先进行培训,以后每次使用时该技术会根据说话者
当时的语音调节模板。
CL ― 连续听(Continuous Listening)该模式下,系统一直处于 状态,随时准备捕捉关键字。但如果关键字是夹杂在其他句子中,且与其他字相连甚密时系统捕捉不到。所以在说关键字前应停顿一下。
WS ―― 句中捕捉关键字(Word Spot)该技术类似于CL,但它能从一句连续的话中捕捉到关键字,所以在说关键字前无需刻意停顿。
RP ―― 录音回放(voice Record and Playback )此模式下,系统可以现场录一段语音,并回放出所录声音,效果很好,失真小。
TT ―― 双音多频拨号(Touch-Tone synthesis)此模式可合成语音以生成双音多频的电话拨号音。

Sensory的每一项语音技术都包含在其系列产品中。
RSC系列单片机因为采用了神经元算法所以可以提供高质量的SI识别、SD识别和SV识别。该系列单片机还支持语音合成、录音回放、4声道音乐合成和系统控制的功能。属于CMOS的这一系列单片机包含有以下内部资源:RAM、16个IO口、A/D转换器、D/A转换器、麦克风预放和4MIPS的处理器。除了提供语音识别和语音合成所需的马力之外,该系列单片机还有足够的周期去执行通用目的产品控制。用户可以对此系列单片机进行编程以达到所需的控制目的。用此系列单片机开发语音产品,外围仅需加极少的外部元器件――如麦克风、扬声器、电池和一些被动元器件――即可。RSC系列单片机主要有RSC-164、RSC-200/264、RSC-300/364几种,还有由此几种单片机派生出来的ASSP(Application Specific Standard Product), 包括Voice Direct,Voice Dialer,Voice Extreme(VE)。其中Voice Direct和Voice Dialer 无需用户进行编程即可使用。



Powered By DIYTrade.com 创建您的免费网站 寻找中国开关产品!