当前位置： > 网络编程 > JSP教程 > 文章内容

语音识别开发,语音识别开发套件

http://www.itjxue.com 2023-01-20 07:24 来源:未知 点击次数:

语音识别系统是硬件开发还是软件编程

硬件开发。语音识别系统的本质就是一种模式识别系统，它包括特征提取、模式匹配、参考模式库等基本单元，它是硬件开发，是一种典型的非平稳信号。

C#如何开发语音识别，最好有例子

语音识别小程序，调用了windows的识别组件。精简了一些代码，算是比较简单易懂的一个语音识别类。

开发测试环境win7，VS2008。如果有其它环境中的，欢迎补充。

SRecognition.cs

using System;

using System.Speech.Recognition;

using System.Globalization;

using System.Windows.Forms;

namespace NingTao

{

public class SRecognition

{

public SpeechRecognitionEngine recognizer = null;//语音识别引擎

public DictationGrammar dictationGrammar = null; //自然语法

public System.Windows.Forms.Control cDisplay; //显示控件

public SRecognition(string[] fg) //创建关键词语列表

{

CultureInfo myCIintl = new CultureInfo("zh-CN");

foreach (RecognizerInfo config in SpeechRecognitionEngine.InstalledRecognizers())//获取所有语音引擎

{

if (config.Culture.Equals(myCIintl) config.Id == "MS-2052-80-DESK")

{

recognizer = new SpeechRecognitionEngine(config);

break;

}//选择识别引擎

}

if (recognizer != null)

{

InitializeSpeechRecognitionEngine(fg);//初始化语音识别引擎

dictationGrammar = new DictationGrammar();

}

else

{

MessageBox.Show("创建语音识别失败");

}

private void InitializeSpeechRecognitionEngine(string[] fg)

{

recognizer.SetInputToDefaultAudioDevice();//选择默认的音频输入设备

Grammar customGrammar = CreateCustomGrammar(fg);

//根据关键字数组建立语法

recognizer.UnloadAllGrammars();

recognizer.LoadGrammar(customGrammar);

//加载语法

recognizer.SpeechRecognized += new EventHandlerSpeechRecognizedEventArgs(recognizer_SpeechRecognized);

//recognizer.SpeechHypothesized += new EventHandler SpeechHypothesizedEventArgs(recognizer_SpeechHypothesized);

}

public void BeginRec(Control tbResult)//关联窗口控件

{

TurnSpeechRecognitionOn();

TurnDictationOn();

cDisplay = tbResult;

}

public void over()//停止语音识别引擎

{

TurnSpeechRecognitionOff();

}

public virtual Grammar CreateCustomGrammar(string[] fg) //创造自定义语法

{

GrammarBuilder grammarBuilder = new GrammarBuilder();

grammarBuilder.Append(new Choices(fg));

return new Grammar(grammarBuilder);

}

private void TurnSpeechRecognitionOn()//启动语音识别函数

{

if (recognizer != null)

{

recognizer.RecognizeAsync(RecognizeMode.Multiple);

//识别模式为连续识别

}

else

{

MessageBox.Show("创建语音识别失败");

}

private void TurnSpeechRecognitionOff()//关闭语音识别函数

{

if (recognizer != null)

{

recognizer.RecognizeAsyncStop();

TurnDictationOff();

}

else

{

MessageBox.Show("创建语音识别失败");

}

private void recognizer_SpeechRecognized(object sender, SpeechRecognizedEventArgs e)

{

//识别出结果完成的动作，通常把识别结果传给某一个控件

string text = e.Result.Text;

cDisplay.Text += text;

}

private void TurnDictationOn()

{

if (recognizer != null)

{

recognizer.LoadGrammar(dictationGrammar);

//加载自然语法

}

else

{

MessageBox.Show("创建语音识别失败");

}

private void TurnDictationOff()

{

if (dictationGrammar != null)

{

recognizer.UnloadGrammar(dictationGrammar);

//卸载自然语法

}

else

{

MessageBox.Show("创建语音识别失败");

}

form调用，其中2个按钮（开始，停止），1个文本框（识别结果）

using System;

using System.Windows.Forms;

namespace NingTao

{

public partial class Form1 : Form

{

private SRecognition sr;

public Form1()

{

InitializeComponent();

string[] fg = { "东方", "西方", "南方", "北方" };

sr = new SRecognition(fg);

button2.Enabled = false;

}

private void button1_Click(object sender, EventArgs e)

{

sr.BeginRec(textBox1);

button1.Enabled = false;

button2.Enabled = true;

}

private void button2_Click(object sender, EventArgs e)

{

sr.over();

button1.Enabled = true;

button2.Enabled = false;

}

淘宝语音识别谁开发的啊

过去一年淘宝直播快速发展，截止2020年9月底，80个淘宝直播产业基地在全国落地开花，从农村走出10万农民主播，直播真正意义上成为帮助商家和消费者完成交易的利器，同时通过各种互动玩法让直播购物变得有趣好玩。在2020年双11开始阶段，淘宝直播App升级了18年直播答题「点题成金」的玩法，推出「一猜到底」新玩法。如果说传统的直播答题是「选择题」，一猜到底的玩法更像是几万人同时在线的「抢答题」，将答题方式从文字选择升级成语音抢答，给出猜中价格高低提示，让用户增加了更多的参与的乐趣。

为了实现比肩综艺现场的直播竞猜体验，我们一次压上了由达摩院语音实验室、阿里云PAI团队、淘系技术直播App和端智能MNN团队组成的全明星阵容，通力协作之下，一举实现了工业界首个用于直播的移动端语音识别。

语音识别开放化开发平台有哪些

语音识别开发平台有很多，具体总结如下：

1.商业化的语音交互平台

1)微软Speech API

微软的Speech API（简称为SAPI）是微软推出的包含语音识别（SR）和语音合成（SS）引擎的应用编程接口（API），在Windows下应用广泛。目前，微软已发布了多个SAPI版本（最新的是SAPI 5.4版），这些版本要么作为于Speech SDK开发包发布，要么直接被包含在windows 操作系统中发布。SAPI支持多种语言的识别和朗读，包括英文、中文、日文等。

2).IBM viaVoice

IBM是较早开始语音识别方面的研究的机构之一，早在20世纪50年代末期，IBM就开始了语音识别的研究，计算机被设计用来检测特定的语言模式并得出声音和它对应的文字之间的统计相关性。1999年，IBM发布了VoiceType的一个免费版。2003年，IBM授权ScanSoft公司拥有基于ViaVoice的桌面产品的全球独家经销权，随后ScanSoft与Nuance合并，如今viaVoice早已淡出人们的视线，取而代之的是Nuance。

3）Nuance

Nuance通讯是一家跨国计算机软件技术公司，总部设在美国马萨诸塞州伯灵顿，主要提供语音和图像方面的解决方案和应用。目前的业务集中在服务器和嵌入式语音识别，电话转向系统，自动电话目录服务等。Nuance语音技术除了语音识别技术外，还包扩语音合成、声纹识别等技术。世界语音技术市场，有超过80%的语音识别是采用Nuance识别引擎技术，其名下有超过1000个专利技术，公司研发的语音产品可以支持超过50种语言，在全球拥有超过20亿用户。苹果的iPhone 4S的Siri语音识别中就应用了Nuance的语音识别服务。

4）科大讯飞

科大讯飞作为中国最大的智能语音技术提供商，在智能语音技术领域有着长期的研究积累，并在中文语音合成、语音识别、口语评测等多项技术上拥有国际领先的成果。占有中文语音技术市场60%以上市场份额，语音合成产品市场份额达到70%以上。

5）其他

其他的影响力较大商用语音交互平台有谷歌的语音搜索（Google Voice Search），百度和搜狗的语音输入法等等。

2.开源的语音交互平台

1）CMU-Sphinx

CMU-Sphinx也简称为Sphinx（狮身人面像），是卡内基 - 梅隆大学（ Carnegie Mellon University，CMU）开发的一款开源的语音识别系统，它包括一系列的语音识别器和声学模型训练工具。最早的Sphinx-I 由@李开复（Kai-Fu Lee）于1987年左右开发，使用了固定的HMM模型（含3个大小为256的codebook），它被号称为第一个高性能的连续语音识别系统（在Resource Management数据库上准确率达到了90%+）。最新的Sphinx语音识别系统包含如下软件包：

? Pocketsphinx — recognizer library written in C.

? Sphinxbase — support library required by Pocketsphinx

? Sphinx4 — adjustable, modifiable recognizer written in Java

? CMUclmtk — language model tools

? Sphinxtrain — acoustic model training tools

这些软件包的可执行文件和源代码在sourceforge上都可以免费下载得到。

2）HTK

HTK是Hidden Markov Model Toolkit（隐马尔科夫模型工具包）的简称，HTK主要用于语音识别研究，最初是由剑桥大学工程学院（Cambridge University Engineering Department ，CUED）的机器智能实验室（前语音视觉及机器人组）于1989年开发的，它被用来构建CUED的大词汇量的语音识别系统。HTK的最新版本是09年发布的3.4.1版，关于HTK的实现原理和各个工具的使用方法可以参看HTK的文档HTKBook。

3）Julius

Julius是一个高性能、双通道的大词汇量连续语音识别（large vocabulary continues speech recognition，LVCSR）的开源项目，适合于广大的研究人员和开发人员。它使用3-gram及上下文相关的HMM，在当前的PC机上能够实现实时的语音识别，单词量达到60k个。

4）RWTH ASR

该工具箱包含最新的自动语音识别技术的算法实现，它由 RWTH Aachen 大学的Human Language Technology and Pattern Recognition Group 开发。RWTH ASR工具箱包括声学模型的构建、解析器等重要部分，还包括说话人自适应组件、说话人自适应训练组件、非监督训练组件、个性化训练和单词词根处理组件等。

语音识别开发,语音识别开发套件

(责任编辑：IT教学网)

复制链接发给好友收藏本文关闭此页

上一篇：amorfati,amorfatii

下一篇：javascript中文文档下载,javascript官网下载

语音识别开发,语音识别开发套件

语音识别系统是硬件开发还是软件编程

C#如何开发语音识别，最好有例子

淘宝语音识别谁开发的啊

语音识别开放化开发平台有哪些

(责任编辑：IT教学网)

相关JSP教程文章

阅读排行

专题教程

推荐JSP教程文章

最新更新JSP教程