博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
iOS开发之集成讯飞听写
阅读量:4085 次
发布时间:2019-05-25

本文共 1386 字,大约阅读时间需要 4 分钟。

公司有个需求,要用类似淘宝上语音输入搜索的信息。我的思路是将语音转换为文字,然后用UISearchBar或者UISearchBarDisplayController 来做,因此,重中之重就是语音转文字了,上网查了一下,语音这方面,国内做的最好的就讯飞了(据说百度也可以,但是我们安卓说还是不太行,我也就没看百度的,直接讯飞了),在网上查了一下,这方面的文章并不多,很大一部分都是几年前的,没有比较新的那种,因此就将自己集成语音听写的过程记录下来,以备参考。

http://www.jianshu.com/p/496ec4f644ff

首先去注册一下,成为开发者

因为是做语言听写的,直接进去


2016083133339QQ20160831-0.png
  • 进去之后,详情部分随便看看有个了解就好,这里说的是其他的,这个垂直听写模型;

    2016083123474QQ20160831-1.png

这个垂直听写模型大致的意思就是一个行业的专业术语识别率会比较高。不过可惜的是目前只有商旅,视频和音乐三个模块,相信以后会有更多的(不过半年前就是这几个了0.0...)
这部分使用的话识别率高,我也没有研究过这个玩意,有需求的可以自己去看看。

  • 接下来是个性化听写,这一部分是 用得到的了。

    2016083164816QQ20160831-2.png

    如果没有的话就先穿件个应用。

右边能够下载SDK 最好是先下载出来看看官方的demo,但是不要纠结,切记 一定不要纠结,官方的demo看看参考下就好,一定不要对着刚,会受伤的(小白请切记,大神请无视。。。)


Paste_Image.png

个性化听写里面的热词 还是非常有用的。


2016083166715QQ20160831-4.png


它就是让你自己上传一个文本文件,txt格式的,里面记录一些你应用中经常会搜索到的一些词汇,专业性词汇,能够极大地提高识别率(据说的,个人感觉还是会偏差一点,不过很小)。
热词的格式就是这样的:


Paste_Image.png

要注意的是:

  • 每一行是一个热词
  • 每一行结尾不要有标点
  • 最多两千行(要是热词从数据库导出的话,就要控制下长度了)

开放平台看完了马上就是集成的时间了。。。

不管集成什么SDK,不管官方的文档写的多垃圾,都是必须要到开放平台看看官方的文档的,毕竟是人家写的嘛。看看对理解流程还是非常有帮助的。因为现在做的是语音听写的功能,所以语音听写部分要认真的看。


2016083149393QQ20160831-6.png
  • 首先按照文档的指示,在Linked Frameworks and Libraries导入依赖库;


    20160831147261873562653.jpg


    注意如果是离线识别的话还要加上libc++.a这个库才行
    确认sdk 路径这一步很重要,文档也谢的很清楚,在这就不写了,路径不对用不了的!

  • 在需要用到语音识别的地方导入头文件,我这里做的一个小demo,用了两个按钮来监听录音的开始和结束,一个textFiled显示识别结果,(这里用的是讯飞无UI那个)。

    • 注意:
      • 头文件导入有可能没有提示,直接复制下面的。
      • 代理方法不要忘了写,不写的话是不会提识别的

具体的demo就不在这贴了,文章最后面有demo,看下应该就名白了的。。。。


详细的请自己下载个看下吧,

转载地址:http://lyrni.baihongyu.com/

你可能感兴趣的文章
有向无环图(DAG)的最短路径问题(拓扑排序)
查看>>
图——基本的图算法(四)关键路径
查看>>
树中所有点距离之和
查看>>
Leetcode 834. 树中距离之和 C++
查看>>
【机器学习】机器学习系统SysML 阅读表
查看>>
最小费用最大流 修改的dijkstra + Ford-Fulksonff算法
查看>>
最小费用流 Bellman-Ford与Dijkstra 模板
查看>>
实现高性能纠删码引擎 | 纠删码技术详解(下)
查看>>
分布式系统下的纠删码技术(一) -- Erasure Code (EC)
查看>>
RS(纠删码)技术浅析及Python实现
查看>>
RS纠删码
查看>>
reed solomon编码实践
查看>>
纠删码数据中心的最佳修复层:从理论到实践
查看>>
排队论---一般服务时间 M/G/1 模型
查看>>
为什么对高斯分布的方差的极大似然估计是有偏的?
查看>>
TensorFlow分布式采坑记
查看>>
【神经网络】变分自编码大杂烩
查看>>
为程序员写的Reed-Solomon码解释
查看>>
分布式系统下的纠删码技术之Erasure Code
查看>>
【NPC】23、有向汉密尔顿回路规约到无向汉密尔顿回路
查看>>