加入收藏 | 设为首页 | 会员中心 | 我要投稿 南平站长网 (https://www.0599zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 创业 > 模式 > 正文

专访“流利说”首席科学家林晖:如何用机器学习帮中国人说好英语

发布时间:2016-11-21 06:10:57 所属栏目:模式 来源:品玩
导读:副标题#e# 由于长期“哑巴英语”式的语言教育,大部分以英语为第二语言的中国人一直都有着一个问题,那就是擅长读写,却在不擅长口语。但由于资源有限,不是每一个有英语口语提升需求的人都能得到外教的一对一辅导。针对这个问题,英语流利说的解决方法是利

一开始其实我们其实是没有数据的,所以怎么可能做一个语音识别的东西呢?后来其实这里有一个蛮巧妙的地方,就是我们通过先launch一个产品,这个产品可以帮你搜集数据,同时又解决了用户一些其他的问题,这个事情就是语音的评分,跟读评分这件事情。

跟读评分比语音识别会简单是因为什么?因为它的文本是给我们自己的,你只要照着读,你其实不需要识别出他具体说了什么,你只要看他说的跟那个预设的文本要说的是不是一样就行了。具体不是语音的波形比对,但是从原理上确实有点像。它的复杂度没有像语音识别那么复杂,因为语音识别的不确定性更大,我怎么知道你要说什么,天马行空都可能。但是跟读比较限定,就是说我知道你其实应该读这一句话的,如果你乱说,我给你一个低分就完了,我其实不需要知道你乱说了什么。

当然我们当时采用的就是利用一些开源的数据,来先做一些冷启动。因为它本身这个任务挑战没有这么大,我们能够把这个产品放出去,而且有还不错的体验。这样的话,当你这个技术真正落地,就会有很多人来用。在用这个的过程中,其实是给你提供了大量的数据,所以你用户越来越多,你的数据也会越来越多,这个数据可以反过来提升你的智能。

回到我们一开始想做的,比如说我要识别你说了什么内容的这件事情上,这批数据其实就是能够为语音识别提供它的训练数据。在这里面其实有一个点,一般的不是做这个领域的人可能不太清楚,就是说光有录音数据其实没有用,你有大量的录音数据其实没用的,如果你不知道那个录音对应的文字是什么,其实是没有用的。

PW:这是一个很聪明的方法。

林晖:对,就是通过这种游戏化的方式,这种用户产品的方式,积累了大量带有文字标注录音这个事情,这个我觉得是今天我们推出的这个产品,已经是往后的一个基石,我积累了大量这样代标注的录音数据,它是覆盖了相当于基本所有中国人可能的水平,所有可能的水平阶段。

PW:你们的免费用户有多少?

林晖:现在最新的数字是3600万。

PW:所以这四年,加上几千万用户其实可以积累很大量的数据。

林晖:对,非常大的一个量。这批数据的价值其实非常非常大的,就先别说语音识别这件事情,你想想这批数据覆盖了基本上所有地方,我们现在基本上所有省、各个城市都覆盖了,这些语料,无论你是做语音识别还是做语言学的研究,都很有用。

当然我们现在只是用了它语音识别这一块的用处,因为它有文字的标注。再结合深度学习这件事情,我需要非常大的数据,再用深度的模型,我们就能够做出一个非常准确的语音识别的引擎来。当然这个语音识别的引擎是专门为中国人打造的。它是最能听懂中国人说英语这件事情的,因为我们的数据都是中国人的。

这个其实蛮有意思的,其他的大公司,比如说Google和苹果,他们也做英文的语音识别,但是它不是针对中国人做的,这是一个差异化,我们能够做得更垂直,比他们做得更深的地方。Google不会特定地为中国人,尤其是中国学英语的人来做这个。我们也跟Google去比较,因为他们的语音识别的功能是开放出来的。我们可以去做一个side by side的比较。直接拿过来,我们找一些我们知道正确答案的录音,然后来让这个机器识别,看看谁识别的比较准确,做了一个准确性的比较。

结果我们跟所有可能国外的,包括国内的,比如讯飞进行对比。我们发现在中国人说英语语音识别这件事情上我们是远远超过世界上所有其他公司的。这一点其实是今天我们能够在雅思流利说上做出一些别人没有东西的基石。

流利说是做一个从0到1的事情,我们是把一个技术真的推向用户,推向产品,去给他们做一个改变。创业一年多以后,我们再去听这些用户的录音,我觉得很欣慰的是,有些用的比较长时间的用户的录音水平提升非常多,很多用户真的是完全不一样了,我们有很多这样的例子。

PW:中间是一个什么样的阶段呢?因为刚才你说在技术上可能就是获取语音以及它标注的文字的数据,那个中间可能是做了一个什么样的规划,才让它达到这个点?

林晖:刚才说的那个是英语流利说里面解决的一个问题,它用游戏化的机制,用社区的方式。我们也有社区,把语言学习也件事情变得让大家更愿意参与,更愿意开口。就是说语言学习这件事情说白了,80%还是要靠练,你不练这个东西,它不是一个知识,你不练这个东西你是掌握不了的。

如果我们让大家开口,通过排行榜,通过游戏化的机制,通过社交的机制让你开口,然后给你反馈,然后你只要练的多了,自然会有提升。

当然后来我们觉得,发音只是语言的一部分,用户可能很多需求是提升,整体系统的提升他的语言的能力,这也是为什么我们后来推出了一个叫“懂你英语”的产品。

PW:懂你英语是一个什么样的产品?

林晖:它是今年7月发布的,但是研发其实时间挺长的。我们一开始想的是通过这种碎片化的内容,就是比较轻量级的。当然这也是我们的一个特点,就是说你用户因为这个进来了,流量有了,但是其实里面有很多用户其实是有这种诉求是说,我希望比较系统的提升我的英语能力,而不是只练发音。

这就是为什么懂你存在。懂你是不管你水平怎么样,先进来给你做个定级测试,你的英语水平是一级还是二级还是三级。

PW:那个级别是统一的标准,还是你们自己定的?

林晖:我们跟欧标是匹配的,就是相当于我们有一个严格的匹配。我们现在大概分了七个还是八个级别,八个级别,每个级别都对应欧标的比如说A1、A2、B1、B2这种,这个我们做了对应表,这个做了严格的对应。这个课程在全方位的帮你提升英语水平,不单是发音。

PW:所以其实你们是从2012年到今年主要做的事情是积累数据,加来做这些具体的产品。

林晖:对,整个脉络就是工具、社区,现在开始做服务。一开始是工具。

PW:工具、社区就是用来搜集数据的。

林晖:对,在这个过程中我们搜集了非常多的数据,技术其实也在演进。产品和商业模式也在演进,产品的进化的路径就是工具。我们先用一个工具的方式切入,人来了,他要练发音,练口语,进来了,怎么绑住他们?社区。怎么样变现?那就是服务,其实是这个脉络。但是技术上是从跟读再到识别,再到这种,除了发音以外所有纬度的评测。

(编辑:南平站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

推荐文章
    热点阅读