加入收藏 | 设为首页 | 会员中心 | 我要投稿 南平站长网 (https://www.0599zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 创业 > 模式 > 正文

专访“流利说”首席科学家林晖:如何用机器学习帮中国人说好英语

发布时间:2016-11-21 06:10:57 所属栏目:模式 来源:品玩
导读:副标题#e# 由于长期“哑巴英语”式的语言教育,大部分以英语为第二语言的中国人一直都有着一个问题,那就是擅长读写,却在不擅长口语。但由于资源有限,不是每一个有英语口语提升需求的人都能得到外教的一对一辅导。针对这个问题,英语流利说的解决方法是利
副标题[/!--empirenews.page--]

由于长期“哑巴英语”式的语言教育,大部分以英语为第二语言的中国人一直都有着一个问题,那就是擅长读写,却在不擅长口语。但由于资源有限,不是每一个有英语口语提升需求的人都能得到外教的一对一辅导。针对这个问题,英语流利说的解决方法是利用人工智能技术来帮助中国人提升自己的口语水平。

流利说成立于2012年,到目前这款产品已经获得了约3600万用户。流利说的主要功能是提供文本并让用户跟读,然后系统会根据用户的发音准确度给出评分和建议。流利说App上提供的素材涵盖了从日常对话到留学、面试等诸多场景,因此受到了大量英语学习者的追捧。

14234472516970487_600_0

但这项根据指定文本跟读的产品并不是这么简单,它背后其实暗藏着流利说想要用机器学习技术帮助中国人整体提升英语水平的野心。

在接受PingWest品玩采访时,流利说首席科学家林晖表示,早在2012年公司刚刚成立时,这家公司就决定要在语言学习中利用机器学习技术。但由于创业公司在数据上的匮乏,而机器学习又需要大量的数据才能被训练得很智能,因此流利说决定先推出以上的跟读功能,收集中国人的口语语音数据。

经过了4年时间以及累计3600万用户的使用,现在流利说已经掌握了大量不同口语水平的中国人说英语的语音数据。而且由于这些语音是跟拟定文本结合在一起的,所以它们是一种带标签的数据,对机器学习系统来说更加宝贵。

根据流利说和新浪教育共同发布的《中国英语口语白皮书》,流利说目前已经收集了广泛的用户学习行为记录和长达2.75亿分钟、31.9亿句之多的庞大录音数据库。

到现在,流利说已经根据这些数据推出了两款服务型产品,分别是懂你英语和雅思流利说。其中懂你英语通过递归神经网络的深度学习模型,让流利说的自适应学习系统产生了自学习能力,让学生不断接触到相关性越来越高的学习内容。

另外,流利说刚刚上线的雅思流利说同样利用了被以上语音数据训练过的人工智能系统,帮助雅思备考生完成成绩评估和备考方案。由于雅思考试口语阶段评判上的主观性,雅思流利说能够准确地理解被测者的语义,从而给出一个相对客观的评分。

在上周PingWest 举办的 HAY!16 大会上,PingWest采访了流利说联合创始人兼首席科学家林晖,他向我们详细解释了流利说这款产品4年间的产品脉络:用工具积累数据,用社区沉淀用户,再用数据打造人工智能的口语学习服务,并实现商业化。

liul

流利说主要团队成员,左一为林晖

林晖博士毕业于华盛顿大学西雅图分校,曾任 Google 美国总部研究科学家。他也是语音识别、自然语言处理、深度学习及大数据挖掘算法专家,曾在相关领域发表三十余篇国际论文,拥有多项中国及美国专利。

以下是采访实录:

PW:能简单聊一下你的个人经历吗?

林晖:我2006年在华盛顿大学西雅图分校读了一个博士,研究的方向主要是机器学习,理论方面的一些研究,当时做了一些自然语言处理方面的应用。整体来说我从事这个领域大概十几年吧。在那之前我在清华做的也是技术方面的,当时我在电子系。那个时候MSRA也就是现在微软亚洲研究院刚刚建立,当时我还没有想好说是去工作还是出国,所以读了硕士,并且读硕期间正好有个机会在微软亚洲研究院实习了半年。

我觉得MSRA这段经历对我影响挺大的。那时候它其实是有一些比较前沿的,尖端的一些技术的研发,你可以看到今天AI火起来以后,大概有一大半的人之前都在MSRA呆过。他们那时候做的东西就是跟AI相关的,我那时候去做的也是做跟语音识别相关的东西。

那段经历让我感觉就是,做一些比较新的技术,比较前沿的技术的研究其实是很有意思的。所以在那之后,我决定去国外读一个博士。当然当时做出这个选择的一个原因是说:我觉得我在技术上、工程上没什么问题,但是这种比较深入的技术,比如说机器学习我希望我再深造,再了解得更多。所以我去美国读了一个博士,博士的方向也是比较偏机器学习理论的研究,比较偏理论的东西。

在那个时候我就觉得,首先我对这种新的事物,未知的一些有很强的好奇心,我希望去探索、开拓一些方法。另外我希望自己做的事情是真的能够不停留于理论,不止于发一些论文,而是有一些真正产生实际的价值,影响人们的生活,这就是我为什么会积极的去工业界实习的原因。

在我博士期间我去了Google实习。Google给我的印象非常深刻,它不同于其他之前所有的大公司的研究机构,它的研究和生产是结合的非常紧密的,就跟产品和业务是紧密在一起的,它的科学家都是在产品组里面,都是跟业务组在一起的。你做的事情,做出来了,能够直接影响到百万千万的用户。

当时我觉得是挺有意思的,因为我在微软亚洲研究院实习的时候做的是做与语音相关的东西,那时候我觉得语音识别还不成熟,而且效果也不好。但那时候Google做了一个产品叫 Voice Search(语音搜索),我用了就觉得非常惊艳,它真的解决了我一些问题。就是有时候不方便的时候,我要在手机上搜索,就直接用语音搜索,而且非常准,我觉得很有意思。

PW:那是什么时候?

林晖:那个时候是2010年、2011年,Voice Search其实出来蛮早的。但是Google有这个优势是什么?就是说它能够通过文本的search query(搜索语句),来更好的判断人们说的什么。因为基本上大家搜索的意图是差不多的,无非是不同的形式,用语音还是文本搜索。但是Google之前集约了很多文本搜索的查询的基础。

Google推动 Voice Search的策略对我们现在做流利说其实也很有帮助的,就是说怎么样去冷启动一个与人工智能相关的东西。当时Google做的是一个叫411的项目,就是通过用户去打一个电话,然后查询一个地名。看起来这个项目比较平淡,但是它其实是在做搜集数据的作用。

因为在美国那时候电话查询还是比较常见,所以通过这个项目,它积累了很多的数据,也就是语音对应的文字的数据。

流利说其实也是这样一个策略,我们一开始想解决的问题是什么?用户开口的问题,就是说哑巴英语,中国人学这么多年都是哑巴英语,那我们希望给口语做一个评测,做一个评分。本质上我们想做的可能更多的是识别你说什么。

但是我们一开始没数据,作为一个创业公司,我们那时候就三个人,那时候一开始做的时候也并没有去融资。

PW:哪一年开始做的?

林晖:我们2012年9月开始做。那时候移动互联网刚起来,反正这个具体故事也可以再聊,但是我现在先集中在数据这一块。

(编辑:南平站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

推荐文章
    热点阅读