业界

形成一个快速迭代的反馈闭环-上零距离

字号+ 作者:搜狐号 来源搜狐号搜狐号自媒体 2018-05-21 01:36 我要评论( )

很多人说,相比技术人员的匮乏,人工智能领域更迫切需要新型产品经理。进而我们也开始琢磨,什么才是人工智能产品?启动一个 AI 类产品必要因素有哪些?新型

很多人说,相比技术人员的匮乏,人工智能领域更迫切需要新型产品经理。进而我们也开始琢磨,什么才是人工智能产品?启动一个 AI 类产品必要因素有哪些?新型产品经理必备的素质是什么?技术之外,那些被我们忽略的挑战又是什么?如何用产品创新跑赢技术变迁速度?


由此,我们在半年前启动了关于产品的系列报道计划,讯飞输入法由于可见的用户规模成为首先进入我们视野的案例,欢迎持续关注并提供线索及想法。


在技术趋势、公司基因和互联网产品方法论相互作用下,讯飞输入法成为科大讯飞迄今为止最成功的消费级产品。如今,人工智能即将给输入法带来二次变革,讯飞基因将输入法推上了一条不同于其他竞争对手的道路。

「方池非常爱吃琵琶。」 朱萧木输入这样一句话。

纳尼?「琵琶」明显是一个同音错词。

「吃枇杷的枇杷。」朱萧木说出修改指示,讯飞输入法自动将句子中的「琵琶」修改为正确的「枇杷。」


形成一个快速迭代的反馈闭环-上零距离


语音修改同音错字并不是个新概念,讯飞一直在尝试,最终做出满意效果


这是 11 月 7 日,锤子坚果 Pro2 发布会上的一幕。

目前,讯飞输入法语音识别率已达 98%。以自然语言交互的方式修改同音错字来提高识别率, 部分有效解决了技术也束手无策的 2% 问题。

「3 年内,个性化语音用户的语音识别率可以达到 99%。」讯飞输入法产品总监翟吉博告诉我。

发布会的第二天,我打开谷歌搜索,输入「锤子手机,讯飞输入法」。与一年前的刷屏级反响不同,首页大部分新闻还停留在 2016 年的那场发布会上。如今,讯飞输入法累积用户已达 5 亿,或许人们已经熟悉了这款曾让他们惊讶不已的产品。

「一夜爆红」的开始

整个过程中最难的地方在于,当你不知道这件事情是否可行时,你要能证明它可行。——胡郁


科大讯飞总部位于合肥市高新区。讯飞输入法设在公司总部大厦 7 楼,占据整个楼层。拜访时,正值公司午饭时间,满载员工的四部电梯正忙上忙下。我们只好直达 8 楼,再从楼梯下到 7 楼。推开门,迎面而来的电脑屏幕实时显示着输入法关键数据指标,键盘声此起彼伏。偌大办公室的一角摆着几张小圆桌和椅子,几个年轻人正在做头脑风暴,身后不远的墙壁上贴着几张员工旅拍照片,笑起来还像是学生。


形成一个快速迭代的反馈闭环-上零距离

讯飞输入法七楼办公室

2016 年 10 月锤子手机发布会后,「蹿红」、「一夜爆红」、「网红」成为各大媒体报道讯飞输入法的标配。不过,我们很难将眼前的景象和这些机会主义字眼联系起来。

早在 2014 年,讯飞输入法语音识别率已达 97%。数字背后,是累积超过 2 亿的用户,约占中国居民 15%。「当采用创新的人数扩大到居民的 10%~25% 时,扩散进展会突然加快,曲线迅速上升并保持这一趋势,进入 『起飞期 』」。E.M.罗杰斯在《创新的扩散》中写道。两年后,2016 年,输入法累积用户就翻了一番。

但在七年前,「一切几乎从零开始。」讯飞输入法研发项目负责人程坤说,「苹果和安卓系统也刚刚出来。」

当时,讯飞从事业部抽调了三名员工攻关输入法,程坤是其中之一。「吉博当时在研究院,我在通信增值事业部,还有平嵌部同事。」除了翟吉博有输入法方面的经验,其他人从未涉足过这个领域。

形成一个快速迭代的反馈闭环-上零距离

讯飞输入法研发项目负责人程坤,也是输入法创始团队成员之一

没有明确分工,每人身兼数职,白天写代码,晚上做测试。通宵达旦两个月后,讯飞输入法诞生。因为主打语音技术,最初版本仅配备了最为常见的拼写、手写基本功能,键盘只有 26 格,取名讯飞语音输入法。

环顾办公室四周,一面墙上贴满了专利复印件,紧靠另一面墙的书架上,摆放着大大小小的奖杯。很难想象,最初版本的语音识别率只有 60% 左右,「刚开始大家都觉得难用。」科大讯飞执行总裁胡郁曾在一次公开讲座中坦言。当时,输入法使用的隐马尔科夫模型最早可追溯到上世纪七十年代。


形成一个快速迭代的反馈闭环-上零距离

办公室的专利墙


60% 的识别率,意味着输入 100 个单词会有 40 个以上的错误,即使提高到 80%,也仅仅是勉强可用。用户对识别出错的忍受范围临界点是什么?会不会接受这样一款产品?语音识别技术何时迎来爆点?没有人知道确切答案。「整个过程中最难的地方在于,当你不知道这件事情是否可行时,你要能够证明它可行。」胡郁说。

何况,前浪和后浪都容易死在沙滩上。

「产品即服务」

没有人能打败趋势。


2007 年,一片简单的多点触控玻璃开始改变世界。1 月 9 日,苹果发布第一代手机,首次推出多点触控技术。同年,微软推出 Surface 平板电脑。

「这就是未来。」乔布斯第一次见到这项技术时预言道。想拨号,屏幕会显示数字,想写东西,调出打字键盘。当用户想观看视频时,这些键盘都会消失。「你想想,我们能在这个基础上做多少创新。」乔布斯曾说。

「iPhone4 才真正引起国人追捧,但苹果推出第一代手机时,我就开始关注它了。」翟吉博回忆说。一份创新研究显示,77% 的创新来自领先用户,处在组织结构基层的员工更加具有创新性。坐在对面的翟吉博,眼睛明亮有神,思维敏捷但语速平缓。2008 年从上海交大硕士毕业后,翟吉博进入上海的摩托罗拉中国研究中心,从事模式识别方面的研究。

形成一个快速迭代的反馈闭环-上零距离

讯飞输入法产品总监翟吉博


「基于触屏的全键盘输入体验不太好。屏幕太小,手指粗。」翟吉博说。当时,苹果手机的多点触控触摸屏 3.5 英寸,市场手机屏幕平均大小 3.2 寸。屏幕变化会影响信息交互。「我习惯从用户角度看技术。」他说。

实体键盘向触摸屏幕输入的转变,给输入法带来新的机会。输入法是一种用户粘度很高的工具应用,约 80% 的用户不会主动更换主要输入法,70% 用户不会尝试其他输入法。搜狗输入法在 PC 端市场处于绝对主导地位,这一相对优势帮助搜狗从 PC 端顺利迁移了大量用户到智能手机端。对于新入局的创新者来说,在输入方式上做文章,机会更大。

2008 年,初创公司触宝迅速对市场反应,推出日后大受欢迎的滑行输入。讯飞的语音基因,促使翟吉博选择在既有输入键盘上增加一个麦克风图标。

但是,一个老问题摆在面前:语音识别率久久得不到突破。

尽管,IBM 早在 1995 年就开始尝试语音识别技术商业化,并在两年后开发出日后名声大噪 Via Voice 的前身——世界第一个中文连续语音识别产品 Via Voice 4.0。但在当时,轰动也多半停留语音技术圈。「刚推出,我就满怀希望地试用了这个软件,但感到很失望,远没有达到解放双手的愿望,使人感到实用的语音识别系统还在路上。」《环球科学》杂志社社长陈宗周曾在一篇文章中感叹道。

2006 年,在当时识别准确率还不高的情况下,摩托罗拉「明」系列手机开山之作 A1200 就尝试提供语音技术服务。「无异于刀尖上起舞,」云知声 CEO 黄伟事后回忆道,当时他也是摩托罗拉语音技术服务团队的成员之一。

不过,多点触控技术被推向主流后,谷歌等巨头做语音的思路开始发生变化。成熟的多点触控技术、2-5 年后有望进入主流视野的云计算与智能手机人口红利交织在一起,为变革语音产品思路奠定了坚实基础。

2008 年,谷歌把语音识别和搜索相结合推出了 Google Voice Search,这是一个具有里程碑意义的事件。先将语音转成文字,利用文字调动搜索引擎,丰富的用户数据就能不断优化这个语音系统,形成一个快速迭代的反馈闭环。相比之下,IBM ViaVoice 之所以失败的重要原因之一就在于其本地化方式,不是互联网产品思路。

巨头示范无异于一剂强心针。「基于大数据、云计算和机器学习的系统框架可以满足语音输入大规模应用的需要。」翟吉博说。主打语音输入,以最快速度进入市场,讯飞输入法赢得先发优势。2012 年,国内其他输入法才陆续支持语音输入。

跨越鸿沟

细节,还是细节。


「这个我们有专利。」讯飞输入法运营经理袁章一边演示,一边说。点击键盘,即可进行拼写输入,如果想变成手写,无需其他操作,直接在屏幕上写字即可。点击工具栏上的麦克风图标,就能进行语音输入。


形成一个快速迭代的反馈闭环-上零距离

作者苹果手机上的讯飞输入法界面


「赞!」对于我这种很容易在不同输入方式切换中迷路的小白用户来说,「无缝切换」设计带来的体验超乎预期。体验的基础是用户需求,「超出用户预期才有可能形成传播。」翟吉博说。


形成一个快速迭代的反馈闭环-上零距离

----本文结束----上海零距离----本文结束----
上海零距离,上海热线,上海零距离,上海网

本网站资讯内容,均来源于合作媒体和企业机构,属作者个人观点,仅供读者参考。 本网站对站内所有资讯的内容、观点保持中立,不对内容的准确性、可靠性或完整性提供任何明示或暗示的保证。咨询联系whiteking999@foxmail.com

相关文章
  • 目前的国内智能音箱仍主要集中于利用语音交互来控制空调、空气净化器、扫地机器人、风扇以及加湿器等家居设备-上零距离

    目前的国内智能音箱仍主要集中于利用语音交互来控制空调、空气净化器

    2018-07-12 23:10

  • 发力智能语音:苹果成立AI/ML团队-上零距离

    发力智能语音:苹果成立AI/ML团队-上零距离

    2018-07-11 09:34

  • 苹果被起诉侵犯专利 这次惹祸的是Siri语音助手

    苹果被起诉侵犯专利 这次惹祸的是Siri语音助手

    2018-07-08 06:24

  • 将为用户与车之间提供更深层次的智能语音交互能力-上零距离

    将为用户与车之间提供更深层次的智能语音交互能力-上零距离

    2018-07-05 20:43

网友点评