语文网-语言文学网-读书-中国古典文学、文学评论、书评、读后感、世界名著、读书笔记、名言、文摘-新都网移动版

首页 > 学术理论 > 语言学 > 圈外·视野 >

场景应用成智能语音决胜关键(3)


    之前,科大讯飞的模式是:提前在技术上布局、积累,等待“风口”到来后爆发。创新工场董事长兼CEO李开复表示:“大部分价值数十亿美元的中国软件公司全都是借助互联网的爆发完成了积累,科大讯飞走的却是一条艰苦的发展之路——他们很早就研发了语音识别的尖端技术,寻找早期的使用者,挖掘出一个当时并不存在的市场。”
    在互联网时代,基础技术提供商的危机在于,无法直接接触终端消费者,而被其他公司层层“剥削”利润,往往容易受到巨头价格战和免费模式的绞杀,这是许多基础技术提供商压力剧增的重要原因,也是科大讯飞不得不转型的关键。
    科大讯飞目前的策略就是,为大部分领域提供底层的技术服务,但是在人机交互(如电视、手机、汽车的应用)、儿童教育领域、国家信息安全传播三大分支领域,跳脱单一的技术提供商角色,提供深化的应用服务。
    全球许多科技公司都有这个特点:靠科技驱动,而对消费者的实际需求缺少切实的充分考量。他们的口号是:在火车出现前,人们只会说,“我想要一匹更快的马”。开创前沿科技的人认为,消费者是被动的,消费者需要被技术引导,而不是“技术大佬”来服务消费者。
    然而,语音技术有点尴尬。它既不被认为是“科技巅峰”技术,也不被认为是消费者普遍的基本需求。高低两头都不占优势。
    不得不正视的问题是,用语音来实现人机对话,是消费者的刚性需求、不得不用吗?在哪些情况下是刚性需求,哪些情况下是锦上添花或玩具?针对记者的这一提问,业内各家公司都没有给出明确回答。“用户最基本的需求还没满足,何况语音这种非刚性需求。”科大讯飞上市前,关注并投资过该公司的一位股权基金董事总经理告诉《国际金融报》记者。
    阿里云的技术人员说:“关键是,你要找到用户真正刚性的需求,而且是用户真正需要,不是你想象的以为别人需要。用户愿意付费或者离不开的应用场景是什么?”
    “出门问问”首席技术官(CTO)雷欣向《国际金融报》记者表示,某些场景下语音确实是刚需,比如开车时不方便接电话、不方便输入文字等。然而,“出门问问”也没有再举出更多语音作为刚需的场景。
    因此,各公司基本都开放了自己的语音云平台,免费提供多项服务,一方面吸引用户提供数据,一方面从中找到语音技术的“用武之地”。
    行业格局:基本都to B
    以后开会时,现场速记就可以由机器自动完成。机器语音识别率可以达到95%左右,远超过人类速记员的速度和准确率。
    不会外语听不懂外国视频?用YouTube的人都知道,不论哪部视频,YouTube可以自动显示其字幕,也可以自动翻译成用户需要的语言。
    不会外语怎么跟外国人打电话?机器可以直接帮你把声音相互翻译成彼此的语言。
    语言是人类区别于动物的重要标志,是人类智力最基本也最高级的体现形式之一,企业正让机器也可以像真人一样机智地执行命令。
    4月13日,百度宣布公司部门重构。百度董事长兼CEO李彦宏宣布,今后他将把人工智能作为自己工作的三大重点之一。人工智能将成为互联网后人类科技新高地,这几乎已成全球共识,但如何切入?智能语音是一些公司选择的切入口。 (责任编辑:admin)