发布会看点三:颠覆式的语音交互技术
老罗的吐槽
罗永浩曾经在他的微博中提到:跟siri和它的抄袭者们的拙劣设计完全不同,我们已完成一个颠覆性的语音产品方案,我有把握你会每天用它,而不是像试siri一样,耍弄一番就不用了。国内语音技术供应商里,讯飞的技术很好,但它是一个有国营气质(你懂的)的企业,沟通效率巨恐怖。请问北京有靠谱的语音技术供应商吗?我们已经等不了了!
老罗微博:Nuance的技术是IBM的,语音识别技术全球第一,但中文语料库方面因为不重视,实际使用效果跟讯飞比还是差一些。另外,跟国外公司的合作沟通,效率也很差......关键是这帮臭洋鳖不知道哥是谁。
老罗微博:我等不了官僚无比的讯飞的下一步消息了。2.如不能很快解决语音技术供应商,发布会将砍掉语音方案部分,放到下一代版本中。3.方案公布后如讯飞胆敢像抄袭siri一样抄我们,我会让它彻底西门子。4.某流氓公司就别推荐了,为了不跟流氓合作,我连该公司最强项的音乐服务都选了其他合作商。
语音助手类软件现状
语音助手这类的软件大概可以拆成2层来看:(1)核心是自然语言人机交互的方式(2)语音数据库部分采用别家公司的技术。
单从自然语言分析来说难度不大,Google,IBM等公司都有这些成熟的技术,部分国内的科研机构也可以做到。SIRI技术优越之处是集合时间地点等情景分析,各项技术的集成研发高性能的语音识别技术的确不容易。就Siri来说,产品核心优势并非语音识别(这部分应当是Nuance的活儿),而是构建一个智能助理系统。
老罗会怎么做?
从老罗的吐槽当中我们可以看到,语音库上没有太大的问题,目前的老罗要解决的问题应该是以下两点:(1)语音数据库(2)人机的交互技术。尤其重点在交互技术(因为语音库就是要从现在有的几家当中挑一个),而交互技术才是老说强调的会让大家眼前一亮的部分。
前面老说的吐槽中提到过,很多人都会觉得使用语音识别软件这种方式傻X,那么为什么会觉得傻X呢?因为你是在跟机器说话,一个人和一个机器交流这是一种我们不太能常见到的景象,好像疯子在自言自语一样,所以很多人会觉得傻X。那么,怎样才是不傻X的呢?无非就是使用语音助手看起来不是那么的怪异,而是我们日常生活中常见的形态,也就是你使用手机时看起来跟别人使用手机没什么不同。那么笔者大胆猜测一下,Smartisan OS的语音助手,用起来的方式将会是像打电话一样的自然,或者是你可以直接跟语音助手通过打字的方式进行交流,这样看起来就像是你在发短信。
▲使用起来不要显得怪异 是目前语音交互软件需要克服的一个难点
Smartisan发布会 最新消息
老罗的锤子科技首席设计师NodYoung在上公开了即将举办Smartisan OS的会场环境照片。从照片上可以看出发布会的现场不是剧场,而是一块空地,自己摆放椅子。和苹果的发布会非常相似。
这一点在老罗的的语言当中也得到了验证:“我这些年做的大型场馆演讲从形式上都是学的乔布斯的发布会(就是巨型背投幕,极少的几束染色灯,加keynote默认主题,网上到处都是,不用预测。”同时老落也为3月27号的发布会定制了一块投影幕布,这可能是史上最16:9的幕布,刚好16米宽,9米高。