图像、语音成为近两年最热门的概念,所谓娱乐驱动市场,市场驱动技术发展。在多元化的互联网圈里“好玩”才能红,而图像与音像也从过去的美化处理往更高深的技术领域前进,在2016年,智能的语音识别和图像识别将走进普通人的生活中,它们会有哪些展望和动作呢?让我们所见所听的世界将变得生动起来。
\
语音识别
语音识别技术虽然起源于1952年,但真正进入消费市场已经是上世纪90年代的事了。目前语音识别有两大发展方向,一个是纯机械指令,基于产品定位而设计命令词组,作为高效的辅助工具存在;一个是智能化理解语境,与人进行互动交流,并承担部分处理工作。后者可能是语音识别未来的发展方向,但实际应用中两者并不冲突。简单精准的机械指令让工作更为纯粹,没必要做多余的计算动作。而很多智能设备将语音作为“解放双手”的第三类互动形态,就需要对人的语境进行“理解”,相信很多朋友都玩过siri、GoogleNow、Cortana,也同时体验过这些语音助手“会错意”的卖萌行为。老罗在去年坚果发布会上曾说所有语音助手都是“伪”智能,虽然有点以偏概全,但目前语音对语境的识别确实还不够智能,远不如机械指令效率。不过这些问题随着深度学习等AI领域技术的崛起将逐渐克服。 |