聚焦2016 关于语音识别、图像识别及大数据

图像、语音成为近两年最热门的概念，所谓娱乐驱动市场，市场驱动技术发展。在多元化的互联网圈里“好玩”才能红，而图像与音像也从过去的美化处理往更高深的技术领域前进，在2016年，智能的语音识别和图像识别将走进普通人的生活中，它们会有哪些展望和动作呢?让我们所见所听的世界将变得生动起来。　
\

　　语音识别
　　语音识别技术虽然起源于1952年，但真正进入消费市场已经是上世纪90年代的事了。目前语音识别有两大发展方向，一个是纯机械指令，基于产品定位而设计命令词组，作为高效的辅助工具存在;一个是智能化理解语境，与人进行互动交流，并承担部分处理工作。后者可能是语音识别未来的发展方向，但实际应用中两者并不冲突。简单精准的机械指令让工作更为纯粹，没必要做多余的计算动作。而很多智能设备将语音作为“解放双手”的第三类互动形态，就需要对人的语境进行“理解”，相信很多朋友都玩过siri、GoogleNow、Cortana，也同时体验过这些语音助手“会错意”的卖萌行为。老罗在去年坚果发布会上曾说所有语音助手都是“伪”智能，虽然有点以偏概全，但目前语音对语境的识别确实还不够智能，远不如机械指令效率。不过这些问题随着深度学习等AI领域技术的崛起将逐渐克服。