中文  |  ENGLISH
华捷艾米:创造一款体感摄像头有多难?

微软研究体感技术,已经有10年多的历史了,期间注册专利无数,随着kinect的大火,国内不少公司也开始跟随微软的脚步去研发体感技术,但不少公司都无法真正读取到其中的精华,华捷艾米公司站在微软的肩膀上,花费6年多的时间,终于彻底解开体感技术的奥秘,开发出IMI体感摄像头。


IMI体感摄像头有两个关键技术,实时三维场景重建和实时人体骨架提取,两者缺一不可。华捷艾米技术总监表示,要自己做体感设备,这两个技术问题都必须要解决。前者只能告诉你东西的远近,后者会告诉你哪些东西是头,哪些是身体,哪些是四肢等。

跟进或者模仿也有不同的形式,一种形式和我们的山寨手机的路子相似,去买核心的芯片,自己做一下外围的东西包装一下,另一种是把所有的工序都重新造一遍。前一种难度比较低,市面上大部分体感公司都是这么操作的。主要因为实时三维重建的技术可以通过购买primesense的芯片实现,而primesense已被苹果公司收购,贸用只能是侵犯别家公司的知识产权。

实时人体骨架提取是微软独家的,但它不卖芯片,所以想要做类似的体感设备,必须自己去把这道工序造出来。不幸的是,实时人体骨架识别很难造,华捷艾米公司花了巨大的财力才做成。


IMI的方法是机器学习,做过机器学习的技术人员一定知道样本库有多重要,它是一切机器学习算法的基础,没有样本数据,或者样本不够好,再好的算法也只能是“巧妇难为无米之炊”,但是反过来,如果算法看起来不是那么牛逼,但数据很好,你仍然可能把识别的精度做得很高,所以说样本数据是机器学习系统的一部分也不为过。

通俗点说,这就像有一个人告诉你,要成为一个像他一样成熟的男人必须要有丰富的人生阅历,但他没告诉你他的人生经历具体是什么样的,即使说了一些,也是他自己加工过的,和真实有很大差距,所以,他说的这些对你来说用处不大。


华捷艾米公司在训练可以用于骨架识别的模型时,使用了上百万张深度图,测试时使用了上万张手动标记过的深度图,正是这些数据,成为了巨大的技术分水岭,将华捷艾米公司与“伪体感”技术公司区分开来。

目前华捷艾米公司已申请了包括三维场景重建、人体骨架提取和微纳米光栅等技术的专利,能够为各大公司定制体感技术的全套解决方案,有合作意向的厂商可在后台留言,我们将第一时间进行回复。