Spatial AI
By author:
| 3 minutes read
最近在读《小米创业思考》, 其中读到雷总关于互联网的思考,
基于这些思考,我对互联网的理解就是,互联网是一种工具, 也是一种价值取向,更是社会意识的形成机制和社会生产新的组织机制、发展模式。它最大的价值在于广泛推动人与机构彼此赋能,从而推动信息传递、沟通,以及生产和消贵的效率提升。 互联网最美好的地方,就是它可以赋能产业,赋能组织,赋能我们每一个人。当一个人连接上网络,他可以随意采摘全世界的信息,也可以向全世界贡献他的能力,而不受空间和时间的限制。 这些赋能是高效的,任何一个人都能迅速联系他想联系的人和机构,获取他所需的信息;任何一个服务提供者都能快速联系到他的每一个用户,而且同样快速准确地获得每一个用户的反馈。信息传递速率之快,环节之短,传递面之宽广,都是之前无法想象的。
互联网的时代的特点,如果概括的来说,主要体现在信息的速度。 互联网让人们能够更快的访问信息。那么AI时间的特点,概括来说,就是信息的密度,让人们更加高效的处理信息。
今天听闻李飞飞教授创业,其方向为空间智能 。 有些朋友好奇空间智能对应的是什么? 回答这个问题之前 ,先定义一下,什么是智能。 智能,是信息的感知、推断以及对于信息的应用。 自然语言是信息、代码是信息,图像、声音、点云也是信息。
语言模型对应的是语言智能,即针对语言的感知理解、推断以及应用(比如生成)。 那么空间智能即面向于空间的信息表达的智能。 这样说,还是有一些绕。 空间的一种表达是2D的图像, 我们以图像为例,我们熟知的物体检测、识别、美颜、图像去噪,就是针对图像的智能。
语言具有极强的概括性,可以认为是已经是一种高信息密度的符号体系。 然而空间却非如此,或者对于空间信息的处理,人们经常是习以为常,认为其是common sense。 而就是这些common sense, 对于机器人来说,却是很艰难的。
小学写作文,会有看图说话,这其实就是两种信息之间的翻译,需要调用针对图像的智能以及针对语言的智能。 我们对于图像的理解,可以是图像中包含了什么物体、相对的位置关系,也可以是对于物体未来变化概率的呈现(比如放在桌边缘的苹果,即将掉下来)。
什么是空间智能呢?通过对于空间的感知,从而得到的空间中物体属性、趋势的推断以及可以对此施开的操作,就是空间智能
- 看到迎面开来的车,知道其下一时刻的位置,知道如何避让,是空间智能;
- 看到桌面上的物品,知道哪些是可以吃的,哪些需要使用工具才能夹起来,或者判断其的味道,也是空间智能;
- 看到冰箱的门,知道如何用力,才能打开冰箱,是空间智能;
- 看到台阶,知道如何调整重心从而能够拾级而上,是空间智能;
- 望闻问切中的望,也是空间智能。
- …