机器学习模型训练依靠传感器产生的海量数据

传感器数据将有助于推动AI的发展。 AI系统也同时扩展我们处理数据的能力，并帮助我们发现这些数据的创造性用途。除此之外，这也将激发新的机器人外形设计要素，帮助我们收集更多不同模式的数据。当我们以新的方式提升“看”的能力时，我们周围的看似“日常”的世界，很快就会成为下一个发现的前沿。现在我们都对AI很熟悉了，也知道算法的完善离不开海量的数据。数据量越大，算法给出的结果可能就越精准，越“如人意”。人对世界的感知，很大一部分是基于我们的感官获取的“数据”。机器人和目前很火的无人驾驶依靠的则是来自传感器的数据。随着传感器获取和处理的数据量越来越大，智能机器人的发展也将到达一个“临界点”。
只要是想扩展业务或建立网络的人，应该对“网络效应”很熟悉。例如，使用像eBay、淘宝这样的市场平台，买家和卖家越多，它就越完善，用处也就越大。那么，数据的网络效应指的就是，随着服务使用的增加，服务也变得越来越完善的动态过程，比如，随着机器学习模型训练数据量的增加，模型得到的结果也越来越准确。机器学习模型训练依靠传感器产生的海量数据
传感器数据和处理能力
自20世纪60年代初以来，就已经有光的探测和测距(激光雷达)传感器了。这些传感器已经在地理信息学，考古学，林业，大气研究，国防和其他行业中业以及经投入使用。近年来，激光雷达也已成为自主导航的首选传感器。
Google无人驾驶车辆上的激光雷达传感器每秒可产生750MB的数据。机上的8台计算机视觉摄像机每秒钟产生1.8GB的数据。所有这些数据都需要实时处理，但是集中计算(在云端)在实时的高速情况下，还不够快。为了解决这个计算不够快的瓶颈，我们通过分散计算，来提高处理能力。

　　
AI的快速演变
人工智能的下一个探索领域是机器人技术，如果你想知道这背后的原因，那你得先了解了解人工智能本身是如何演变的。
近年发展起来的机器智能系统能够利用海量的数据，但在上世纪90年代中期，根本还没有这些数据，互联网也还处于起步阶段。随着存储和计算方面的进步的出现，快速，经济地存储及处理大量数据成为可能。不过，这些工程上的进步本身并不能解释人工智能的快速发展。
开源的机器学习库和框架虽然看起来“没什么动静”，但是起到了同等重要的作用。 15年前，在科学计算框架Torch发布BSD许可证时，里面包括的许多算法现在的数据科学家还在使用，包括深度学习，多层感知器，支持向量机和K最近邻算法。
软件许可证是一种格式合同，由软件作者与用户签订，用以规定和限制软件用户使用软件(或其源代码)的权利，以及作者应尽的义务。常用的软件许可证包括：GPL、BSD许可证、私权软件许可证。
最近，像TensorFlow和PyTorch这样的开源项目也为这个共享的知识库做出了宝贵的贡献，让不同背景的软件工程师能够开发新的模型和应用程序。计算机域的专家需要大量的数据来创建和训练这些模型。因此，大公司拥有巨大的优势，因为他们可以利用现有的数据网络效应。

目前大多数自主车辆的解决方案是使用两个车载“盒子”，每个盒子都配备Intel Xeon E5 CPU和4到8个Nvidia K80 GPU加速器。最高性能表现情况下，这消耗5000W以上的电力。 Nvidia新推出的Drive PX Pegasus等硬件创新技术也开始尝试更有效地突破这一瓶颈。
网络外部性(network externality)，又称网络效应(network effect)或需求方规模经济(demand-side economies of scale)，指在经济学或商业中，消费者选用某项商品或服务，其所获得的效用与“使用该商品或服务的其他用户人数”具有相关性时，此商品或服务即被称为具有网络外部性。最常见的例子是电话或社交网络服务：采用某一种社交媒体的用户人数越多，每一位用户获得越高的使用价值。
无人驾驶车辆和其他智能机器人依赖的是传感器，这些传感器产生的海量数据量，并且越来越庞大。获取的数据可以被用来构建更好的AI模型，然后机器人可以依靠这些AI模型，做出实时决策，并在真实世界、真实环境中“找到方向”。
当今智能机器人的核心是AI与传感器的融合，可以产生了良性的反馈循环——我们也可以称之为机器人“网络效应”。目前，我们正处于引爆这一网络效应、彻底改变机器人的临界点。
AI发展临界点
我们处理传感器数据和融合各种数据模式的能力将继续推动智能机器人的发展。为了使这种传感器融合能实时发生，需要把机器学习和深度学习模型分散开来。当然，分散式AI对分散式处理器的要求更为复杂。
值得庆幸的是，机器学习和深度学习计算效率正不断提高。 Graphcore的智能处理单元(IPU)和Google的张量处理单元(TPU)等成本也不断降低，在规模上加速神经网络的性能的提高。
在其他方面，IBM正在开发模拟大脑解剖学的神经形态晶片。芯片雏形使用一百万个神经元，每个神经元有256个突触。该系统特别适合于解读感官数据，因为它的设计是模拟人类大脑解释和分析感知数据的方式。机器学习模型训练依靠传感器产生的海量数据

　　所有这些来自传感器的数据，意味着我们正处于机器人网络效应的临界点，这个转变将对人工智能，机器人及其各种应用产生巨大影响。
数据新世界
机器人网络效应的影响，不仅在于新技术和新机器能够更快地处理更大的数据量，而且还能处理更多不同类型的数据。新的传感器将能够检测和捕获让我们“意想不到”的数据，因为人类感知的局限性，这些数据我们可能根本想象不到。机器和智能设备会把丰富的数据传送到云端和邻近的代理，为决策提供信息，加强协调，并在模型改进中持续发挥重要作用。
这些进步比许多人意识到的要快得多。例如，Aromyx使用受体和先进的机器学习模型来构建传感器系统，并为气味和口味数据的采集，索引和搜索提供平台。该公司的EssenceChip是一种一次性传感器，输出生化信号。这些信号与当人类闻到或品尝食物或饮料时，发送到人类大脑的信号是一样的。
Open Bionics 正在开发机器人仿生手臂，仿生手臂依靠从手臂套筒内的传感器收集触觉数据，借此来控制手和手指的移动。这种非侵入式设计能够通过机器学习模型，将电极感测到的精细肌肉张力，转化为仿生手中的复杂运动反应。

你也可以分享到: