跳转至

三、分布式人工智能

区块链作为人工智能的操作平台

唐·塔斯考特和*安杰·维诺德*

| image | 分布式人工智能简介 |

尽管人工智能作为一个流行词汇被大量使用,但它正成为有史以来最大的技术革命之一。计算系统以有意义的方式吸收和解释大型数据集的能力是在二十世纪发展起来的,并且在过去大约 10 年中发展迅速。最大的混乱还在后面。

预计到 2020 年,市场规模将达到 700 亿美元,利用人工智能从数据中识别可行见解的机会将改变从交通运输到医疗保健、金融、制造、零售等诸多行业。 ^(188)

正如人类善于寻找机会一样,系统现在有能力通过数千倍的数据进行筛选,最终将增强我们的决策技能。72%的商业领袖认为人工智能是未来的基础。 ^(189)

随着人工智能变得越来越强大,区块链技术拥有独特的能力,通过一系列分散、不可信的功能推动人工智能革命向前发展。在这一章中,我们看看人工智能到底是什么,以及它最强大的方面是什么。

我们关注集中式人工智能解决方案,区块链技术可以提供的解决方案,以及这些新兴领域带来的问题。然后,我们分析分散式人工智能的力量可能揭示什么。

区块链有可能成为人工智能的操作平台,无论是对于现有的集中式实体还是对于分散式人工智能的新兴用途。

什么是人工智能?

在极高的层面上,人工智能是能够学习和模拟人类认知的智能系统的设计。人工智能领域包括各种技术,如自然语言处理、神经网络和深度学习。

我们可以把 AI 分为两类:第一类是符号 AI,第二类是机器学习(ML),也叫连接主义。前者使用数理逻辑将人工智能机器将执行的复杂任务形式化。对于太难形式化的任务,比如模式识别——比如,一套区分猫和狗的图片的规则——机器学习特别强大。它是一套直接从经验中模拟认知过程的技术。给定一大组示例,机器学习算法可以通过识别数据集中的模式来执行复杂的任务(例如,市场预测)。

我们每天都被有形的人工智能应用所包围。事实上,77%的消费者使用人工智能服务或设备。 ^(190) 基于人工智能的企业应用预计将从 16 亿美元的年收入增长到 2025 年的 312 亿美元。图像识别、招聘、数据分析和网络安全等应用推动了这一估计为 52%的复合年增长率。自 2000 年以来,对人工智能初创企业的投资增加了 6 倍,该领域的关注度、资金和发展都是前所未有的。 ^(191) 企业对人工智能的采用也在快速增长,据报道,2018 年有 61%的企业实施了人工智能。 ^(192)

网飞上的推荐和脸书上的定向广告都以某种方式得到了人工智能系统的支持。IBM 已经部署了 Watson,它的 AI 平台和 Jeopardy!游戏节目冠军,为各种公司服务。 ^(193) 大韩航空利用 Watson 分析其机队多年的维护记录,将维护分析时间缩短了 90%。 ^(194) 亚马逊利用机器学习来优化它用于履行的数千个机器人,并将语音命令映射到 Alexa 中的实时执行。 ^(195)

如今市场上有各种各样的人工智能应用。AI 实际上是如何工作的?计算机是如何变得“智能”的?

训练数据

答案在于计算系统从大型数据集中解释和提取意义的能力。这些数据集有时被称为训练数据,作为系统的输入。系统彻底地解释数据,理想地提供实现某些目标的决策或结果。权力在于人工智能的子集 ML,它训练一个系统从它的经验中学习。对于复杂的任务,如图像识别或市场预测,通过编程让计算机一步一步地完成任务已经变得不可能。然而,ML 通过最终允许系统识别它的错误并重试许多动作中的一个来达到它的目标,从而推动了边界。系统会注意到错误,并可以在未来的决策过程中参考过去的错误。

这项令人难以置信的技术已经产生了未来的终结者理论,即使技术巨头正在投资数十亿美元进行研究,以推动人工智能的发展。谷歌以 32 亿美元收购 Nest,为谷歌的投资组合带来了一套强大的 ML 和物联网驱动的产品。 ^(196) 亚马逊以 7.75 亿美元收购 Kiva Systems,将一套健壮的机器人整合到公司的核心仓库运营中。 ^(197)

我们许多最雄心勃勃的社会目标——从无人驾驶汽车到疾病治疗再到太空探索——依赖于并将继续依赖于机器学习的进步。人工智能将长期存在,尽管这场革命才刚刚开始,但区块链技术可能有助于加速其发展。

人工智能和中央集权

“数据是新的石油”是揭示数据价值的常用表达。 ^(198) 然而,我们需要我们的人工智能算法处理数据——提取、提炼、分发和货币化数据——以尊重人权的方式为人们创造更多机会,而不仅仅是为企业。 ^(199) ML 需要海量的数据,让这些训练模型随着时间的推移进行精确的开发和学习。开发人员将这些数据集输入系统,以解释和调整他们的决策技能。

一个关键问题出现了:我们如何信任这些模型中的数据?我们如何才能更好地理解一个特定的系统或算法实际上是如何做出决策的?例如,如果一家汽车制造商在其自动驾驶程序的测试模拟中发现了一个重大故障,该公司需要转向用于模拟的可审计、不可信的数据源。这提供了一种直观的方法来验证所使用的数据。

此外,少数大型科技公司控制着绝大多数用于人工智能开发的数据。谷歌和脸书收集了每个用户数十亿字节的数据,数百万个数据点,包括通过 Messenger 交换的每条消息、位置历史、音乐偏好等等。 ^(200)

对于较小的公司来说,获取这些数据是不可能的,只能让少数大型公司充当人工智能开发的看门人。公共数据集在很大程度上是非常有限的,并且可能有商业用途的合约。有多个可用的公共数据集(表 3-1 ),但是这些数据可能是非结构化的,不像更专有的数据集那样有洞察力。

表 3-1 公共数据集

image

数据来源:Bernard Marr,“大数据和人工智能:2018 年 30 个令人惊叹的(免费)公共数据源”,Forbes.com,福布斯媒体有限责任公司,2018 年 2 月 26 日。www . Forbes . com/sites/bernardmarr/2018/02/26/big-data-and-ai-30-amazing-and-free-public-data-sources-for-2018/# 6 E0 d 8 b 7 e 5 f 8 a,2019 年 3 月 6 日获取。

包括 Spil.ly 在内的一些初创企业需要数十万张图像来进行图像识别开发。由于无法支付所需的输入数据,Spil.ly 被迫从计算机生成的图形中创建合成数据,以输入其人工智能模型。 ^(201)

我们如何才能使这些数据民主化,以便世界各地的开发人员可以轻松访问并使用它来建立人工智能数据集?去中心化的市场能以一种不可信的方式帮助 AI 训练所需的数据民主化吗?

区块链和人工智能

区块链的核心是一个分布式数据库,由分散网络中的各方存储。在过去的两年里,我们看到了区块链空间的关注和资源的爆炸式增长,价值数千亿美元的加密货币被购买和交易。我们看到了 2017 年的首次货币发行(ICO)热潮,其中 ICO 筹集了超过 40 亿美元,承诺几乎每个现有行业都将发生颠覆性变化。 ^(202)

Bancor,一个代币交换网络,在三个小时内筹集了 1.53 亿美元,尽管它没有被大量的消费者采用或使用。作为与不同区块链相关联的数字资产,代币的价格与作为用于存储数据的分散结构的基础技术的实际价值之间几乎没有联系。这个领域正在从低吞吐量的分散系统向工业强度的高速差异化系统发展。

现在是开始了解区块链强大能力的最佳时机。中本聪的比特币白皮书强调了将价值置于“密码证明而非信任”的重要性这个看似简单的想法揭示了一个全新的互动领域。让我们相信密码学和数学的客观性,而不是相信容易出现人为错误的个人和企业。比特币白皮书介绍了一种新的思维方式,AI 可能会在某一天受益。

区块链最强大的两个特征是它的不变性和分权。这两者都为改善人工智能的中央集权状态提供了机会。

不变性

人工智能训练模型不仅需要大量的数据,而且使用的数据需要有明确的审计线索,以确保质量。区块链可以以不可变的方式存储数据,以避免任何删除或更改。

例如,在比特币平台上,一个有效的交易由一组“矿工”广播和确认,这些矿工既不知道其他矿工也不知道发送者。一笔交易一旦被确认并加入分类账,如果没有大量的资金和计算能力,它就不能被更改或撤销。这有助于在交易中提供一定程度的信心,从更高的层面来看,可以转化为可供分析的安全数据点。

KenSci 是一个由人工智能和机器学习驱动的预测平台,专注于医疗保健数据分析。该公司利用大量医疗记录和训练集,依赖于输入模型的数据的准确性,因为患者的生命危在旦夕。正如联合创始人 Ankur Teredesai 强调的那样,当运行这些人工智能模型为医生和保险公司提供医疗保健建议时,“我们正在谈论真实的病人,真实的生活”。 ^(204)

然而,人工智能有可能强化它所依赖的数据集中嵌入的现有文化和社会偏见。例如,谷歌因其照片应用程序中与图像识别相关的攻击性标签而面临反弹,微软在其 Twitter 聊天机器人使用未经验证和不适当的输入数据来决定回应时也是如此。

当公司对一个特定的系统进行测试时,他们将能够指出在区块链的特定时间标记上找到的特定数据点。例如,一家跨国服装零售商可能想了解其产品如何通过各种渠道销售,如实体渠道和电子商务渠道。它可以将每个渠道的销售点数据输入库存管理培训模型,该模型可以根据消费者趋势自动调整预测和库存。随着时间的推移,这个模型可以帮助预测消费者口味的变化。

沃尔玛(Walmart)和耐克(Nike)等零售商一直在投资增加销售额和客户参与度所需的数据分析工具。公司正在关注顾客购物体验期间和之后在 Twitter 上的情绪和询问。 ^(205)

来自这些不同渠道的数据必须尽可能准确。多方和公司正在销售零售商的产品;数据不是存储在一个地方。通过共享区块链,来自每个渠道的数据可以被散列并上传到区块链,这样零售商就可以确信其模型中使用的数据没有被更改。交易的所有各方都需要就数据的任何变化达成共识,因此没有哪一方可以操纵数据为自己所用。要求达成共识将作为一种治理工具:它不会完全分散,但会防止单个实体控制敏感数据。

当前的解决方案涉及外部团体聚集数据并出售给感兴趣的公司;然而,这些数据的准确性无法真正得到审核,聚合器也不承担使用这些数据的任何风险。所以这个市场存在道德风险。依靠这些信息做出关键决策的公司要自担风险。

区块链技术可能有助于提供高质量、不断增长的透明数据流,人工智能模型可以随着时间的推移定期参考这些数据流。一旦经过哈希处理,数据将以安全的方式提供给相关方。将没有零售数据的中央实体或聚集器。鲍勃·泰普斯科特,区块链和人工智能的作者和策略顾问,解释了计算机什么都不会忘记的能力对人工智能是多么的重要:

深度学习热爱数据。数据集越大、越可信,人工智能基于该数据的解释和预测就越智能。有了人工智能,20 年的实际数据和随后的人类决策可以在一夜之间被回顾、学习、提炼和评论。 ^(206)

例如,给定足够大的磁共振成像数据和实际患者结果的数据集,人工智能程序能够以 86%的准确率检测结肠直肠癌;人工智能程序有可能比人类更早地预测癌症前期。在有大量数据的地方,人工智能程序可以轻易地从数百万张图像中看出我们看不到的微妙联系。

一切都与数据有关。如果我们运行一个基于文本的远程诊断商店(无论是为病人还是坏机器),并拥有 100,000 个查询、回复和后续满意度得分的文本,利用当前的人工智能技术,我们可以训练计算机执行这些任务,以获得持续高于人类的满意度得分。然后,计算机可以根据客户的喜好,将结果同时翻译成 20 种不同的语言。当然,处理自然语言仍然很有挑战性,这取决于书面请求的复杂性。

请注意,这些模型随着数据的准确性而改进。对于吸尘器维修,正确的答案和最令人满意的答案可能是同一件事。对于医疗患者,这些答案可能不尽相同。我们用来训练模型的数据越多,模型就越准确。

Tapscott 说:“基于 100,000 次以前的观察,当出现问题时,计算机可以过滤掉数据中的异常。”换句话说,计算机可以从错误中学习,并将其应用到未来的决策中。泰普斯科特不仅谈到了拥有数据的重要性,还谈到了对输入的数据进行验证的能力

当数据被放到区块链上时,我们可以识别出准确的进入点或错误的输入,然后纠正它,为即将到来的决策和未来的决策做准备。决策过程通过每次迭代得到改进。人工智能,加上区块链,将让我们理解一个人类无法理解的问题或模式。 ^(209)

区块链与民主化

我们的身份越来越多地与可能不准确或不安全的数据联系在一起(表 3-2 )。通过当前的集中式数据采集系统,如亚马逊、脸书和 YouTube,我们对数据的控制越来越少。因此,我们的数字身份经常被错误管理和破坏,有时我们并不知情。如果不给我们一些经济上的奖励,公司就不能出售我们的数据。

表 3-2 2018 年报告的最大数据泄露事件

image

数据来源:David McCandless,“世界上最大的数据泄露和黑客”,信息是美丽的,更新于 2018 年 10 月 15 日。www . informationisbeautiful . net/visualizations/worlds-biggest-data-breakes-hacks,2018 年 11 月 16 日访问。

区块链技术公司的一个主要优势是他们拥有个人数据的潜力,从而确保更高的隐私性和安全性。区块链也有可能使数据的可用性民主化。少数公司控制着人工智能模型所需的大量数据。真正的洞察力在于客户购买模式或应用程序使用等数据,但只有少数公司能够利用这些信息。想象一下,如果各种公司和各种规模的开发者可以获得访问大量数据的许可,以推动创新向前发展。

区块链可以促进这种数据民主化,最终产生一种新型的数据市场。公司网络可以直接从用户那里购买数据,这些数据可以在区块链上获得。点对点数据的可用性将允许用户——包括传统上被排除在数据生态系统之外的公司——获得全新的见解。它是这样工作的:

1。买方创建包含数据集的智能合约,并委托必须满足特定标准的 AI/ML 模型。例如,一家在线零售商可以写一份合约,发布一个 20,000 个订单的数据集,并要求一个人工智能模型以 90%以上的准确率识别欺诈订单,以换取一定量的乙醚。

2。买方将智能合约发布到区块链以太坊,供任何人访问。

3。机器学习工程师访问合约并下载数据集。比赛开始了!

4。每个工程师用数据训练一个 AI/ML 模型。

5。当一个工程师训练好一个模型后,他会在以太坊区块链上运行这个模型。

6。如果模型确实满足合约要求,也就是说,它识别假订单的准确率超过 90%,那么智能合约会将模型发送给买方,并向工程师付款。 ^(210)

提供金钱以换取训练人工智能模型的买家,为人工智能到达所有类型的开发者和公司手中开辟了可能性,这些开发者和公司希望从他们现有的数据集获得洞察力。

如果我们可以在参与者之间共享数据,并制定一个治理协议,会怎么样?例如,如果汽车制造商相互出售自主测试数据,或者将数据集用于交换从中获得的见解,情况会怎样?实现这种共享有助于加速新汽车的开发。

自动驾驶汽车正在产生万亿字节的数据,一辆汽车能够产生数百万亿字节的雷达、激光雷达和相机数据用于分析(表 3-3 )。我们可以尝试为汽车制造商创建一个数据市场,而不是满足于当前的数据孤岛。

表 3-3 汽车自动化传感器产生的数据

image

数据来源:Stephan Heinrich,“自主新兴时代的闪存”,闪存峰会,2017 年 8 月 7 日。www . flashmemorysummit . com/English/parallels/Proceedings/2017/2017 08 08 _ FT12 _ Heinrich . pdf,2019 年 3 月 6 日查阅。

数据将放在区块链上,这样所有玩家都会了解数据源和时间戳。没有一个中心方来控制、聚集或删除数据,从而减少了被操纵的机会。上传次优数据的参与者可能会被其他参与者投票淘汰出区块链。

智能合约

将数据用于人工智能背后的最大问题之一是内容的隐私和敏感性。智能合约有可能帮助管理这些数据在人工智能环境中的实际使用。智能合约在不依赖第三方的情况下面对“计算审查”的能力可能会产生新的治理平台。 ^(211)

约克大学 blockchain.lab 副教授兼联合主任 Henry Kim 博士解释说,我们“或许可以使用治理智能合约。”当数据被使用时,实体仍然必须“遵守隐私”并确认他们可以访问正确的数据。Kim 博士谈到了智能合约在规定数据治理政策方面的重要性。智能合约本身可以包含使用这些数据并奖励提供这些数据的对应方的规则集。问题归结到我们是否可以使用那个人或当事人的数据来换取报酬? ^(212)

区块链治理

例如,如果一个公司选择使用一个特定的数据集,该数据集背后的治理细节可以存储在链上,供所有相关方验证。这一点非常重要,因为数据隐私法正受到越来越多的审查。Ponemon Institute 发现,71%的公司将因未能遵守欧盟 GDPR 而面临全球业务受损。 ^(213)

公司可以提取与其需求相关的数据集,验证数据,然后根据智能合约中的治理规则使用这些数据集,而不是由一方集中聚合一个庞大的数据网格。与简单的双向合约相比,链上智能合约将可供所有参与者验证。网络参与者可能会因恶意行为而被淘汰。

此外,人工智能还有可能分析智能合约的错误。随着数百万智能合约的开发,工程师可以将合约本身输入到一个训练模型中,以确定错误可能在哪里,以及他们是否可以构建一个更有效的合约。

分散式人工智能

既然我们已经讨论了区块链在现有集中式解决方案中的应用,我们可以开始研究区块链在分散式人工智能系统中的功能潜力。分散人工智能(DAI)是人工智能的一个子领域,它分析自主代理的交互和活动。戴试图了解在没有中央机构监督的情况下,个体如何自我分配、相互作用以及适应环境的变化。 ^(214) 一个全新的自主数据生态系统可能会出现。

分布式人工智能对分散式人工智能

分布式人工智能建立了一个不同于完全去中心化实体的设置。在分布式人工智能系统中,中央系统仍然管理整体设置,并对数据聚合等活动拥有更大的权限。例如,想象一个跟踪一组智能手机在每个时期拍摄的照片数量的系统。

一个中央实体监督分布式人工智能,它依赖于实体来仔细使用和处理数据。然而,如果代理人——嵌入在汽车或工厂设备中的传感器,或者分布在整个公司中的传感器——能够开始相互学习和交易,那会怎样?这就是人工智能和区块链的结合真正令人兴奋的地方。

戴和的角色

在戴看来,多智能体系统终有一天会出现。例如,在未来,自动驾驶汽车可能能够搭载乘客,赚取车费,支付保险,维修和汽油费用,所有这些都无需人工干预。然后,汽车可以开始通过向乘客提供乘车服务来参与共享经济。通过一个人工智能模型,以及数百万次乘坐后,汽车可以学习人类司机永远不会考虑的各种趋势。例如,一辆汽车能够在孩子们喜欢在街上玩耍的地方教会另一辆汽车——将它对某个街区的了解转移到一辆从未在该街区行驶过的汽车上——这有可能极大地提高所有人的安全性。老爷车甚至可以把学到的知识卖给即将上市的新车。

轿厢可以开始将自己定位在乘客密度高的区域。它可能知道何时需要维护检查,并可以扫描当地的机械师以获得最佳价格。车辆可以通过调整其驾驶习惯或与其他实体(如保险公司和车辆制造商)的自主代理“协商”来了解如何获得最实惠的保险单。

戴需要一个操作平台来运行。如果这个平台是由一个中央机构运行的,那么代理本身可能会通过一个技术后门受到危害,这个技术后门允许中央机构接管。区块链不是由某个中央组织管理,而是由节点本身管理。这些节点决定如何管理网络的未来。作为利益相关者,他们必须在实施之前首先批准任何协议升级或开发。

自主代理需要一个平台,他们可以在这个平台上投票,并帮助指导协议本身的未来。区块链既不关心也不区分一个节点是人类还是自主代理,但他们可以给学习更多的节点的投票分配更多的权重。 ^(215)

乔治·波尔泽,区块链 48 的教育主管和企业以太坊联盟的特别工作组主席,认为区块链“是一个使能器……从多个节点收集数据”,帮助实现“集体智慧”在一个更加分散化的世界中,自主代理不需要依赖少数数据源,而是可以从一个数据源移动到另一个数据源,为所使用的数据留下可审计的踪迹。想象一下,大量的节点汇集它们的数据,形成各种各样的数据共享,而不是处理现在存在的非常孤立和集中的数据池。

此外,区块链将允许自主代理无需相互信任即可进行交互。因为数据在区块链上是不可变的,代理可以快速验证代理没有为了自己的利益伪造数据。信任不在于代理本身,而在于由代理的动作产生的加密安全数据。

回顾我们的自动驾驶汽车的例子,我们可以看到一个多智能体系统需要在条款上达成共识或协议。例如,保险公司如何知道车辆在申请新的保单之前没有更改其数据?

自动驾驶汽车可以利用区块链,通过哈希不断上传数据,供其他实体的其他代理人(保险公司、汽车制造商)验证。这种验证将提供一种重要的信任和保证,即数据没有为了代理人的利益而被篡改。

此外,在戴基础上引入了激励层。治理协议可能会要求代理在与其他代理交互时保留或搁置其令牌。如果一个特定的代理人决定恶意行为,其他代理人可以投票取消该代理人参与生态系统,并保留该代理人的部分赌注作为惩罚。治理协议可以奖励表现良好的诚实节点(例如,按时搭载乘客、安全驾驶),并且可以惩罚恶意节点(例如,临时拒绝访问、更高的交易费用、需要更多的备用令牌)。

自主智能体作为 AI 代表?

一种可能的经济结构是使用授权股权证明(DPoS)。DPoS 是其他区块链项目(如 EOS 和 VeChain)使用的共识机制。与美国立法系统的工作方式类似,这些区块链中的每个代币持有者都可以投票选举一名代表,以代表其验证交易。一组 10 到 100 个节点是唯一可以验证网络中事务的个体。

自主代理可以开始将其他自主代理表示为代表。作为代理人,这些代理人将不得不“下注”或存放一些备用代币,如果代理人恶意行为,这些代币将被削减。

想象一下,在一个系统中,一辆自动驾驶汽车被选举代表其他自动驾驶汽车,以获得对保险单更好的议价能力。因为每个事务都将发生在区块链上,所以其他代理可以验证该委托是为了网络的利益而执行的。

Toda 首席执行官 Toufi Saliba。网络和计算机器协会的主席,描述了我们可能会看到这样一种环境,其中“机器可以相应地确保彼此的治理;这些机器可以相互竞争。”萨利巴指出,程序遵循一套协议规则并交换信息,但仍然是单独行动的。每个程序都在挑战恶意参与者并将其从共享协议中删除方面发挥作用。如果一个矿工在比特币网络上怀有恶意,那么它将受到经济惩罚,因为它被迫花费大量资金来实现 51%的攻击。在一个自治的世界里,自治的矿工可以开始自动惩罚恶意的矿工,投票让他们离开网络。

这种治理的症结在于,没有一个中央权力机构会规定哪些代理人可以加入、离开,或者从代理人的收入中抽取一定比例。一组自主的代理人将运行这个系统:每个代理人都将为更大的利益提供资源,同时仍然为其个人的努力获得回报。

萨利巴提醒我们,人们不想“承认害怕来自内部的攻击。” ^(218) 中央当局控制着大量许可信息和数据的钥匙。这种集中化使这些数据比分布在加密安全网络中的数据面临更大的黑客攻击风险,正如我们在数十家公司中看到的那样(表 3-2 )。萨利巴说,许多人“今天信任”的机构,可能就是个人“不知道明天是否还能信任”的机构。信任这个简单而又开创性的话题给我们带来了组织和自主代理的新概念。

展望未来:道

自主代理可以做出自己的决定,并在没有人为干预或人为错误风险的情况下通过反复试验来学习。但是我们能创造出比自动驾驶汽车更复杂的东西吗?

观察分布式经济实体的可视化(图 3-1 ),我们可以了解自治主体在生态系统中的位置。能够理解客户需求和库存管理的自动驾驶汽车或自动售货机属于相对较高的自动化和较低的复杂性。

我们可以自动完成一些任务,比如更换自动售货机中的产品,或者随着时间的推移支付保险费用。然而,当我们冒险进入一家在区块链运行的复杂公司时,会发生什么呢?这就是去中心化自治组织(DAO)发挥作用的地方。DAO 是一个完全由其利益相关者而非执行团队管理的实体。由于其分散的性质,任何利益相关者都可以在其他利益相关者投票的情况下提议对组织的行动或结构进行更改。

图 3-1 分布式经济实体

image

概念来源:唐·塔斯考特和亚历克斯·塔普斯科特《区块链革命:比特币和其他加密货币背后的技术正在如何改变世界》( New York: Portfolio Penguin,2018): 120。

随着时间的推移,a DAO 可以开始了解谁是它的竞争对手,利益相关者支持什么样的提议,以及要遵循什么样的市场趋势。一个雄心勃勃的未来将是组织完全独立运行,做出商业决策,雇佣员工,并对市场变化做出反应。

想象一下,一家美国玩具厂根据中国的塑料生产,准确地知道何时订购原材料。该工厂将使用 Web scrapers 来分析来自数百万个网站和视频的玩具搜索和趋势,以了解要生产的颜色、样式、数量和趋势。然后工厂开始生产,优化每一件设备来制造玩具的特定部分。在生产过程中,工厂将联系欧洲、南美和亚洲的最大买家,并与外部代理商谈判以实现目标利润率。然后,它会在没有任何人工干预的情况下运送玩具并接收付款。为了成为市场领导者,工厂将记录其收益并分析其竞争对手的收益。

乔治·波尔泽认为,“任何扮演中介角色的人[如]金融机构或征信机构”都将被 DAOs 以及“任何目前交易不透明的行业”所扰乱。这些中介可以由智能合约来管理,智能合约规定了这些中介传统上控制的信息和价值的移动。智能合约可以“提供一个独立、分散的内部经济。”Dao 的治理是目前正在研究的一个重要课题;然而,“由一个委员会(DPoS)进行治理……是一个值得尝试和建立的新想法。” ^(219)

尽管 DAO 模型在 2016 年面临以太坊社区的审查,但 DAO 可能是人工智能最重要的进步之一,具有前所未有的用例。

区块链网络的挑战

区块链为人工智能开发提供了各种用例,但使用分散系统存在挑战。例如,区块链最紧迫的问题之一就是缩放问题。

可扩展性

随着人和事物产生越来越多的数据,以分散的方式存储这些数据会很有挑战性。公共区块链存储大量数据非常昂贵;除了成本之外,快速检索这些数据可能需要大量计算。计算系统将需要在很短的时间内检索、分析和计算算法。

不仅需要收集数据并分发给所有相关的利益攸关方,还需要在短时间内对相同的数据进行结构化和培训。当前的区块链解决方案不提供此类聚合和计算所需的可扩展性(图 3-2 )。随着万亿字节的数据在产品和公司之间传递,现有的解决方案将无法满足需要。

幸运的是,创新者正在开发扩展解决方案。一个是 IPFS。它的用户下载 IPFS 协议,在他们自己和彼此的设备上存储和索引文件,在一个分布式网络中,而不是在一组中央服务器上。它的存储容量随着用户数量和用户集体机器上的可用空间而增长。用户可以托管数据并创建数据集的哈希,以便其他人可以找到并访问最接近的数据副本,如果不是原始主机的副本的话。

例如,当应用程序需要引用区块链上的大型数据集时,它可以只引用数据的散列,而不是整个数据集。散列应该总是匹配数据集,除非数据集已经被改变。

图 3-2 每秒交易量对比

image

数据来源:劳尔,“交易速度:加密货币如何与 Visa 或 PayPal 匹敌?”howmuch.net,2018 年 1 月 10 日。howmuch.net/articles/crypto-transaction-speeds-compared,于 2019 年 3 月 6 日加入。

治理

建立对这些区块链及其持有的数据的治理非常重要。人工智能将需要来自各种来源的大量数据,但数据所有者将希望在区块链上保持这些数据的私密性和安全性,以便只有获得许可的人才可以进行某种程度的访问。我们可以看到同态加密的一些集成,这允许工程师使用数据集进行训练,而不会损害这些数据的机密性。

在人工智能模型开发中,存储在不可变账本上的用户数据也可能成为问题。如果我们希望将数据从一种原始格式转换和映射为另一种格式,以便我们可以更轻松地处理下游数据集,比如说,用于业务分析,会怎么样?或者,如果政府对组织可能出于商业目的收集和使用的个人或家庭数据的类型加以限制,情况会怎样?

我们将如何移除那些被认为是不可变的并且不会被删除的数据集?或者是改变管理这些数据的访问和使用的智能合约的问题?此外,在开发的早期,随着自主代理学习交互,区块链将可能面临延迟问题;参与者广播和验证交易的速度可能很慢。

image 结论和建议

区块链和人工智能与物联网的三足鼎立是一个令人兴奋的探索前沿。一个不可变的、分散的分类账为饥渴的人工智能模型提供可审计的数据源的想法,如果不能彻底改变现有的模型,也可以极大地改善。在这种企业功能准备好大规模部署之前,仍有大量的开发工作、测试和重新开发工作要做。然而,未来看起来再令人兴奋不过了。

AI 在企业端越来越普遍。在众多行业中,这项技术已经显示出巨大的效用,并且随着企业的采用,它将继续增长。然而,AI 在我们目前的基础设施中是极其集中的。企业领导者面临的问题是,“我们是希望将自主代理委托给少数公司,还是希望倡导更分散的架构和开放的治理?”

区块链可以为 AI 生态系统提供去中心化的基础设施。目前,人工智能的数据来源和开发非常集中,阻碍了较小的参与者开发新的人工智能解决方案。一个分散的基于区块链的解决方案可能允许一种更民主化但更安全的方式来传输和使用人工智能训练模型所需的数据。

区块链在基于互联网的共享经济之上增加了一个激励层这样的基础设施可以为公司共享数据源和开发新资源开辟全新的渠道,并为此提供一些激励。组织可以为他们共享的数据的质量和实用性建立声誉。

想象一下运行在几个集中式服务器上的数百万人工智能代理的影响。虽然今天的焦点可能是集中的人工智能,但 分散的 人工智能将带来更加自主的汽车、机器甚至公司。纯自治系统将需要分散的平台来运行。区块链可能会对集中的、可能有偏见的数据集提供更好的见解。

当前的区块链解决方案还不适合大规模部署。从第一层改进到第二层扩展解决方案(如 Lightning Network)的扩展解决方案工作正在进行中。每种解决方案都在吞吐量和治理方面进行了权衡,因此没有哪一方占据主导地位。随着扩展解决方案的成熟,企业领导人应该讨论区块链在他们企业的人工智能堆栈中的位置。

考虑分散式和集中式基础设施的混合模式。在这种混合模式中,哪些数据集可能具有更大的价值?如果这些数据集准备好了,我们就可以开始探索区块链平台,并确定哪个工作得最好。R3 等私有区块链计划和以太坊等公共区块链都在竞争企业采用。虽然私人区块链通常不像公共网络那样分散,但对许可网络的初步测试可以为未来更分散的解决方案提供信息。

分布式账本技术并不能解决 Al 的所有问题。区块链可能有助于解决人工智能开发者面临的一些问题,但不是全部。例如,为了随着时间的推移而学习和发展,这些模型需要访问高质量的数据流。审查这些数据至关重要。虽然区块链有助于追踪来源,但它尚未验证输入的准确性或质量。

伟大的价值创造还在后面。请记住,对于互联网,我们并没有立即理解电子商务、社交媒体和云计算等用例的潜力。这些花了几年时间才被大规模采用。然而,随着基础设施的成熟,初创企业和企业创新者都通过在互联网上开发和运行应用程序创造了巨大的价值。随着时间的推移,运行在区块链之上的分布式应用程序可能会产生同样多甚至更多的价值。


我们一直在努力

apachecn/AiLearning

【布客】中文翻译组