nine
采访 Rigetti 和 QxBranch 高级数据科学家 Max Henderson
就在我开始写这本书之前,我觉得我已经很好地掌握了我将要关注的行业和用例。我对这本书的流程和我将要报道的现实世界的问题有一个设想。然而,通过我在写书的过程中所做的研究,我意识到有些地方我应该触及,而我以前并没有计划过。作为一名作家,对马克斯·亨德森的采访对我来说当然是偶然的,也是我事先没有计划的。我希望它能为读者揭示量子计算的一个有趣的应用。
马克斯·亨德森和我在社交媒体上相识已经有一段时间了。我们相互交流了彼此的帖子,然而,我们从来没有采取下一个合乎逻辑的步骤,给对方发个人信息并打招呼。2019 年初,我联系了他,就他在 QxBranch 做的事情进行了交谈。那时,Max 只在 QxBranch 工作,他在 Rigetti 的额外职位在当年晚些时候才实现。
我知道马克斯正在研究一个非常有趣的问题——模拟美国选举。他为 2016 年选举做了一些工作,我在第八章、对治理的影响中讨论过。
我很想知道他是如何将这个问题定义为一个可以用量子计算机建模的问题的背景故事。我向他伸出手。
Max 很乐意交谈,我们就他正在做的事情进行了初步的讨论。他证实,他正在研究量子机器学习,以确定选举建模的解决方案。他还澄清说,他是一名从事业务开发的数据科学家。这意味着他在简化量子计算的叙事。
那正是我要找的那种人。我告诉他我想在我的书里写他的作品。Max 对这个想法持开放态度,我们结束了通话,认为我们会考虑这个想法。
几天后,我给 Max 写了一封信,告诉他我对捕捉他在量子机器学习中所做工作的想法。马克斯喜欢它,我们同意做一个录音采访。
下面是采访实录。对我来说,从这一切中获得的一个关键是有效利用社交媒体。在我看来,社交媒体不能像面对面交谈那样成为联系人们的媒介,但是,它可以帮助建立关系,带来互利的结果。现在让我们进入采访:
阿伦:嗨,麦克斯,谢谢今天和我一起。让我们先介绍一下你自己。让我们来谈谈你自己、你的背景、你的公司以及这一切是如何发生的。
马克斯:是的,基本上我的背景是物理学。我在费城德雷克塞尔大学获得了物理学博士学位。我在做神经网络的生物物理模型,试图通过模拟来解释随着年龄的增长,我们的大脑会发生怎样的变化。这自然让我对机器学习算法非常感兴趣,因为这些算法是生物物理神经网络的抽象版本。它们允许我们用更简单的模型来捕捉我们大脑所做的一些真正强大的事情。
与此同时,我在洛克希德·马丁公司实习。回到 2011 年,他们购买了第一台商用量子设备。我从 2011 年开始尝试量子硬件。所以最初,我们几乎只关注优化类型的问题,随着时间的推移,量子机器学习变得更有前景。
我继续这些研究途径,现在我在 QxBranch,也在类似的领域工作。我工作的很大一部分是帮助公司识别我们运营的不同业务线的痛点。我们要研究一些很难的计算问题,我的任务是为这些问题找出量子计算的解决方案。从更全面、更可扩展的角度提出解决这些问题的新方法是非常有趣的。
Arun :你提到了你在量子机器学习方面的专长。让我们花一些时间在机器学习上,并讨论一些驱动因素,为什么它在今天比以往任何时候都更相关。在过去十年左右的时间里,我们目睹了数据的大规模爆炸。社交媒体产生了大量我们可以挖掘的数据。这是人工智能 ( AI )开发和成为主流的好时机,这是我们在各行各业看到的情况。然而,人工智能和机器学习在概念上已经存在了相当一段时间。那么,在过去的五到六年里发生了什么让人工智能成为现实?你对我们如何利用量子计算原理制造类固醇人工智能有什么看法?
从广义上讲,你知道机器学习是一个在过去几十年中发展起来的领域。自 20 世纪 80 年代以来,出现了一些非常强大的工具。在那个时代,有一些非常强大的模型根本不实用,因为我们没有足够的数据。此外,我们没有足够大的计算机让它们工作。大数据时代和廉价计算机时代真的让机器学习从一个研究课题变成了一个令人难以置信的强大工具。
现在,全球每家财富 500 强公司都在研究机器学习。量子机器学习也有类似的扩展。尽管我们拥有大量的数据点和比过去更强大的计算机,但仍然有一些计算上的难题,经典计算机只是卡住了。尤其是如果他们想要精确的解决方案。
量子机器学习实际上是从研究特定类型的机器学习问题开始的。与任何已知的经典算法相比,quantum 似乎可以在搜索非结构化列表和一些伟大的理论模型(PCA、聚类等)方面加快速度。但是,在处理这些算法时,会遇到一大堆实际障碍,使得其中一些方法变得非常困难。
最近,通过量子算法在这些模型上实现的一些加速已经被去量子化。有新的经典量子启发算法已经匹配这些量子算法的性能。
在过去的五年里,几乎每一个量子机器模型都在某种程度上停留在能够在物理设备上运行,直到我们解决了一些基本的科学问题,允许更大的,纠错的设备。在过去的五年里发生的事情是,人们真的以与最初设想略有不同的方式看待量子计算机的使用,并且他们更具实验性。
一个受到相当大的研究兴趣的领域是使用绝热量子设备,如 D-Wave 产生的设备来模拟玻尔兹曼分布,这是许多强大的图形模型的核心。这些问题中的一部分无法用大规模的经典计算机进行有效的评估。这是因为它归结为试图从指数级的大量状态中采样,随着问题变得越来越大,经典计算机无法做到这一点。
绝热量子计算 ( AQC )是一种利用量子力学过程在绝热条件下运行的计算模型。作为通用量子计算的一种形式,AQC 采用了量子物理系统中体现的叠加、隧道和纠缠的原理。
对于某些建模任务,模拟量子退火器的性能似乎与真实量子退火器一样好。
我们相信,通过将某些图形模型映射到这个自旋玻璃哈密顿量,您可能能够用有限数量的测量来获得更好的表示,以训练这些真正强大的模型。我们已经使用 D-Wave 设备来绘制这些图形模型。还有另一个完整的主题领域直到 2016 年才真正存在,最近它确实出现了爆炸式增长:这是一个我称之为量子特征提取算法的研究领域。
这方面的一些例子是量子库计算和量子电路学习。我们刚刚在 QxBranch 发表了一篇关于量子进化神经网络的论文。基本上,这个想法是使用基于通用门的量子电路,你可以通过这些电路传递经典数据,并通过测量最终状态提取数据。你可以认为这是对原始数据进行某种非线性函数解释。
这基本上是最复杂的机器学习模型正在做的事情。他们试图利用经典变换提取非线性数据。这个想法是看看我们是否可以使用各种类型、口味、初始化和编码方式的量子电路。为了解码信息,我们使用量子非线性从经典数据中提取有用的特征,这些特征可以用于更广泛的机器学习环境中。所以这是量子机器学习世界中一个令人兴奋的非常新的研究领域,现在得到了一些真正的关注。
例如,考虑构建一个算法来识别三维空间中的猫的练习。我们首先需要从可用的数据(颜色、形状)中识别特征,这些特征可以被算法用来识别猫。这种从所有其他数据点中分离有用信息的工作可以由量子计算机来完成。一旦确定了关键数据点,那么就可以使用经典计算机来识别它是一只猫。即使在嘈杂的环境中,量子计算机也能发现特征。
Arun :不断出现的一个话题也是你提到的,那就是经典计算和量子计算之间可能会有某种混合模式,这可能会加速量子计算的主流采用。我最近与富士通进行了交谈,富士通有一个基于量子原理的数字 annealer,但它并不是真正的量子基础设施。然而,它似乎比经典计算机更好地解决问题。你认为[混合模式]会成为一种趋势吗?
马克斯:这真是个好问题。有一个完整的研究领域被广泛地称为量子激发的应用。就像你说的,他们正在从量子力学中吸取某种教训,但他们仍然完全使用经典计算机来实现。有理由认为这是一条非常有前途的道路,因为我们可以使用该基础设施部署真实世界的应用程序。
从某种意义上说,我们已经完善了经典计算。在这一点上,我们已经建立了非常大、非常快、非常并行的经典计算能力。我们相信有捷径,在某种程度上,人们可以使用这些方法在更大的连接规模上模拟真实量子计算机的近似值。可能有一些原因需要考虑这种实现来解决某些类型的问题。所以,annealers 是一个很好的例子。Rigetti 和富士通已经有了模拟的数字退火炉,这表明业内人士清楚地了解这个领域的发展方式。
我们刚刚通过与 Innovate UK 的一个项目完成了我们自己的大型量子模拟器。这是一个活跃的研究领域,很可能是纯经典计算世界和量子计算机“真实交易”之间非常好的敲门砖。有很多有趣的量子启发的解决方案,这不仅仅意味着试图用经典计算机模拟量子系统。
也有尝试做创新算法的人的例子。Ewin Tang 是量子计算社区中非常有名的人,因为她实际上发现了一种算法,该算法使用量子启发的方法对推荐系统进行了指数级改进。她实际上对量子计算算法进行了去量子化,这可以被认为是经典计算世界中量子启发研究的一个领域。人们深入挖掘,看看当你"平整竞技场"并允许经典计算机拥有与量子算法相同的访问和查询属性时,量子算法加速是否成立。
去量化的一个例子是推荐算法,其中经典算法是在量子算法之后开发的,并且具有相似的性能。例如,推荐算法可以帮助亚马逊根据消费者的购买历史来预测他们更喜欢购买什么。
Ewin Tang 使用在多算法时间运行的经典算法解决了推荐问题。因此,经典算法的性能优于 Kerenidis 和 Prakash 开发的量子算法。
现在有一些问题从量子加速中受益,如果你对可以从输入数据集中有效地采样和查询的内容做一些假设,可能会有一个经典的[具有类似加速的算法]。可能有某些经典的方法可以给你一个比以前认为可能使用经典算法更好的改进。
尤因·唐(Ewin Tang)的著名论文确实表明,在考虑量子解决方案时,你实际上可以提出新颖的经典方法。特别是那篇论文,是你在一个寻求突破创造现实世界影响的领域中寻找的那种闪光。
我们真的需要精确地理解一些声称指数级加速的论文中的假设。唐基本上是把其中的一些假设放在显微镜下观察,当她这样做的时候,就为一种新的古典思想打开了大门。如果你采用这种方法,这整个"量子激发的"领域是一个非常有趣的领域,尤其是在近中期。
阿伦:当然,我认为这也是前进的方向,麦克斯。我认为将会有一段时间,这种混合方法可以成为经典时代和量子时代之间的桥梁。它还将帮助我们,因为这些“量子启发技术的稳定性将比当前的量子基础设施好得多。
现在我们来看看你。你目前关注的领域是什么?你正在解决的有趣的问题是什么?
马克斯:正如我之前提到的,我们发表的有趣的东西之一,也是我的第一作者,是我们所谓的量子进化神经网络,这是我自己创造的。它基本上将量子和卷积结合起来,本质上就像是量子版本或经典卷积或神经网络的扩展。你提到了混合量子经典系统可能是我们近期最受关注的领域。我认为那是绝对正确的。因此,这实际上是更好地理解量子如何明确地作为现有范式的一个组成部分的又一步。
我们仍处于追求和表征卷积神经网络的早期阶段,对此我非常兴奋。我们仍然非常积极地研究和表征各种形式的玻尔兹曼机器,用于自动编码器和绝热设备上的量子方法,如 D 波或模拟设备。所以这是另一个我们和许多研究人员一起工作的研究领域。
阿伦:太好了,谢谢你。现在,让我们来看一下我们已经讨论了一段时间的具体论文。请告诉我们你是如何得出这个结论的。是什么让你想到,“好吧,我要去解决那个问题?”还有,说说流程吧。你可能已经经历了一个数据收集的过程,将数据放入你已经建立的这个引擎中,你可能会从中建模一些东西,然后获取额外的数据并用这些数据测试模型,等等。你能给我们介绍一下流程吗?人们读起来会很有趣。
马克斯:是的,绝对是。我第一次有这个想法是在 2016 年总统竞选期间。在竞选实际结束之前,我在 QxBranch 工作,思考着这样一个事实可能带来的负面影响,即美国所有的州在授予选举人票时或多或少都是“赢家通吃”——不像许多其他国家那样,他们会将选举人票进行细分,并按比例分配。
例如,如果你在宾夕法尼亚州占多数,你就能得到所有的选举人票。这让我真的想到,“哦,这太有趣了,你几乎可以把它模拟成一个量子比特的二进制系统。”
在一天结束时,当你进行测量时,这些状态中的每一个都在进行二元选择,这就像我们测量量子系统时发生的一样。
人们基本上没有过多考虑状态之间的相关性。所以,如果你在看新泽西州,你的结果应该和纽约的结果非常相关,因为人口非常相似;两者都有相似的人口统计数据,而且都在这个国家的相似地区。当您进行单个测量时,您可能会认为纽约和新泽西的相关性要比(例如)纽约和亚利桑那州的相关性高得多;这些是非常不同的地方,有非常不同的人。
这个想法最终来自于这样一个事实,即选举很好地映射到一个二元系统中。此外,状态之间存在关联的事实催生了尝试将它放在量子计算机上的想法。量子计算机的优势在于它们是内在相关的系统。你不能影响系统的一部分而不影响其他部分。有一种叫做玻尔兹曼机器的机器学习算法,我已经在早期的量子设备上做了大量的研究。它具有表达美国总统选举这一确切问题类型的所有理想属性。
实际上,你需要一个模型来给每一个可能的结果分配一个概率。所以,如果你有 50 个州,就有 2 个 50 个可能的结果。如果你在做一个真实的预测,每一个潜在的结果都是非零的,即使其中一些结果的概率非常低。因此,最终,最好的预测将有能力为所有可测量的结果创建准确的概率,然后将所有这些事情汇总在一起,给出一个真正的概率预测。
这在实践中非常困难的原因是因为有一大堆可能的结果,没有人想处理所有这些数字。人们通常会进行近似,否则他们会忽略状态之间的相关性,因为这样就很容易对单个状态进行建模,然后将所有单个结果相加。我们有了一个想法,也许我们可以把它映射到一个量子系统上。当系统处于叠加态时,理论上它同时处于所有可能的状态。通过制作有限数量的样本,利用驱动该系统的基础物理学,我们可能会得到一个非常好的概率完整分布的近似值。
简而言之,这就是为什么我们认为这是一个强大的建模方法。这是一个非常困难的概率分布,但我们认为量子计算机有一点天然的适应性。把它放在量子计算机上,比如 D-Wave 制造的那种,是这种建模工作的简单选择。当我们经历这个过程时,我们能够成功地产生通过所有你想要的试金石测试的结果。
我们从 FiveThirtyEight 那里得到了数据,他是为选举做这种数学建模的主要机构。在这个过程结束时,我们预测的结果与 FiveThirtyEight 自己生成的总体趋势线相匹配。与此同时,我们的模型比 FiveThirtyEight 模型更看好特朗普——这是一个有趣的结果。
我们并不是说量子方法更优越。然而,我们确实相信,获得大量可能状态的良好近似是一个困难的问题,这些量子系统可能比经典计算机做得更自然、更自然。我们希望在 2020 年重新进行这项研究,并尝试在现场进行。我们认为这是量子计算机的早期阶段,但这是一个非常适合的问题类型,可能在近期的设备上很好。这也是一个足够小的问题,你现在实际上可以在 D-Wave 上拟合整个美国大选。
观察下一轮选举周期会出现什么将是一件有趣的事情。
阿伦:我想一年后我们就会知道了。你提到了一个有趣的点,Max,那就是人们很快倾向于选择变量,或者说忽略变量之间的相关性。这使事情变得更容易,但可能不太准确。例如,在金融服务行业,当人们进行投资组合再平衡时,改变某一特定资产类别的权重将会对同一投资组合中的另一项配置产生影响。
相关性使得整个建模和优化任务变得更加复杂。我们在金融服务中遇到主成分分析 ( PCA )。这简化了优化过程。那是你的量子解决方案正在考虑的吗?
最大值:是。投资组合再平衡实际上是我们研究的将量子计算用于金融应用的确切用例之一。我认为总会有人试图实现简化方法,试图摆脱处理相关性的计算负担。根据您正在处理的实际系统,可能有一些简化可以让您做更多或更少的事情。你可以摆脱那些复杂性,仍然很好地表现问题。
然而,在某些倾向于高度相关的系统中的其他问题中,这些近似可能不太适用。它因问题而异。这也取决于你的结果到底需要多好。在极端的情况下,当你想精确地模拟一个有关联的系统的相互作用时,你不能进行近似并期望结果会一样好。肯定有一些技术可以帮助解决这些问题,但这取决于具体情况和你需要的保真度。
阿伦:谢谢你。我有几个问题想问你。如果你有一个水晶球,我问你在 QxBranch 工作几年后你会在哪里,你会说什么?问题的第二部分是,你的路线图上最大的障碍是什么?有一件事,如果解决了,会让你的生活变得轻松很多?
马克斯:是啊,太棒了。我将引用量子计算堆栈,这样我们就有了一个共同的参考点。量子计算栈描述了不同公司正在构建的不同级别,以便在新兴的量子计算生态系统中做不同的事情。处于最底层的是制造量子硬件设备的公司或研究小组。这些人实际上是在实验室里试图建造新型的量子计算机,而 QxBranch 在另一端,在堆栈的顶端。我们试图在所有底层和中间层的基础上构建软件层。它将被从事定量分析的定量分析师、数据科学家或软件开发人员使用,以利用量子算法,而无需了解量子物理。这些用户将非常像当今世界中的普通数据科学家;他们可能不知道晶体管是如何工作的,但他们也不需要知道——尽管他们的电脑使用了相当多的晶体管。这也是 QxBranch 前进的方向:为不了解量子物理的用户开发利用量子的软件。
我们希望继续与个别公司合作,找出他们最大的问题在哪里。然后,我们希望让那些不需要知道算法如何工作,但需要知道这种算法如何适应他们的用例的人能够轻松地使用量子算法和应用程序。这也是 QxBranch 将股份放在地上的地方。我们是一家量子软件公司,位于量子计算栈的顶端。我们将在几周内发布我们软件平台的第一个版本。
很高兴听到这个消息,Max,祝你的软件发布好运。那么,你的挑战是什么?在这一点上,是什么阻碍了你的成长或进步?
Max :回到量子计算栈,根据你在栈中的位置,你的挑战会有所不同。对于处于底层的人来说,挑战是真正的研究和科学挑战。为了建造更好的量子硬件,你必须找出可以增加量子比特相干时间的技术,这样你就可以得到更低的错误率。你必须找出布局,让你的量子位系统可以扩展。硬件供应商需要解决一大堆工程和物理问题。
对于软件提供商来说,有不同的挑战,其中一些事情是找出如何弥合技术专家和主题专家之间的鸿沟。在像银行这样的组织中,从事量子计算的人还没有从量子计算的复杂性中抽象出来。他们不可能完全忘记量子计算是如何工作的。这是一个有点中庸的阶段,在这个阶段,将获得量子计算早期好处的人也需要了解更多关于量子计算如何工作的知识。在与客户合作以帮助确保他们充分理解基础技术方面存在挑战,以便他们能够理解它可能会如何影响他们的业务。
此外,量子软件总是会受到硬件发展的限制。我们可以构建一些好的软件工具,但如果最终没有硬件工具插入到软件框架中,解决特定行业问题的量子应用公司将在这方面受到很大压力。你知道,我们不是那些试图推进这部分的人。因此,我们依赖硬件提供商最终制造出好的量子硬件,我们可以证明它与商业应用相关。所以,我认为这是对处于顶层的人的一种挑战。
Arun :所以,让我们期待更好的跨堆栈创新,这样一方就不会受到另一方的限制。关于这一点,Max,我想我们的采访到此结束。我想再次感谢你的时间和惊人的洞察力。
不客气,阿伦。让我了解这本书的进展情况。
阿伦:绝对的。
结论
与 Max 的讨论帮助我扩展了量子计算应用的视野。直到我偶然发现 Max 的工作,我已经理解了量子计算在金融服务、物流、医疗保健和其他传统上数据丰富的行业中的应用。然而,政治在这种背景下是一个新的行业,它非常需要数据。
Max 与我们分享的另一个有趣的观点是量子计算堆栈的难点。这里需要注意的是,量子计算技术堆栈中存在创新,堆栈的每一层(无论是硬件还是应用程序)都有自己的挑战。一部分创新的放缓会对其他部分的创新产生深远的影响。
非常像与 Dave Snelling 的讨论,Max 也认为在量子计算的进化中可能有一个混合步骤。混合步骤可以包括新古典计算方法。在第 5 章、采访富士通研究员 Dave Snelling 博士的过程中,我们看到了数字 annealer 如何成为经典和量子 um 计算之间的桥梁。
然而,对我来说,从这一章中最重要的收获是,领导民主政府形成的人是如何依赖尖端技术的。社交媒体数据是让所有有兴趣了解选民的政党开展这项工作的关键组成部分。我希望当 Max 在 2020 年美国选举中使用他的应用程序时,我们会看到更多突破性的结果。