技术与创新
第一天项目

2022年生物学挑战:投资自动化蛋白质工程

02.11.22 | 6分钟阅读

2022年生物学挑战:投资自动化蛋白质工程
施密特期货首席创新官托马斯·卡利尔(Thomas Kalil)采访了生物医学工程师Erika DeBenedictis

Schmidt Futures正在支持一项倡议 - 2022年的生物自动化挑战 - 旨在加快蛋白质工程领域的领先研究人员的自动化。美国科学家联合会将担任这一挑战的财政赞助商。

该计划是由Erika DeBenedictis设计的,他还将担任计划主任。Erika拥有MIT的生物工程博士学位,还曾在西雅图华盛顿大学的生物化学家David Baker的实验室工作。

最近,我赶上了Erika,以了解为什么她为自动化蛋白质工程的机会感到兴奋。

为什么鼓励在生命科学研究中广泛使用自动化很重要?

自动化提高了生命科学的可重复性和可扩展性。如今,很难在实验室之间转移实验。这会减慢整个领域的进步,无论是学术界还是从学术界到工业的进步。自动化允许无摩擦共享新技术,从而加速了新技术的更广泛可用性。它还使我们能够更好地利用科学劳动力。生命科学中广泛的自动化将使所花费的时间从重复实验和更具创造力,概念上的工作转移,包括设计实验并仔细选择最重要的问题。

您是如何对自动化在生命科学中扮演的角色感兴趣的?

在Dropbox担任软件工程师后,我直接开始了生物工程研究生院。我很震惊地得知人们使用拖放GUI来控制实验室自动化,而不是实际的编程语言。我很明显,自动化有可能大大加速生命科学研究,并且有很多低调的水果。

为什么这是鼓励采用自动化的合适时机?

工业革命是200年前的,但是人们仍在使用手动移液。太疯狂了!在这一点上,机器人进行生活科学的硬件非常成熟,并且有很多组(Ginkgo,Strateos,Emerald Cloud Lab,Arctoris)具有自动化的机器人设置。仍然存在两个广泛自动化的两个障碍:适合机器人执行并克服文化和制度惯性的强大协议的开发。

自动化在生成机器学习所需的数据方面可以扮演什么角色?当今公开可用的数据集有哪些局限性?

在线可用的生命科学数据集很多,但不幸的是,大多数人都无法使用机器学习目的。单个实验室收集的数据集通常太小,并且在实验室甚至不同的实验者之间合并数据集通常是一场噩梦。今天,当两个不同的人进行“同一”实验时,他们通常会获得不同的结果。这是我们需要系统地解决的问题,然后才能收集大数据集。自动化和标准化测量是应对这一挑战的一种有前途的策略。

为什么要蛋白质工程?

Alphafold的成功强调了每个人使用机器学习来了解分子生物学的价值。机器学习的指导性闭环蛋白工程的方法越来越发达,自动化使科学家从这些技术中受益匪浅。蛋白质工程也受益于“机器人蛮力”。当您设计任何蛋白质时,它总是很有价值,可以测试更多的变体,从而使该学科从自动化中受益。

如果这是一个好主意,为什么学者过去没有做到这一点?

成本和风险是主要障碍。哪种方法可自动化和远程运行有价值?自动化会像预期一样有价值吗?这是完全不同的研究范式;会是什么样子?即使假设一位学者希望继续花费30万美元用于进入云实验室的一年,也很难找到资金来源。很少有实验室拥有足够的可支配资金来支付这笔费用,设备赠款不太可能支付云实验室的访问费用,而且很明显,NIH或其他传统资助者是否会在预算中以这种费用有利地看待这种费用。R01或等效。此外,在没有数据证明特定应用程序的自动化实用性的情况下,很难寻找资金。总之,只有很多进入障碍。

您正在启动这个名为2022 Bioautomation挑战的新程序。该计划如何消除这些障碍?

该计划旨在允许学术实验室几乎没有风险和无费用测试自动化。邀请小组提交提案,以了解他们想自动化的方法。选定的建议将获得三个月的云实验室开发时间,以及慷慨的试剂预算。成功自动化其方法的小组也将获得过渡资金,以便他们可以继续使用其云实验室方法,同时使用其全新的初步数据申请赠款。这样,实验室就不需要预先投入任何资金,并且能够在寻找长期资金之前决定他们是否喜欢自动化的工作流程和自动化结果。

从历史上看,在自动化方面进行的一些投资令人失望,例如1980年代的通用汽车或2010年代特斯拉。我们可以从其他行业的经验中学到什么?有风险吗?

一定。我甚至会说“ 2010年代的生活科学”是令人失望的自动化的一个例子:学术实验室开始购买自动化机器人,但最终并没有成为正确的范式。我将2022年生物自动化挑战视为实验本身:我们将授权全国实验室为云实验室测试许多不同的用例,以查看什么有效,什么无效。

将来,云实验室访问的资金将在哪里?

目前,关于NIH之类的传统资金来源是否会在预算中访问云实验室的访问方面有一个问题。该计划的目标之一是证明云科学的好处,我希望这会鼓励传统的资助者支持这项研究范式。此外,在学术生态系统中容纳云实验室访问的自然地点是大学级别。我希望许多大学可能会创建云实验室访问程序,或者将现有的核心设施升级到云实验室。实际上,这已经发生了:卡内基·梅隆(Carnegie Mellon)最近宣布,他们正在开设一个当地的机器人设施,该设施运营着Emerald Cloud Lab的软件。

BioFabs和核心设施将扮演什么角色?

在10年的时间里,我认为“生物启动”,“核心设施”和“云实验室”术语都是代名词的。如今,唯一的重要区别是如何指定实验:许多核心设施仍通过定制的Google表单接收订单,而Emerald Cloud Lab却弄清楚了如何为其所有乐器揭示单个编程界面。我们在Emerald实施了此计划,因为所有参与的实验室都可以互相交谈并共享协议,而不是每种只能在其本地生物启动中运行的方法。最终,我认为我们将看到标准化,所有设施都将能够运行其具有必要工具的任何协议。

除了蛋白质工程外,生命科学中是否还有其他领域可以从云实验室和机器学习的大规模,可靠的数据收集中受益?

我认为有很多领域会受益。与可重复性斗争的领域是手动重复的和时间密集的,或者从将计算分析与数据紧密整合在一起的领域都是自动化的良好目标。显微镜和哺乳动物组织培养可能是另外两个候选者。但是,如果有机会收集数据,社区需要做很多智力工作,以表达可以通过机器学习方法解决的问题。