CRISPR软件Matchmaker:用于为您的需求选择最佳CRISPR软件的新工具

由Guest Blogger.

这篇帖子由Guest Blogger Cameron MacPherson在Institut Pasteur贡献

CRISPR软件和piñata效应

两年前,我是团队的一部分(宿主-寄生虫相互作用生物学,巴斯德研究所,巴黎)改变了在疟疾社区中的基因组编辑更好(NAT。Biotechnol。,2014年)。鉴于时间,它不应该是一个惊喜克里普尔克系统涉及。今天,同样的实验室在他们的工作编辑的基因组中成功编辑超过90%的速度疟原虫疟原虫(导致疟疾的寄生虫)。我把他们的成功归功于他们的专业技术和深思熟虑单导RNA (sgRNA)设计的GC含量异常低疟原虫疟原虫基因组。将最后一点放入角度来看疟原虫疟原虫基因组仅含有0.66亿个可定位的NGG PAM网站,而人类基因组大约有3亿。由于这种稀疏的纵向基因组,偏离靶向令人担忧和瞄准可能更有效。

如果没有计算支持,这些见解是很难理解的。事实上,如果不依赖于某种预先分析,理性的sgRNA设计是不可能的。2014年底,我开始开发软件,让所有人都可以使用sgRNA设计。当时我认为还有改进的空间,一年后,很明显其他人也有同样的想法。自2013年1月以来,已经有33个CRISPR软件工具发布和记录omictools.。新人必须令人困惑地决定正确的软件。有了这么多选择我所拥有的问题,我们是如何首先到达这里的?

CRISPR创新如何影响软件开发

CRISPR引导RNApiñata

像MiRNA泡沫一样Crispr,提供了有趣的观点,以迅速创新如何影响研究界。我比较了围绕piñata的庆祝活动。从构建piñata的那个角度来看,他们的作用是填补一个值的道具。他们是内容的审稿人。另一方面,Piñata击败派对的目标完全不同。他们充满了盲目预期。他们对内容质量的信任被他们对Piñata建设者的信任 - 审稿人隐含地定义。在党的成员的某些身体劳动之后,Piñata爆发及其内容泄漏到地面。随着人群试图体重,有类似的东西,类似于狂热,并确定每个甜或玩具散落在地板上的价值。在最后的唤醒中,它全部安定下来,每个物品的价值从审阅者如此艰苦地评估到社区意见的更多代表性的东西。 The trouble is, with so much choice, in those few moments after the piñ在突发情况下,主观地将价值归属于每个个体的基本需求;作为一个整体,社区还没有确定任何真正的价值。我把这种现象称为“Piñata效应”,它是指那些评论piñata内容的人与盲目接受的观众之间产生的脱节;这将导致高度相似的内容以及缺少迭代设计;这是由于没有时间评估公众反应造成的;我认为这就是我们目前在CRISPR软件领域所处的阶段。CRISPR研究社区还没有机会就最好的CRISPR软件工具达成共识。

作为一个基因组编辑工具,CRISPR / CAS9技术因2012年的首次年度自2012年的研究活动和发展而被包围。这只是3到4年前。它是创新的泡沫(Piñata),软件开发赶上了它。同行评审过程受到许多密切间隔的CRISPR软件提交的挑战。随着少数现有的出版物继续进行,所提交的稿件只能被视为重大改进。因此,Piñata软件已经填充了在没有许多资源的主题上的略有变化,无法查看它们。统称,CRISPR软件池体现了促进CRISPR工程中最实验应用的解决方案。与该集体实用程序相比,在单个应用程序中缺少功能很容易。那么问题是,如果我们将所有工具用作某种元/弗兰肯斯坦的应用程序?或者也许有一个明确的胜利者,我们可以将我们的时间投入学习和提取最大价值吗?这只是参与Crispr的人面临的许多决策之一,但它是一个越来越多的市场而变得更糟的重要障碍。 Since 2013 about 11 tools have been added every year.

打破障碍:我对当前SGRNA设计工具的看法

这篇文章的目的是提供一些关于可用的CRISPR软件工具的见解,各种工具试图解决的问题,以及我们未来可能如何前进。当我们想到使用CRISPR设计实验时,软件可以在两个主要领域提供帮助。最重要的是处理sgRNA的设计,代表了目前可用工具的最大份额(我们将在这篇博文中重点讨论这些工具)。第二个主要领域是实验后质量控制,一个很好的例子是CRISPR-GA.。这些工具按类型评估修复事件(NHEJ./HDR.)和轨道在一个轨迹处,通常是目标网站。需要多基因座评估来完全评估偏离目标,但目前没有为此目的设计软件。第二个区域非常重要,凭借它缺乏关注,这是一个很明显的地方,可以关注进一步发展。然而,质量控制不是这个博客文章的重点。

我将SGRNA设计工具分开到数据库中德诺维解决方案。数据库工具允许我们查看和了解SGRNA设计以前在哪些条件下进行了工作。这种资源对于自动合理设计可能是非常有价值的。只有三个这样的数据库,eendb.(2013年1月1日发布),是一个简单的SGRNA设计目录。第二个数据库,cris(2015年6月27日发布),对其广泛的范围,策划内容和易于访问来值得注意。第三,w(发布于2015年9月15日),更类似于EENdb而不是CrisprGE,但也是一个很好的例子,如何使用数据库工具来帮助设计。这些数据库还很年轻,需要社区的合作才能成功。

关于德诺维SGRNA设计,我再次将其分为两类。一方面,我们有软件工具,应用一些近似或明智的规则来确定一个SGRNA设计的值。另一方面,一些软件工具利用经验派生的和/或先前的知识来告知确定良好SGRNA设计的质量。顺便提一下,SGRNA设计的第一个软件(通过Hsu等人,2013)使用两种经验和近似方法的组合。他们得分函数的细节可以在他们的在线工具中找到文件。自HSU等人以来,2013年,其他工具已纳入新的参数,例如DooCh-Root Score(byDoench等人,2014)到他们的评分函数。许多工具也选择了混合和匹配不同的评分算法和参数。这种思想的织锦使选择正确的工具变得混乱,这意味着没有一种放之四海而皆通的方法。您必须根据您的项目而不是一般的意见来选择工具。

CRISPR软件媒体概述概述。CRISPR软件Matchmaker可帮助您确定用于您的CRISPR实验的RNA设计软件。

我可以花费很多时间详细运行每个工具,但已经在已发表的文章中介绍。相反,我已经将工具分解为使每个工具唯一的个别功能。这CRISPR软件搭配制造者由这些功能组成,并使您可以根据项目需求选择该工具。表中发现了8个主要类别,描述了从基本到高级功能的所有内容以及用户如何与工具交互(可以在上面找到表格截图和表的概述)。下面进一步讨论这些类别(表中也可以提供所有术语的定义):

  • 基本功能:这些功能体现了该软件的主要目标,应该是您首先要确定工具适用性的地方。此类别的功能是工具之间最常见的。例子:“单目标设计”,“多目标设计”,“偏离目标意识”,“高错位”,“近似设计”,“经验设计”,“单粉状设计”,和“多帕姆设计”。趋势到2014年底,工具开始不再专为NGG PAM目标设计,而是开始允许任意的PAM定义。这些更新的工具对于最新的以Cas蛋白为靶点的NTT,CPF1。另外,目标疗效仍然是一个只有几个工具试图解决的概念。
  • 高级功能:这些功能并不完全必要,但应视为非常有用,具体取决于设计目标。例子:“特征感知”、“SNP感知”、“二级结构感知”、“微同源性感知”。趋势:使用高级功能释放的工具较少,似乎这些功能委派给其他更合适的软件,如或商业工作台等acvector.或者卧改
  • 实用功能:这些功能通过删除重复任务和/或提供功能来帮助加速SGRNA设计过程,以帮助诸如底漆和质粒设计之类的设计过程。例子:“多路复用设计”,“多方法设计”和“单方法设计”。趋势:最常见的实用程序功能是批量设计或多路复用功能。然而,帮助底漆设计的工具越来越普遍。
  • 用户交互:属于这一类的软件设计元素描述了用户期望如何与软件交互。对于希望根据操作计算机的舒适度选择工具的用户来说,这个类别很重要。例子: offline、online、CLI、GUI。趋势:在线工具主导了软件空间,但通常依赖于更强大的算法来检测偏离目标。少数脱机工具主要在任何计算机上工作,但通常需要命令行或脚本的工作知识。
  • 输入灵活性:软件工具需要输入某种数据才能产生结果。虽然不同类型的输入比其他类型的输入更方便用户,但这与数据输出相比不那么重要,因为不同的输入类型可以很容易地转换。例子:“有机体”,“序列”,“标识符”和“负载”。趋势:基于序列的输入是迄今为止最常见的,对于大多数工具,也需要用户指定生物体。
  • 输出多样性:不同的工具以不同的格式向用户提供结果。这可能对下游结果产生很大影响。例子:“HTML”,“视觉轨道”,“绘图”,“表格”,“交互式”和“保存”。趋势:大多数工具提供表格HTML格式化输出。令人惊讶的是,只有2个工具提供Fasta输出。一些值得注意的工具允许用户保存结果并稍后返回或共享。
  • 社区排他性:不同的社区为自己的需求开发软件。这通常会导致软件设计,其仅适用于一个,或者有机体的子集。在只有少数情况下,软件是有机体无关紧要的。大多数工具都是一个或一部分生物体。例子:“生物体不可知论”、“模式生物体”、“小基因组”、“大基因组”、“生物体偏向评分”。趋势:许多工具可以处理任何尺寸的基因组,只有受限制的作者将基因组添加到工具的曲目中。有机体无政府主义工具是更好的解决方案,但通常被包装为脱机工具,需要一种编程语言的专业知识。
  • 支持的生物:本节列出了每个工具支持的基因组。基因组由有机名称和基因组装配版本表示。表中的名称在软件中显示。大多数SGRNA设计工具都要求用户指定生物体。他们这样做是因为他们依靠预先构建的指数或数据库,以便尽快找到并向结果展示。一些工具不需要指定生物,并且是真正的生物无关紧要。其他工具需要指定生物,但也允许您构建您自己的数据库;这些工具将被标记为有机体无止无止因,并在本节中列出的现有机构。

针对特定用户的CRISPR软件建议

您会发现,一些工具通过开发的算法或专注于特定生物的方式来满足特定的使用情况。因此,我一般建议已经尝试过几个Crisp实验的实验室评估他们对每个工具建议的设计的设计感兴趣的每个工具的预测力。对于第一次进入SGRNA设计的人来说,最好选择基于即时需求的工具,并在几个实验后重新评估。或者,上面提到的数据库或者甚至更好地从相同生物中使用Crispr的实验室更好的第一手知识可以用作最后一种方法的代理。

第一次计时器的顶级工具:您需要学习语言以及参数代表的内容。最好的学习工具是E-CRISP。作者已经努力,以便他们的工具既是教学和功能。它也是我遇到的唯一工具,以便根据正在追求的CRISPR实验的类型提供参数的类别。你还应该看看的词汇表CRISPR软件搭配制造者,它提供了一个术语列表,我认为为CRISPR软件空间定义很重要。您不太可能在其他任何地方找到这些条款,因为我为这篇文章开发了它们,但他们应该让您了解要留意的内容。

用于生物信息管理员的顶级工具:在您自己的分析中灵活性,您需要访问原始数据,目标站点,偏离目标站点,分数和进入计算它们的统计数据。为此,一些在线工具如CAS-IFFINDER.就足够了。CAS-Iffinder在基因组中使用任何编辑距离的任何IUPAC编码模式提供基因组中所有字符串的裸耳数据转储。但是,它不会计算除编辑距离以外的任何得分。添加的功能留给您实现。您还可以下载该软件以用于任何机器OpenCL启用了硬件。这种对OpenCL的依赖是一个严重的限制,但该工具的速度已经足够快,如果你从事重CRISPR设计(我说的是屏幕和/或非常大的基因组),那么买一台专用的机器是值得的。在脱机前端,有一个Python脚本叫做SSFinder,但我发现它的实现对于实际使用来说太慢了。基于R的包CRISPRseek提供良好的实用程序,并加上生物导体应该是任何已经熟悉R的人的首选。对于Java爱好者来说,看看SGRNACAS9.

将CRISPR技术转移到新生物的顶级工具由于显而易见的原因,你可以排除任何限制你的特定基因组子集的工具。这些是大多数工具,但好消息是您只需要一个。protospacerwb.是通过将CRISPR技术应用于新生物的目的,帮助您与您有完整的组装。它是一个离线工具,但附带图形用户界面。

实验室的最佳策略:在购买软件之前,明确你需要这个软件工具做什么。使用CRISPR软件搭配制造者根据您的需求选择最佳工具。优化你的标准。重复,直到找到最好的工具。做几次实验并使用结果重新评估所有工具。报告您的调查结果以帮助其他人。

CRISPR技术已经达成了如此多的不同社区,即公正地判断个人工具是全部但不可能的。我相信这次只能客观地将工具分解为个人产品,并允许您根据您的需求选择它们。我们可能会开始看到具有越来越多的功能的可用工具的收缩集成到所谓的基因组编辑工作台等中卧改(商业、在线)DESKGEN(商业,在线),或protospacerwb.(学术,离线)。虽然它仍有待观察,但我相信CrispR软件的未来是有前途的。这个空间的快速创新使我们能够退后一步,樱桃选择实际在我们的实验和生活中有所作为的特征。要有效地做到这一点,开发人员和最终用户之间需要良好的沟通。

点击此处使用CRISPR软件Matchmaker!


感谢我们的客座博客Cameron MacPherson!


卡梅伦麦克弗森

Cameron R. Macpherson是MilieuIntérieur项目的牵头数据科学家,巴黎斯特雷斯特州的MilieuIntérieur项目。你可以在推特上跟着他@cmacphd.

参考

1. ghorbal,mehdi等。“使用CRISPR-CAS9系统在人疟疾寄生虫疟原虫疟原虫中的基因组编辑。”自然生物技术(2014)。PubMed.PMID:24880488

2。Hsu, Patrick D,等。" rna引导的Cas9核酸酶的DNA靶向特异性"自然生物技术31.9(2013):827-832。PubMed.PMID:23873081。pmed中央PMCID:PMC3969858

3.doohion,约翰g。等。“CRISPR-CAS9介导的基因失活高活性SGRNA的理性设计。”自然生物技术(2014)。PubMed.PMID:25184501pmed中央PMCID:PMC4262738.

addgene的资源

获得提示如何设计一个grna

读我们CRISPR指南赶上所有的CRISPR基础知识

阅读其他关于Crispr的博客帖子

经过验证的GRNA.

计划你的下一个CRISPR实验,点击开始在Addgene

话题:克里普尔克其他CRISPR工具

发表评论

分享科学刚刚变得更容易...订阅我们的博客

订阅