使用BLAST验证质粒的提示

由Jason Niehaus

科学家从冰箱里提取样本本文更新于2017年12月4日。

在Addgene,我们持续使用NCBI提供的基本局部对齐搜索工具(BLAST)。BLAST可以帮助我们将文库中质粒的测序结果与已知的参比序列进行比较,如将质粒存入我们的实验室提供的完整质粒序列,或NCBI众多数据库中的其他条目。

由于我们的存储库多年来(我们现在有超过60,000多种质粒!),我们分析的排序结果数量是我们的质量控制过程的一部分稳步发展。在繁忙的一周内,我们可能需要分析超过200个质粒,作为我们的质量控制过程的一部分。因此,我们的团队完善了我们使用BLAST Web浏览器界面尽可能高效。

如果你发现自己经常在BLAST网站验证质粒或验证您的新克隆,尝试这些提示,充分利用您的时间和序列!您可能也喜欢看我们的质量控制过程随着下一代测序技术的引入,已经发生了改变!

订阅质粒博客帖子!

选择爆炸计划

在五个可用的BLAST程序中,我们主要使用Standard Nucleotide BLAST (blastn)、Standard Protein BLAST (blastp)和translation BLAST (blastx)。NCBI有一个很棒的BLAST入门指南,其中包括对不同的BLAST程序、数据库和BLAST搜索页面的元素的简单解释。

在Addgene,我们使用blastn来识别桑格序列中的任何差异,如不匹配、缺失或插入。我们使用blastp或blastx将测序结果与蛋白质序列进行比较,以检查开放阅读框(orf),并确定任何核苷酸差异的潜在影响。blastp和blastx程序的优化是不同的,你可能想要选择一个(或两个)取决于你想要验证的信息。我们将在下面深入研究这些差异。

优化blastn搜索

标准核苷酸爆炸页面,首先要做的决定是是否将Sanger测序结果与单个已知参考序列或BLAST序列数据库进行比较。如果您知道预期的核苷酸序列,勾选“对齐两个或更多序列”复选框,并将您的参考序列粘贴到出现的主题序列框。对齐两个核苷酸序列可能是执行最快的BLAST搜索,与其他类型的BLAST搜索相比,将节省您的时间。

blastn对齐多个序列

如果您不知道结果的确切参考序列,请从下拉菜单中选择一个BLAST序列数据库。通常,我们使用默认核苷酸数据库“核苷酸收集(NR / NT)”,因为它包含Genbank,Embl,DDBJ和PDB序列的复合,并且可以是搜索最全面的。

blastn数据库选择

节省时间的技巧#1:如果你知道你的测序结果应该匹配的物种,在有机体框中输入常见或科学名称。这一小段信息可以显著减少您对blastp、blastp和blastx搜索的等待时间!

Blastn生物选择

现在,在单击BLAST按钮之前,考虑程序选择参数,因为这会影响执行搜索的时间以及整体对齐结果。默认设置为“优化高度相似的序列(Megablast)”,当序列与参考/数据库序列之间的身份≥95%时,这是非常快的,最佳工作。[我们的QC过程将无故障,如果95%的结果始终是正确的!]

由于Sanger测序反应是不完美的,而且接近一个反应开始或结束的序列通常是不可靠的,我们建议使用“有点相似的序列(blastn)”程序进行blast,这样你就可以从你的结果中提取几乎每一个可靠的碱基对。

BLASTN计划选择

此选项并不像Megablast那么快,但可以返回较长的对齐以与您的测序跟踪文件进行比较。与Megablast不同,常规BLASTN程序使用较小的单词大小,并在对齐中的不匹配和空隙中降低得分惩罚。如果您对BLASTN程序的差异感到好奇,请查看爆炸帮助网页

优化Blastx.搜索

一旦你使用Blastn为了确定一个桑格测序结果的可靠部分,并注意到核苷酸序列中任何潜在的不匹配或空白,你可以运行一个翻译爆炸(blastx)搜索以检查预期的orf、突变或截断。blastx的一个主要优点是,您不必为您的测序结果决定一个阅读帧——blastx根据数据库检查所有6个可能的帧。另一个好处是,当查看blastx结果时,ORF中出现的帧移突变很明显。

blastx数据库选择

使用Blastx时在Addgene中,我们使用默认的“非冗余蛋白序列(NR)”数据库,因为它包含最大数量的蛋白质序列。就在Blast按钮下方,您可能已经注意到“算法参数”链接。单击此链接可查看高级BLAST选项,并为我们建议的BLASTX自定义。类似于核苷酸序列,蛋白质通常具有重复或高度同源的区域,默认情况下在标准BLASTX搜索中被忽略。省略重复区域的对准可能会令人困惑,例如当您试图验证基因的起始甲硫氨酸,但BLASTX结果在更远侧氨基酸处开始对准。我们始终如一地运行BlastX搜索与“低复杂性区域”过滤器未选中,以便在搜索中包含这些区域以最大化对准长度。虽然此推荐不是无懈可击,但我们发现它可以节省分析时间以删除此默认设置。

Blastx低复杂度滤波器

令人惊叹的提示#2:由于在将核苷酸序列转化为所有六种可能的读数框架中所涉及的附加搜索,Blastx搜索本质上比BLASTN或BLASTP慢。如果您知道预期的蛋白质序列,请使用“对齐两个或更多个序列”选项在大大降低搜索结果的等待时间。

优化blastp搜索

这取决于排序结果,我们经常选择一个标准蛋白BLAST (BLAST)和BLASTX搜索以验证质粒中的预期蛋白质序列。如果您知道哪个阅读框架要选择测序结果,并且可以轻松地翻译它,我们建议使用BLASTP OVER BLASSX。主要优势是节省时间,但额外的好处是BLASTP搜索默认情况下不会过滤低复杂性区域,这意味着您不必记住调整任何BLASTP算法参数。我们使用默认评分矩阵Blosum62,但您可能想要查看描述的描述其他矩阵看看另一个是否对你的搜索更有利。

BLASTP数据库选择

令人惊叹的提示#3:请注意,可用的蛋白质数据库不太可能对融合到表位标签或融合蛋白的最喜欢基因的精确进入。如果选择您的测序引物确认标签或融合蛋白是框架的,我们建议使用BlastX与“将两个或更多序列对齐”选项并将预期的蛋白质序列粘贴到主题序列框中。

爆炸的替代品

根据您的测序结果和期望的分析,爆炸可能并不总是您的最佳选择。对于爆炸无法处理的困难序列对齐,Clustal是我们经常选择的成对或多序列比对核苷酸或蛋白质序列。我们也使用用于对准多种蛋白质序列,特别是为了比较不同的同种型。除了我们的最爱外,还有许多序列对齐工具可用。

试试下面这些资源,看看BLAST的替代方案:

快乐爆炸!

您是否有任何用于使用爆炸的提示,以确认您的质粒测序结果或对我们的建议进行评论?分享您的想法在这里帮助其他实验室加速他们的质粒和克隆验证步骤,并使更多时间更加使用质粒!

点击下载addgene的质粒101电子书


所有的BLAST图像都是修改后的截图NCBI BLAST网站

额外的Addgene博客资源:伟德体育中心

在Addgene.org上的资源

主题:分子生物学协议和提示,质粒

发表评论

分享科学刚刚变得更容易...订阅我们的博客

订阅