基因之间的CRISPR:如何试验增强剂和表观囊肿

由Guest Blogger.

Guest Blogger.

这篇文章由Guest Blogger,Aneesh Karve,CTO在Qult数据上贡献。这篇文章最初发表在被子基因组学博客并在此允许重新发布。

被子是基因组学的协作数据库。在本文中,被子CTO Aneesh Karve,展示了如何设计在基因组的任何地方工作的实验。Aneesh的研究兴趣包括蛋白质组学,机器学习和大生物学的可视化。

基因组的GPS

我们可以将人类基因组视为具有三个坐标的地图:染色体,开始和停止。例如(CHR3,1,10)表示在第三染色体的一开始的DNA的一段DNA,长度为10个碱基对。排序技术的新兴系列函数作为一种“基因组的GPS”,以计算蛋白质,RNA和DNA等遗传元素的坐标(表1)。与现实世界中的GPS一样,单独的坐标并不是很有用。我们需要像Google地图这样的东西来帮助我们识别和可视化地址。那就是在哪里增强剂基因组的数学进来。他们帮助我们将原始基因组坐标转变为有意义的实验。

表格1:一个新兴的“GPS为基因组的GPS”技术

技术 它找到了什么
ChIP-seq 蛋白质(稍后为我们的例子,组蛋白)
ChiRP-seq RNA.
DNA(基因组到基因组相互作用)
DNase-seq DNA(绑定的区域)

谷歌地图:增强剂和基因组数学

假设您希望使用Google地图查找您家附近的所有咖啡厅,不包括星巴克。采取书呆子的角度,您可以表示您的搜索如下:

(my_house +咖啡) - 星巴克

看看符号如何工作?这+操作员表示交叉点和-操作员表示设定差异。这是基因组数学如何有助于我们在基因组中找到有趣的地址。现在让我们检查我们如何定位强大的延伸的DNA增强剂借助基因组数学的帮助。

基因组数学

E.NHANCERS是DNA的区域,它表现出“远处的幽灵动作”。通过DNA压实的奇迹,增强剂可以增加数百万基础的基因的表达。(有关DNA压实和结构蛋白的细节这使得可以看到附录DNA是一种三维分形)。

增强剂生物学是一个复杂而动态的领域。我们将专注于一种可靠的方法来找到增强子通过分离与修饰蛋白质结合的基因组区域组蛋白。我们可以检测与“GPS的蛋白质GPS”的修饰组蛋白,ChIP-seq从表1.由于DNA的3D几何形状和改性组蛋白的化学性质,具有单甲基化和乙酰化的组蛋白,但不是三甲基化的组蛋白的基因组区域作为增强剂。因此,我们可以表示增强剂如下:

(单甲基化+乙酰化) - 三甲基化

在下一节中,我们将把上述公式应用于真实世界的实验。我们将从芯片-SEQ数据开始编码项目,发现胚胎干细胞中的增强剂,并与目标结束CRISPR屏幕这可能会扰乱这些增强剂。

一个真实的实验

假设您运行芯片SEQ实验(认为“蛋白质的GPS”)纳米尾胚胎干细胞中的基本转录因子(ESC)。您的芯片SEQ查找超过13,000个重要的绑定峰纳米尾在人类基因组中。但并不是所有这13000个地区都对维持esc很重要。所以W.这13,000个地区的HILH是至关重要的?一种假说:增强剂!这将我们引向一个三步法来设计一个实验来识别关键纳米尾结合位点:

1.找到增强剂有纳米尾绑定站点

2.设计一个捣碎的屏幕来瞄准和扰乱纳米尾增强剂

3. CRISPR.从步骤2中出来的增强剂。查看哪些ESC死亡或区分

3 .显示纳米尾- 相关基因对干细胞存活至关重要。了解哪些基因影响我们的细胞培养物的生存是现代药物发现和治疗的基础。我们将更多地说在下一节中Crispr的临床应用。

为了表示纳米尾从步骤1与基因组数学的增强剂,我们需要从表观古学的领域需要一些速记:

  • H3.-之一nanog的相关组蛋白蛋白
  • K4和K27 -氨基酸赖氨酸在H3中的位置
  • ME1,ME3和AC-表示单甲基化,三甲基化和硫化物化(这些是化学修饰,或功能群体,发现在赖氨酸)

将其全部放在一起,我们得到以下表达式步骤1:

(H3K4ME1 + H3K27AC) - H3K4ME3

以下视频展示有人如何找到带被子的增强剂。

寻求和摧毁Crispr的增强剂

用基因组数学表达武装纳米尾增强剂,我们已经准备好了第2步:设计一个CRISPR屏幕扰乱这些增强剂。第三步,也是最后一步,是进行CRISPR筛选。我们首先用一种抗体感染数百万个胚胎干细胞慢动脉矢量,与艾滋病毒在同一家庭中的衰减逆转录病毒。通过设计,我们的Lentiviii在遗传上编程来CRISPR出我们在步骤2中确定的增强子。结果是干细胞的异质群体,通常被放置在一个烧瓶中。通过一些随机魔法和泊松统计,平均每个亚种群都有一个明显的增强器被破坏了。随着ESCs的死亡和分化,我们定期使用下一代测序来测量人群中引导rna (gRNAs)的相对比例。回想一下,指导RNA.是CRISPR的目标机制。因此,如果GRNA随着时间的推移,我们瞄准的增强剂是我们干细胞的“功能柱”。删除此支柱,ESC模具。

从加入的Lentivirus订购

如果你有兴趣为增强器设计自己的CRISPR屏幕,请查看附录。

结论:在暗物质上脱落

精确了解哪个基因组是干细胞的支柱,或转移肿瘤细胞,或受影响的肿瘤细胞,或[您的细胞的感兴趣],是精密药物的基础。我们可以应用这种知识,以创造针对健康细胞的最小副作用和对不健康细胞的最小效应的靶向疾病治疗。

直到最近,人类基因组充满了暗症问题:增强剂,LNCRNA,重复元素,阻遏物,绝缘体等。我们知道这件事存在,但传统研究其功能的方法已经过分困难。CRISPR与表1的技术相结合,为我们提供了强大的GPS样技术,以探索基因组中的暗物质。还有无数未知的地区尚未探索。我希望这个简短的指南可以帮助你做到这一点。

祝你好运总是继续前进

附录

DNase过敏位点和基因克克里普尔

你真正的生成了DHS数据设置从所有DHS网站开始ENCODE项目中125种不同的人类细胞类型。DHS位点是基因组中最具包容性的监管区域标志物,包括增强剂,促进剂,绝缘体等。然后,我鉴定了有效的GRNA序列,对2百万DHS站点没有离目标效果。见下文有关详细信息。

DNA是3D分形

DNA压实

人们通常将DNA视为排列在双螺旋中的A,T,G和C核苷酸的线性聚合物。人错了。实际上,细胞DNA是染色质的复杂的三维球状。染色质是卷曲DNA和典型的结构蛋白的组合,称为组蛋白。染色质折叠成二次结构(环)和三级结构(球状),以实现精致的压实 -每克的700岁左右- 形成X形染色体,我们都知道和爱。

要了解压缩,假设您有一个10米长的块串。你扭曲并将绳子卷成一个紧绷的球。现在弦的两端,而不是10米,仅仅是毫米毫米。类似地,细胞紧凑的DNA以线性地区靠近靠近的方式。

GRNA选择和过滤偏离目标效果

我们首先使用HG19基因组的多快速文件使用Bedtools getfasta。将这些区域及其反向补充被解析为SPCAS9 PAM位点(NGG),然后基于两个主要标准过滤:允许的TTTT(这是聚合酶终止子),对所鉴定的23-MEL GRNA没有脱靶效应。偏离目标确定Bowtie2.使用首先描述的参数kearns等人。

Bowtie2 -F -X HG19_genome - 本地-F-k 10 - 敏感 - 本地-l 9-n 1 -u grna_23mers -s grna_hits.sam


非常感谢我们的博客,Aneesh Karve!

Aneesh Karve.Aneesh Karve是CTO被子数据。被子是一个协作数据库。Aneesh的研究兴趣跨度机器学习,蛋白质组学和数学用户界面。

额外资源

addgene博客上的资源伟德体育中心

addgene.org的资源

话题:克里普尔克其他CRISPR工具

发表评论

分享科学刚刚变得更容易...订阅我们的博客

订阅