橡胶树甲基化过滤文库的构建与生物信息学分析
橡胶树(Hevea brasiliensi)是大戟科的木本经济植物,所生产的天然橡胶是一种重要的战略物资,在我国国民经济中具有不可替代的地位。随着我国经济社会的快速发展,天然橡胶需求量大幅度增加,我国天然橡胶供不应求。与水稻小麦等农作物相比,橡胶树分子生物学研究较为滞后。如何有效获取大量的基因组信息,高效筛选缩短育种周期、高产、优质、抗性等与育种密切相关基因,及其功能基因组学研究是今后橡胶树基因组学研究的重点。
基因组文库是进行基因组研究的基础工作之一,其主要应用于重要基因的克隆,基因的转录和调控的研究,探索基因的结构和组成,基因组物理图谱的构建及基因组的测序。橡胶树基因组结构复杂,重复序列含量高达52%,用常规构建基因组文库法(如Shotgun)则会增加测序成本,增加拼接错误率及降低筛选基因效率。cDNA文库则由于组织特异性和时空表达特异性,需要构建多个cDNA文库才能覆盖整个基因组信息。
甲基化过滤文库是近几年发展起来的一项基因富集技术,本研究利用大肠杆菌McrBC限制修饰系统构建了巴西橡胶树基因组甲基化过滤文库,并对大规模测序后所得数据进行生物信息学分析。获得主要结果如下:
该文库未扩增和扩增后的滴度分别为2.6×106pfu/mL和9×109pfu/mL,随机挑选22个克隆进行菌落PCR鉴定,DNA片段大小在1.0-2.5kb之间,阳性克隆率为86.4%。适合大规模测序需要,是开展橡胶树功能基因组学研究的宝贵资源。
试验从文库中随机挑选白色克隆进行测序,去除低质量序列,共获得有效序列4819条。将这些序列进行拼接,获得913个contigs和1748个singlets,共计2661条独立基因(Unigene),其中拼接最长的序列长为17954bp。GC含量统计表明,所得序列中GC碱基平均含量为35.86%,低于AT碱基含量(64.14%),推测与大肠杆菌McrBC限制修饰系统有关。
将获得的2661条非冗余序列进行blast相似性搜索,结果表明54.31%序列与NCBI公共生物信息数据库中功能基因序列和EST序列等基因编码序列高度同源,重复序列降低为7.4%,胞质DNA占6.05%,未知新序列,占32.10%。基因功能注释表明,该文库含有众多与能量物质代谢、蛋白质合成与降解、转录与信号转导、抗病及防御相关基因,证实了构建基于甲基化过滤技术构建橡胶树基因富集文库的策略是可行的。
- 作者:
- 黄关青
- 学位授予单位:
- 海南大学
- 专业名称:
- 作物遗传育种
- 授予学位:
- 硕士
- 学位年度:
- 2010年
- 导师姓名:
- 黄华孙
- 中图分类号:
- S794.101
- 关键词:
- 橡胶树;甲基化过滤;基因富集;生物信息学;功能分析
- rubber tree;methylation filtration;gene enrichment;bioinformatics;functional analysis