大家好,欢迎来到IT知识分享网。
 
生物笔记——注解(一)
文章目录
前言
在这一系列文章中,主要是对相对应的生信分析篇的博文中的生物知识进行注解。以巩固生物知识。(故主要是以笔记为主,排版会较粗糙),本章为 实验篇——基因家族成员鉴定(一) 的注解
一、注解()
1. CDS序列
2. Fasta/fa格式
3. GFF3/GTF格式
而GB 文件除了包含基因组特征的位置和注释信息外,还包括基因组序列的碱基序列
4. BLAST
5. SMART
6. 基因家族成员鉴定
7. 参考序列
参考序列(Reference sequence)是在基因组学和生物信息学研究中使用的一种基准序列,用于与其他样本或序列进行比对和分析。参考序列通常是一个代表性的、经过确认和注释的基因组或转录组序列。
参考序列可以是某个物种的整个基因组序列,也可以是某个特定区域(如染色体、基因)的序列。这些参考序列通常是高质量的、较完整的序列,经过多个实验室的研究验证,并进行了注释和标准化处理。
使用参考序列可以帮助研究人员对新测序数据进行比对和分析,从而确定新测序片段的位置、变异情况和功能等。通过与参考序列的比对,可以确定DNA片段的起始和终止位置,预测基因和CDS序列,识别基因组变异和单核苷酸多态性等。
在某些情况下,参考序列也可以用来表示氨基酸序列。例如,在使用BLAST(Basic Local Alignment Search Tool)等序列比对工具时,可以使用已知的蛋白质氨基酸序列作为参考序列来比对新测序得到的氨基酸序列,以确定其相关性或相似性。但在这种情况下,通常会明确指出参考序列为氨基酸序列,以区别于DNA或RNA序列的参考序列。
8. KEGG
9. pep格式
PEP格式是一种用于表示蛋白质序列的文本格式。PEP表示”Protein Encoding Sequence”,常用于存储和共享蛋白质序列信息。
10. 结构域
总结
–时23年7月15日 笔记篇
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/121250.html