2025-05-28 06:28:03

人类基因组

染色体

编辑

人类基因组是由23对染色体(共46个)所构成,每一个染色体皆含有数百个基因,在基因与基因之间,会有一段可能含有调控序列和非编码DNA的基因间区段。

人类拥有23对不同的染色体,其中22对属于常染色体(体染色体),另外还有1对能够决定性别的性染色体,分别是2或1条X染色体与0或1条Y染色体。1号到22号染色体的编号顺序,大致符合他们由大到小的尺寸排列。最大的染色体约含有2亿5千万个碱基对,最小的则约有3800万个碱基对[2]。这些染色体通常以细丝状存于细胞核内,若将单一细胞内的染色体拉成直线,那么将大约有1.83公尺(6英尺)长[3](1英尺=30.48公分)。

在人类个体的体细胞中,通常含有来自亲代的1到22对体染色体,再加上来自母亲的X染色体,以及来自父亲的X或Y染色体,总共是46个(23对)染色体。科学家将这些染色体分为7组:1号到3号是A组;4号与5号是B组;X染色体以及6号到12号是C组;13号到15号是D组;16号到18号是E组;19号与20号是F组;21号、22号与Y染色体是G组[4]。对于一般人类来说,每个细胞核内只有两套染色体。

基因

编辑

人类与其他物种的基因组比较(大约)[5][4]

物种

碱基对数量

基因数量

Mycoplasma genitalium霉浆菌(生殖器支原体)

580,000

500

Streptococcus pneumoniae肺炎双球菌

2,200,000

2,300

Haemophilus influenzae流感嗜血杆菌

1,830,140

1,700

Escherichia coli大肠杆菌

4,600,000

4,400

Saccharomyces cerevisiae酿酒酵母

12,000,000

5,538

Caenorhabditis elegans秀丽隐杆线虫

97,000,000

18,250

Arabidopsis thaliana阿拉伯芥(拟南芥)

125,000,000

25,500

Drosophila melanogaster黑腹果蝇

180,000,000

13,350

Oryza sativa亚洲稻

466,000,000

45,000-55,000

Mus musculus小家鼠

2,500,000,000

29,000

Homo sapiens人类

2,900,000,000

27,000

人体内估计约有20000到25000个蛋白质编码基因。原本这个估计的数目超过100000,在更好的基因组序列品质与基因识别技术出现之后,才逐渐向下修正为现在的数字。虽然人类的基因数量比起某些较为原始的生物(如线虫与果蝇)更少,但是在人类细胞中使用了大量的选择性剪接(alternative splicing;将穿插在内含子中的外显子以选择性的方式进行转录),这使得一个基因能够制造出多种不同的蛋白质,且人类的蛋白质组规模也较前述的两个物种更庞大。

大多数人类基因拥有许多的外显子,且人类的内含子比位在其两端的外显子更长。这些基因参差不齐地分布在染色体中,每一个染色体皆含有一些基因较多的区段与基因较少的区段。这些区段的差异,则与染色体带(chromosome bands)及GC含量相关。基因密度所显现的非随机模式之涵义与重要性尚未明了。

除了蛋白质编码基因之外,人类的基因组还包含了数千个RNA基因(制造非编码RNA),其中包括用来转录转运RNA(tRNA)、核糖体RNA(rRNA)与信使RNA(mRNA)的基因。其中转录rRNA的基因称为rDNA,分布在许多不同的染色体上。

调控序列

编辑

人类基因组含有许多不同的调控序列,并以此来控制基因表现。这些序列是典型的短序列,会出现在靠近基因的位置。由于高通量表达(high-throughput expression;指利用电脑与机器辅助以进行大量的序列分析)技术与比较基因组学研究的出现,人们开始系统性地了解这些调控序列,以及它们共同构成的基因调控网路(gene regulatory network)。

人们之所以能够出辨认哪些基因序列是调控序列,是因为生物在演化过程中对基因的保留。以大约7千万年前到9千万年前分支的人类与老鼠为例[6]:若以电脑比较两者的基因序列,并且将两者皆保有的非编码序列辨识出来,就可以知道哪些基因序列可能对于基因调控来说相当重要[7]。

人类所拥有的调控序列所在位置,可以利用河豚的基因定位出来。因为河豚与人类拥有相同的基因,同时也拥有和人类相同的调控序列,但是“垃圾”基因比人类更少。如此较为简洁的DNA序列,使得调控基因的位置较容易定位[8]。

其他DNA

编辑

蛋白质编码序列(也就是外显子)在人类基因组中少于1.5%[1]。在基因与调控序列之外,仍然有许多功能未知的广大区域。科学家估计这些区域在人类基因组中约占有97%,其中许多是属于重复序列(重复序列)、转位子(transposon)与伪基因(pseudogene)。除此之外,还有大量序列不属于上述的已知分类。

这些序列大多数可能是演化的产物,现在已经没有作用,也因此有时会被称作是“垃圾DNA”(junk DNA)[9]。不过有一些迹象显示,这些序列可能会经由某些仍然未知的方式产生作用。最近一些使用微阵列技术所作的实验发现,大量非基因DNA事实上会被转录成为RNA[10],这显示转录作用背后可能还存在一些未知的机制。此外,不同种类的哺乳动物在演化的过程中共同保留了这些序列,也显示基因组中还有很多作用未知的部分[11]。人类基因组内大量功能未知的序列,是目前科学研究的重点之一。

咒语四字词语有哪些成语
爱眼不闪屏 AOCP2791V/BW特价1150元