<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="zh-Hans-CN">
	<id>https://www.yiliao.com/index.php?action=history&amp;feed=atom&amp;title=GENCODE%E9%A1%B9%E7%9B%AE</id>
	<title>GENCODE项目 - 版本历史</title>
	<link rel="self" type="application/atom+xml" href="https://www.yiliao.com/index.php?action=history&amp;feed=atom&amp;title=GENCODE%E9%A1%B9%E7%9B%AE"/>
	<link rel="alternate" type="text/html" href="https://www.yiliao.com/index.php?title=GENCODE%E9%A1%B9%E7%9B%AE&amp;action=history"/>
	<updated>2026-04-21T18:03:08Z</updated>
	<subtitle>本wiki的该页面的版本历史</subtitle>
	<generator>MediaWiki 1.35.1</generator>
	<entry>
		<id>https://www.yiliao.com/index.php?title=GENCODE%E9%A1%B9%E7%9B%AE&amp;diff=317067&amp;oldid=prev</id>
		<title>185.180.13.102：建立内容为“&lt;div style=&quot;padding: 0 4%; line-height: 1.8; color: #1e293b; font-family: 'Helvetica Neue', Helvetica, 'PingFang SC', Arial, sans-serif; background-color: #ffffff…”的新页面</title>
		<link rel="alternate" type="text/html" href="https://www.yiliao.com/index.php?title=GENCODE%E9%A1%B9%E7%9B%AE&amp;diff=317067&amp;oldid=prev"/>
		<updated>2026-03-06T06:05:38Z</updated>

		<summary type="html">&lt;p&gt;建立内容为“&amp;lt;div style=&amp;quot;padding: 0 4%; line-height: 1.8; color: #1e293b; font-family: &amp;#039;Helvetica Neue&amp;#039;, Helvetica, &amp;#039;PingFang SC&amp;#039;, Arial, sans-serif; background-color: #ffffff…”的新页面&lt;/p&gt;
&lt;p&gt;&lt;b&gt;新页面&lt;/b&gt;&lt;/p&gt;&lt;div&gt;&amp;lt;div style=&amp;quot;padding: 0 4%; line-height: 1.8; color: #1e293b; font-family: 'Helvetica Neue', Helvetica, 'PingFang SC', Arial, sans-serif; background-color: #ffffff; max-width: 1200px; margin: auto;&amp;quot;&amp;gt;&lt;br /&gt;
&lt;br /&gt;
    &amp;lt;div style=&amp;quot;margin-bottom: 30px; border-bottom: 1.2px solid #e2e8f0; padding-bottom: 25px;&amp;quot;&amp;gt;&lt;br /&gt;
        &amp;lt;p style=&amp;quot;font-size: 1.1em; margin: 10px 0; color: #334155; text-align: justify;&amp;quot;&amp;gt;&lt;br /&gt;
            &amp;lt;strong&amp;gt;[[GENCODE项目]]&amp;lt;/strong&amp;gt;（GENCODE Project），是全球 &amp;lt;strong&amp;gt;[[基因组学]]&amp;lt;/strong&amp;gt; 与 &amp;lt;strong&amp;gt;[[生物信息学]]&amp;lt;/strong&amp;gt; 领域中最权威的人类与小鼠基因组注释工程。最初作为 &amp;lt;strong&amp;gt;[[ENCODE计划|ENCODE（DNA元件百科全书）]]&amp;lt;/strong&amp;gt; 的一个核心子项目启动，其终极科学目标是极其详尽、高精度地识别并绘制出 &amp;lt;strong&amp;gt;[[人类参考基因组]]&amp;lt;/strong&amp;gt; 上所有的 &amp;lt;strong&amp;gt;[[蛋白质|蛋白编码基因]]&amp;lt;/strong&amp;gt;、&amp;lt;strong&amp;gt;[[假基因]]&amp;lt;/strong&amp;gt;（Pseudogenes）以及 &amp;lt;strong&amp;gt;[[非编码RNA]]&amp;lt;/strong&amp;gt;（特别是 &amp;lt;strong&amp;gt;[[长链非编码RNA|lncRNA]]&amp;lt;/strong&amp;gt;）的物理坐标与转录本结构。 与仅仅依赖计算机算法预测的数据库不同，GENCODE 的核心优势在于它完美融合了 &amp;lt;strong&amp;gt;[[Ensembl数据库|Ensembl]]&amp;lt;/strong&amp;gt; 的高通量自动化计算管道与 HAVANA 团队的逐基因 &amp;lt;strong&amp;gt;[[人工审阅|人工审阅（Manual Curation）]]&amp;lt;/strong&amp;gt;，从而达到了极高的生物学准确率。在现代 &amp;lt;strong&amp;gt;[[精准医疗]]&amp;lt;/strong&amp;gt; 和 &amp;lt;strong&amp;gt;[[下一代测序|NGS]]&amp;lt;/strong&amp;gt; 数据分析中，GENCODE 发布的 &amp;lt;strong&amp;gt;[[GTF格式|GTF / GFF3 注释文件]]&amp;lt;/strong&amp;gt; 已成为全球公认的“黄金标准坐标系”。无论是 &amp;lt;strong&amp;gt;[[TCGA|TCGA（癌症基因组图谱）]]&amp;lt;/strong&amp;gt; 的宏大队列分析，还是 &amp;lt;strong&amp;gt;[[10x Genomics]]&amp;lt;/strong&amp;gt; 平台的 &amp;lt;strong&amp;gt;[[单细胞测序]]&amp;lt;/strong&amp;gt; 标准管线（Cell Ranger），亦或是临床 &amp;lt;strong&amp;gt;[[全外显子测序|WES]]&amp;lt;/strong&amp;gt; 的致病突变筛查，都绝对依赖于 GENCODE 提供的底层基因字典来进行 &amp;lt;strong&amp;gt;[[序列比对|Mapping]]&amp;lt;/strong&amp;gt; 与定量。&lt;br /&gt;
        &amp;lt;/p&amp;gt;&lt;br /&gt;
    &amp;lt;/div&amp;gt;&lt;br /&gt;
&lt;br /&gt;
    &amp;lt;div class=&amp;quot;medical-infobox mw-collapsible mw-collapsed&amp;quot; style=&amp;quot;width: 320px; border: 1.2px solid #bae6fd; border-radius: 12px; background-color: #ffffff; box-shadow: 0 8px 20px rgba(0,0,0,0.05); overflow: hidden; float: right; margin-left: 20px; margin-bottom: 20px;&amp;quot;&amp;gt;&lt;br /&gt;
        &lt;br /&gt;
        &amp;lt;div style=&amp;quot;padding: 15px; color: #1e40af; background: linear-gradient(135deg, #e0f2fe 0%, #bae6fd 100%); text-align: center; cursor: pointer;&amp;quot;&amp;gt;&lt;br /&gt;
            &amp;lt;div style=&amp;quot;font-size: 1.2em; font-weight: bold; letter-spacing: 1px;&amp;quot;&amp;gt;GENCODE&amp;lt;/div&amp;gt;&lt;br /&gt;
            &amp;lt;div style=&amp;quot;font-size: 0.75em; opacity: 0.85; margin-top: 4px;&amp;quot;&amp;gt;Reference Genome Annotation (点击展开)&amp;lt;/div&amp;gt;&lt;br /&gt;
        &amp;lt;/div&amp;gt;&lt;br /&gt;
        &lt;br /&gt;
        &amp;lt;div class=&amp;quot;mw-collapsible-content&amp;quot;&amp;gt;&lt;br /&gt;
            &amp;lt;div style=&amp;quot;padding: 20px; text-align: center; background-color: #f8fafc;&amp;quot;&amp;gt;&lt;br /&gt;
                &amp;lt;div style=&amp;quot;display: inline-block; background: #ffffff; border: 1px solid #e2e8f0; border-radius: 8px; padding: 15px; box-shadow: 0 4px 10px rgba(0,0,0,0.04); margin: 5px;&amp;quot;&amp;gt;&lt;br /&gt;
                    &amp;lt;div style=&amp;quot;width: 120px; height: 120px; background: #f1f5f9; border-radius: 4px; display: flex; align-items: center; justify-content: center; overflow: hidden; padding: 15px;&amp;quot;&amp;gt;&lt;br /&gt;
                        &lt;br /&gt;
                    &amp;lt;/div&amp;gt;&lt;br /&gt;
                &amp;lt;/div&amp;gt;&lt;br /&gt;
                &amp;lt;div style=&amp;quot;font-size: 0.8em; color: #64748b; margin-top: 10px; font-weight: 600;&amp;quot;&amp;gt;基因组浏览器上的转录本与外显子轨道&amp;lt;/div&amp;gt;&lt;br /&gt;
            &amp;lt;/div&amp;gt;&lt;br /&gt;
&lt;br /&gt;
            &amp;lt;table style=&amp;quot;width: 100%; border-spacing: 0; border-collapse: collapse; font-size: 0.82em;&amp;quot;&amp;gt;&lt;br /&gt;
                &amp;lt;tr&amp;gt;&lt;br /&gt;
                    &amp;lt;th style=&amp;quot;text-align: left; padding: 8px 12px; background-color: #f1f5f9; color: #475569; border-bottom: 1px solid #e2e8f0; width: 42%;&amp;quot;&amp;gt;所属上游计划&amp;lt;/th&amp;gt;&lt;br /&gt;
                    &amp;lt;td style=&amp;quot;padding: 8px 12px; border-bottom: 1px solid #e2e8f0; color: #1e40af;&amp;quot;&amp;gt;&amp;lt;strong&amp;gt;[[ENCODE计划|ENCODE]]&amp;lt;/strong&amp;gt;&amp;lt;/td&amp;gt;&lt;br /&gt;
                &amp;lt;/tr&amp;gt;&lt;br /&gt;
                &amp;lt;tr&amp;gt;&lt;br /&gt;
                    &amp;lt;th style=&amp;quot;text-align: left; padding: 8px 12px; background-color: #f1f5f9; color: #475569; border-bottom: 1px solid #e2e8f0;&amp;quot;&amp;gt;覆盖核心物种&amp;lt;/th&amp;gt;&lt;br /&gt;
                    &amp;lt;td style=&amp;quot;padding: 8px 12px; border-bottom: 1px solid #e2e8f0; color: #b91c1c;&amp;quot;&amp;gt;&amp;lt;strong&amp;gt;[[智人|人类 (Human)]]&amp;lt;/strong&amp;gt;, 小鼠 (Mouse)&amp;lt;/td&amp;gt;&lt;br /&gt;
                &amp;lt;/tr&amp;gt;&lt;br /&gt;
                &amp;lt;tr&amp;gt;&lt;br /&gt;
                    &amp;lt;th style=&amp;quot;text-align: left; padding: 8px 12px; background-color: #f1f5f9; color: #475569; border-bottom: 1px solid #e2e8f0;&amp;quot;&amp;gt;核心数据格式&amp;lt;/th&amp;gt;&lt;br /&gt;
                    &amp;lt;td style=&amp;quot;padding: 8px 12px; border-bottom: 1px solid #e2e8f0; color: #0f172a;&amp;quot;&amp;gt;&amp;lt;strong&amp;gt;[[GTF格式|GTF]]&amp;lt;/strong&amp;gt;, &amp;lt;strong&amp;gt;[[GFF3格式|GFF3]]&amp;lt;/strong&amp;gt;, &amp;lt;strong&amp;gt;[[FASTA格式|FASTA]]&amp;lt;/strong&amp;gt;&amp;lt;/td&amp;gt;&lt;br /&gt;
                &amp;lt;/tr&amp;gt;&lt;br /&gt;
                &amp;lt;tr&amp;gt;&lt;br /&gt;
                    &amp;lt;th style=&amp;quot;text-align: left; padding: 8px 12px; background-color: #f1f5f9; color: #475569; border-bottom: 1px solid #e2e8f0;&amp;quot;&amp;gt;构建方法论&amp;lt;/th&amp;gt;&lt;br /&gt;
                    &amp;lt;td style=&amp;quot;padding: 8px 12px; border-bottom: 1px solid #e2e8f0; color: #0f172a;&amp;quot;&amp;gt;算法预测 + &amp;lt;strong&amp;gt;[[人工审阅|HAVANA 手工精校]]&amp;lt;/strong&amp;gt;&amp;lt;/td&amp;gt;&lt;br /&gt;
                &amp;lt;/tr&amp;gt;&lt;br /&gt;
                &amp;lt;tr&amp;gt;&lt;br /&gt;
                    &amp;lt;th style=&amp;quot;text-align: left; padding: 8px 12px; background-color: #f1f5f9; color: #475569; border-bottom: 1px solid #e2e8f0;&amp;quot;&amp;gt;基因组版本绑定&amp;lt;/th&amp;gt;&lt;br /&gt;
                    &amp;lt;td style=&amp;quot;padding: 8px 12px; border-bottom: 1px solid #e2e8f0; color: #0f172a;&amp;quot;&amp;gt;强绑定 (如 &amp;lt;strong&amp;gt;[[GRCh38]]&amp;lt;/strong&amp;gt; / hg38)&amp;lt;/td&amp;gt;&lt;br /&gt;
                &amp;lt;/tr&amp;gt;&lt;br /&gt;
                &amp;lt;tr&amp;gt;&lt;br /&gt;
                    &amp;lt;th style=&amp;quot;text-align: left; padding: 8px 12px; background-color: #f1f5f9; color: #475569; border-bottom: 1px solid #e2e8f0;&amp;quot;&amp;gt;前沿注释重点&amp;lt;/th&amp;gt;&lt;br /&gt;
                    &amp;lt;td style=&amp;quot;padding: 8px 12px; border-bottom: 1px solid #e2e8f0; color: #0f172a;&amp;quot;&amp;gt;&amp;lt;strong&amp;gt;[[可变剪接]]&amp;lt;/strong&amp;gt;, &amp;lt;strong&amp;gt;[[长链非编码RNA|lncRNA]]&amp;lt;/strong&amp;gt;&amp;lt;/td&amp;gt;&lt;br /&gt;
                &amp;lt;/tr&amp;gt;&lt;br /&gt;
                &amp;lt;tr&amp;gt;&lt;br /&gt;
                    &amp;lt;th style=&amp;quot;text-align: left; padding: 8px 12px; background-color: #f1f5f9; color: #475569;&amp;quot;&amp;gt;下游工业标准&amp;lt;/th&amp;gt;&lt;br /&gt;
                    &amp;lt;td style=&amp;quot;padding: 8px 12px; color: #166534;&amp;quot;&amp;gt;&amp;lt;strong&amp;gt;[[RNA-Seq]]&amp;lt;/strong&amp;gt; 定量, &amp;lt;strong&amp;gt;[[单细胞测序]]&amp;lt;/strong&amp;gt;&amp;lt;/td&amp;gt;&lt;br /&gt;
                &amp;lt;/tr&amp;gt;&lt;br /&gt;
            &amp;lt;/table&amp;gt;&lt;br /&gt;
        &amp;lt;/div&amp;gt;&lt;br /&gt;
    &amp;lt;/div&amp;gt;&lt;br /&gt;
&lt;br /&gt;
    &amp;lt;h2 style=&amp;quot;background: #f1f5f9; color: #0f172a; padding: 10px 18px; border-radius: 0 6px 6px 0; font-size: 1.25em; margin-top: 40px; border-left: 6px solid #0f172a; font-weight: bold;&amp;quot;&amp;gt;注释方法论：算法与人脑的终极协作&amp;lt;/h2&amp;gt;&lt;br /&gt;
&lt;br /&gt;
    &amp;lt;p style=&amp;quot;margin: 15px 0; text-align: justify;&amp;quot;&amp;gt;&lt;br /&gt;
        基因组测序只提供了“字母”，而 GENCODE 提供的是“字典”。为了在茫茫 30 亿个碱基中精确划定每一个基因的边界，GENCODE 采用了极具特色的双轨制合并策略：&lt;br /&gt;
    &amp;lt;/p&amp;gt;&lt;br /&gt;
&lt;br /&gt;
    &amp;lt;ul style=&amp;quot;padding-left: 25px; color: #334155;&amp;quot;&amp;gt;&lt;br /&gt;
        &amp;lt;li style=&amp;quot;margin-bottom: 12px;&amp;quot;&amp;gt;&amp;lt;strong&amp;gt;Ensembl 自动化管线 (Computational Prediction)：&amp;lt;/strong&amp;gt; 依托 &amp;lt;strong&amp;gt;[[欧洲生物信息研究所|EMBL-EBI]]&amp;lt;/strong&amp;gt; 强大的算力，自动化系统会将海量的 &amp;lt;strong&amp;gt;[[cDNA]]&amp;lt;/strong&amp;gt;、&amp;lt;strong&amp;gt;[[表达序列标签|EST（表达序列标签）]]&amp;lt;/strong&amp;gt; 以及跨物种保守序列（同源比对）大规模映射到人类参考基因组上。这种方法速度极快，能够迅速建立起蛋白质编码基因的基本骨架。&amp;lt;/li&amp;gt;&lt;br /&gt;
        &amp;lt;li style=&amp;quot;margin-bottom: 12px;&amp;quot;&amp;gt;&amp;lt;strong&amp;gt;HAVANA 团队的人工精校 (Manual Curation)：&amp;lt;/strong&amp;gt; 这是 GENCODE 真正拉开与其他数据库差距的核心壁垒。专家级注释员会借助高精度的基因组浏览器，仔细审阅那些自动化算法容易出错的复杂区域。他们不仅能精准修正 &amp;lt;strong&amp;gt;[[外显子]]&amp;lt;/strong&amp;gt; 的边界、识别复杂的 &amp;lt;strong&amp;gt;[[可变剪接|可变剪接（Alternative Splicing）]]&amp;lt;/strong&amp;gt; 事件，还能敏锐地揪出那些隐藏的 &amp;lt;strong&amp;gt;[[假基因]]&amp;lt;/strong&amp;gt;（曾经是基因但因突变而失去功能的“化石序列”）。&amp;lt;/li&amp;gt;&lt;br /&gt;
        &amp;lt;li style=&amp;quot;margin-bottom: 12px;&amp;quot;&amp;gt;&amp;lt;strong&amp;gt;GENCODE 数据集的合并：&amp;lt;/strong&amp;gt; 最终发布的 GENCODE 基因集，是将上述两者的结果进行无缝合并。其中，经过人工审阅确认的转录本会被打上最高置信度标签，为后续的医学诊断提供最坚实、最可靠的基础支撑。&amp;lt;/li&amp;gt;&lt;br /&gt;
    &amp;lt;/ul&amp;gt;&lt;br /&gt;
&lt;br /&gt;
    &amp;lt;h2 style=&amp;quot;background: #fff1f2; color: #9f1239; padding: 10px 18px; border-radius: 0 6px 6px 0; font-size: 1.25em; margin-top: 40px; border-left: #9f1239 6px solid; font-weight: bold;&amp;quot;&amp;gt;生信与临床映射：决定测序数据的“生死判决”&amp;lt;/h2&amp;gt;&lt;br /&gt;
    &lt;br /&gt;
    &amp;lt;div style=&amp;quot;overflow-x: auto; margin: 30px auto; max-width: 90%;&amp;quot;&amp;gt;&lt;br /&gt;
        &amp;lt;table style=&amp;quot;width: 100%; border-collapse: collapse; border: 1.2px solid #cbd5e1; font-size: 0.85em; text-align: center;&amp;quot;&amp;gt;&lt;br /&gt;
            &amp;lt;tr style=&amp;quot;background-color: #eff6ff; color: #1e40af;&amp;quot;&amp;gt;&lt;br /&gt;
                &amp;lt;th style=&amp;quot;padding: 12px; border: 1px solid #cbd5e1; width: 22%;&amp;quot;&amp;gt;临床分析管线&amp;lt;/th&amp;gt;&lt;br /&gt;
                &amp;lt;th style=&amp;quot;padding: 12px; border: 1px solid #cbd5e1; width: 38%;&amp;quot;&amp;gt;GENCODE 文件的核心赋能作用&amp;lt;/th&amp;gt;&lt;br /&gt;
                &amp;lt;th style=&amp;quot;padding: 12px; border: 1px solid #cbd5e1; width: 40%;&amp;quot;&amp;gt;指导的诊断与转化意义&amp;lt;/th&amp;gt;&lt;br /&gt;
            &amp;lt;/tr&amp;gt;&lt;br /&gt;
            &amp;lt;tr&amp;gt;&lt;br /&gt;
                &amp;lt;td style=&amp;quot;padding: 10px; border: 1px solid #cbd5e1; font-weight: 600;&amp;quot;&amp;gt;&amp;lt;strong&amp;gt;转录组与单细胞分析&amp;lt;/strong&amp;gt;&amp;lt;br&amp;gt;&amp;lt;span style=&amp;quot;font-size: 0.9em; color: #64748b;&amp;quot;&amp;gt;(scRNA-Seq / Bulk RNA)&amp;lt;/span&amp;gt;&amp;lt;/td&amp;gt;&lt;br /&gt;
                &amp;lt;td style=&amp;quot;padding: 10px; border: 1px solid #cbd5e1; text-align: left;&amp;quot;&amp;gt;计数算法（如 Cell Ranger 或 HTSeq）必须读取 GENCODE 的 &amp;lt;strong&amp;gt;[[GTF格式|GTF 文件]]&amp;lt;/strong&amp;gt;，才能知道某条测序碎片究竟是属于 &amp;lt;strong&amp;gt;[[免疫细胞]]&amp;lt;/strong&amp;gt; 的标记基因，还是非编码区的噪音。没有它，测序数据只是一堆无法解释的物理坐标。&amp;lt;/td&amp;gt;&lt;br /&gt;
                &amp;lt;td style=&amp;quot;padding: 10px; border: 1px solid #cbd5e1; background-color: #f0fdf4;&amp;quot;&amp;gt;生成 &amp;lt;strong&amp;gt;[[基因表达矩阵|单细胞基因表达矩阵]]&amp;lt;/strong&amp;gt; 的绝对源头，用于解析 &amp;lt;strong&amp;gt;[[肿瘤微环境]]&amp;lt;/strong&amp;gt; 或发现全新的细胞亚群。&amp;lt;/td&amp;gt;&lt;br /&gt;
            &amp;lt;/tr&amp;gt;&lt;br /&gt;
            &amp;lt;tr&amp;gt;&lt;br /&gt;
                &amp;lt;td style=&amp;quot;padding: 10px; border: 1px solid #cbd5e1; font-weight: 600;&amp;quot;&amp;gt;&amp;lt;strong&amp;gt;临床突变致病性注释&amp;lt;/strong&amp;gt;&amp;lt;br&amp;gt;&amp;lt;span style=&amp;quot;font-size: 0.9em; color: #64748b;&amp;quot;&amp;gt;(Variant Effect Predictor)&amp;lt;/span&amp;gt;&amp;lt;/td&amp;gt;&lt;br /&gt;
                &amp;lt;td style=&amp;quot;padding: 10px; border: 1px solid #cbd5e1; text-align: left;&amp;quot;&amp;gt;在肿瘤 &amp;lt;strong&amp;gt;[[靶向治疗]]&amp;lt;/strong&amp;gt; 基因检测中，当发现了一个 &amp;lt;strong&amp;gt;[[点突变]]&amp;lt;/strong&amp;gt;，注释系统（如 Ensembl VEP）会立刻查询 GENCODE 数据库：这个突变是否落在 &amp;lt;strong&amp;gt;[[CDS区]]&amp;lt;/strong&amp;gt;？是否改变了 &amp;lt;strong&amp;gt;[[起止密码子]]&amp;lt;/strong&amp;gt; 导致翻译提前终止？&amp;lt;/td&amp;gt;&lt;br /&gt;
                &amp;lt;td style=&amp;quot;padding: 10px; border: 1px solid #cbd5e1; background-color: #eff6ff;&amp;quot;&amp;gt;直接决定了该突变是被归类为良性多态性，还是导致癌症发生的 &amp;lt;strong&amp;gt;[[致病突变|驱动突变 (Driver Mutation)]]&amp;lt;/strong&amp;gt;。&amp;lt;/td&amp;gt;&lt;br /&gt;
            &amp;lt;/tr&amp;gt;&lt;br /&gt;
            &amp;lt;tr&amp;gt;&lt;br /&gt;
                &amp;lt;td style=&amp;quot;padding: 10px; border: 1px solid #cbd5e1; font-weight: 600;&amp;quot;&amp;gt;&amp;lt;strong&amp;gt;长链非编码 RNA 挖掘&amp;lt;/strong&amp;gt;&amp;lt;br&amp;gt;&amp;lt;span style=&amp;quot;font-size: 0.9em; color: #64748b;&amp;quot;&amp;gt;(lncRNA Discovery)&amp;lt;/span&amp;gt;&amp;lt;/td&amp;gt;&lt;br /&gt;
                &amp;lt;td style=&amp;quot;padding: 10px; border: 1px solid #cbd5e1; text-align: left;&amp;quot;&amp;gt;GENCODE 是全球收录 &amp;lt;strong&amp;gt;[[长链非编码RNA|lncRNA]]&amp;lt;/strong&amp;gt; 最全、最准确的图谱库。它详细记录了这些曾经被认为是“暗物质”的调控型 RNA 的复杂外显子结构和组织特异性表达谱。&amp;lt;/td&amp;gt;&lt;br /&gt;
                &amp;lt;td style=&amp;quot;padding: 10px; border: 1px solid #cbd5e1; background-color: #f8fafc;&amp;quot;&amp;gt;帮助制药界挖掘新型肿瘤 &amp;lt;strong&amp;gt;[[生物标志物]]&amp;lt;/strong&amp;gt;（如前列腺癌中的 &amp;lt;strong&amp;gt;[[PCA3]]&amp;lt;/strong&amp;gt;）或表观遗传学药物靶点。&amp;lt;/td&amp;gt;&lt;br /&gt;
            &amp;lt;/tr&amp;gt;&lt;br /&gt;
        &amp;lt;/table&amp;gt;&lt;br /&gt;
    &amp;lt;/div&amp;gt;&lt;br /&gt;
&lt;br /&gt;
    &amp;lt;h2 style=&amp;quot;background: #f0fdf4; color: #166534; padding: 10px 18px; border-radius: 0 6px 6px 0; font-size: 1.25em; margin-top: 40px; border-left: #166534 6px solid; font-weight: bold;&amp;quot;&amp;gt;工程学陷阱：版本隔离与数据库的暗战&amp;lt;/h2&amp;gt;&lt;br /&gt;
&lt;br /&gt;
    &amp;lt;div style=&amp;quot;background-color: #f0fdf4; border-left: 5px solid #22c55e; padding: 15px 20px; margin: 20px 0; border-radius: 4px;&amp;quot;&amp;gt;&lt;br /&gt;
        &amp;lt;h3 style=&amp;quot;margin-top: 0; color: #14532d; font-size: 1.1em;&amp;quot;&amp;gt;基因组学中最易犯的“坐标崩塌”致命错误&amp;lt;/h3&amp;gt;&lt;br /&gt;
        &lt;br /&gt;
        &amp;lt;ul style=&amp;quot;margin-bottom: 0; color: #334155; font-size: 0.95em;&amp;quot;&amp;gt;&lt;br /&gt;
            &amp;lt;li&amp;gt;&amp;lt;strong&amp;gt;基因组版本的“硬绑定”：&amp;lt;/strong&amp;gt; GENCODE 发布的所有注释文件都死死绑定于特定的 &amp;lt;strong&amp;gt;[[人类参考基因组]]&amp;lt;/strong&amp;gt; 大版本。例如，GENCODE Release 44 是基于 &amp;lt;strong&amp;gt;[[GRCh38]]&amp;lt;/strong&amp;gt; 的。如果生信工程师在前期使用了 GRCh37 (hg19) 进行序列比对，却在后期定量时混用了 GRCh38 的 GENCODE 注释，所有的坐标都会发生严重的空间错位，导致成千上万个基因的表达量瞬间“归零”。&amp;lt;/li&amp;gt;&lt;br /&gt;
            &amp;lt;li style=&amp;quot;margin-top: 10px;&amp;quot;&amp;gt;&amp;lt;strong&amp;gt;GENCODE vs RefSeq 的命名壁垒：&amp;lt;/strong&amp;gt; 世界上有两套最主流的注释系统。&amp;lt;strong&amp;gt;[[NCBI]]&amp;lt;/strong&amp;gt; 提供的 RefSeq 体系倾向于保守，多收录有明确实验证据的转录本（前缀多为 &amp;lt;code&amp;gt;NM_&amp;lt;/code&amp;gt;）；而 GENCODE 体系极其详尽（前缀为 &amp;lt;code&amp;gt;ENSG&amp;lt;/code&amp;gt;）。这种命名和评判标准的鸿沟，导致不同医院或研究机构出具的报告在进行多队列合并时，必须使用基因转换字典（如 BioMart）进行极其小心的 ID 映射清洗。&amp;lt;/li&amp;gt;&lt;br /&gt;
        &amp;lt;/ul&amp;gt;&lt;br /&gt;
    &amp;lt;/div&amp;gt;&lt;br /&gt;
&lt;br /&gt;
    &amp;lt;h2 style=&amp;quot;background: #f8fafc; color: #334155; padding: 10px 18px; border-radius: 0 6px 6px 0; font-size: 1.25em; margin-top: 40px; border-left: #64748b 6px solid; font-weight: bold;&amp;quot;&amp;gt;核心相关概念&amp;lt;/h2&amp;gt;&lt;br /&gt;
    &amp;lt;ul style=&amp;quot;padding-left: 25px; color: #334155; font-size: 0.95em;&amp;quot;&amp;gt;&lt;br /&gt;
        &amp;lt;li&amp;gt;&amp;lt;strong&amp;gt;[[转录本]] (Transcript)：&amp;lt;/strong&amp;gt; 基因表达的中间产物。在高等真核生物中，一个基因并不是仅仅对应一种蛋白质。通过 &amp;lt;strong&amp;gt;[[可变剪接]]&amp;lt;/strong&amp;gt;，同一个基因片段可以被剪裁拼接出几十种不同的转录本。GENCODE 注释库的一大历史功绩，就是极大丰富了人类对转录本多样性的图谱认知。&amp;lt;/li&amp;gt;&lt;br /&gt;
        &amp;lt;li&amp;gt;&amp;lt;strong&amp;gt;[[假基因]] (Pseudogene)：&amp;lt;/strong&amp;gt; 在漫长的进化长河中，由于积累了大量无义突变或缺失，导致丧失了原来编码蛋白质功能的基因“化石残骸”。由于假基因的序列与其有功能的祖先基因极度相似，如果在测序时不依靠 GENCODE 精准地将其标注并排除，极易在生信比对中引发严重的假阳性结果。&amp;lt;/li&amp;gt;&lt;br /&gt;
        &amp;lt;li&amp;gt;&amp;lt;strong&amp;gt;[[ENCODE计划]] (Encyclopedia of DNA Elements)：&amp;lt;/strong&amp;gt; 人类基因组计划之后的又一宏大国际合作项目。旨在识别出人类基因组中所有的功能性元件，包括启动子、增强子、转录因子结合位点等。GENCODE 最初便是为了给 ENCODE 的其他实验（如 &amp;lt;strong&amp;gt;[[ChIP-Seq]]&amp;lt;/strong&amp;gt; 或 &amp;lt;strong&amp;gt;[[ATAC-Seq]]&amp;lt;/strong&amp;gt;）提供一个基础的参考地图而诞生的。&amp;lt;/li&amp;gt;&lt;br /&gt;
    &amp;lt;/ul&amp;gt;&lt;br /&gt;
&lt;br /&gt;
    &amp;lt;div style=&amp;quot;font-size: 0.92em; line-height: 1.6; color: #1e293b; margin-top: 50px; border-top: 2px solid #0f172a; padding: 15px 25px; background-color: #f8fafc; border-radius: 0 0 10px 10px;&amp;quot;&amp;gt;&lt;br /&gt;
        &amp;lt;span style=&amp;quot;color: #0f172a; font-weight: bold; font-size: 1.05em; display: inline-block; margin-bottom: 15px;&amp;quot;&amp;gt;学术参考文献 [Academic Review]&amp;lt;/span&amp;gt;&lt;br /&gt;
        &lt;br /&gt;
        &amp;lt;p style=&amp;quot;margin: 12px 0; border-bottom: 1px solid #e2e8f0; padding-bottom: 10px;&amp;quot;&amp;gt;&lt;br /&gt;
            [1] &amp;lt;strong&amp;gt;Harrow J, Frankish A, Gonzalez JM, et al. (2012).&amp;lt;/strong&amp;gt; &amp;lt;em&amp;gt;GENCODE: the reference human genome annotation for The ENCODE Project.&amp;lt;/em&amp;gt; &amp;lt;strong&amp;gt;[[Genome Research]]&amp;lt;/strong&amp;gt;. 22(9):1760-1774.&amp;lt;br&amp;gt;&lt;br /&gt;
            &amp;lt;span style=&amp;quot;color: #475569;&amp;quot;&amp;gt;[顶级基石文献]：该文献标志着世界上最权威的人类基因组标准注释集——GENCODE 的正式成型。详细描述了计算预测与 HAVANA 团队大量手工比对（Manual Curation）相结合的底层过程，确立了当今全球生信领域广泛采用的注释标准与质量控制金基准。&amp;lt;/span&amp;gt;&lt;br /&gt;
        &amp;lt;/p&amp;gt;&lt;br /&gt;
&lt;br /&gt;
        &amp;lt;p style=&amp;quot;margin: 12px 0; border-bottom: 1px solid #e2e8f0; padding-bottom: 10px;&amp;quot;&amp;gt;&lt;br /&gt;
            [2] &amp;lt;strong&amp;gt;Frankish A, Diekhans M, Ferreira AM, et al. (2019).&amp;lt;/strong&amp;gt; &amp;lt;em&amp;gt;GENCODE reference annotation for the human and mouse genomes.&amp;lt;/em&amp;gt; &amp;lt;strong&amp;gt;[[Nucleic Acids Research]]&amp;lt;/strong&amp;gt;. 47(D1):D766-D773.&amp;lt;br&amp;gt;&lt;br /&gt;
            &amp;lt;span style=&amp;quot;color: #475569;&amp;quot;&amp;gt;[系统性更新报告]：权威的数据库更新文献。展示了 GENCODE 团队如何在多年间不断吸纳大规模长读长测序（如 PacBio）数据，进一步完善对极难捕捉的可变剪接体以及海量 lncRNA（长链非编码 RNA）的精细化标注。&amp;lt;/span&amp;gt;&lt;br /&gt;
        &amp;lt;/p&amp;gt;&lt;br /&gt;
&lt;br /&gt;
        &amp;lt;p style=&amp;quot;margin: 12px 0; border-bottom: 1px solid #e2e8f0; padding-bottom: 10px;&amp;quot;&amp;gt;&lt;br /&gt;
            [3] &amp;lt;strong&amp;gt;Pei B, Sisu C, Frankish A, et al. (2012).&amp;lt;/strong&amp;gt; &amp;lt;em&amp;gt;The GENCODE pseudogene resource.&amp;lt;/em&amp;gt; &amp;lt;strong&amp;gt;[[Genome Biology]]&amp;lt;/strong&amp;gt;. 13(9):R51.&amp;lt;br&amp;gt;&lt;br /&gt;
            &amp;lt;span style=&amp;quot;color: #475569;&amp;quot;&amp;gt;[假基因专著]：在基因组测序中排除“幽灵干扰”的关键文献。系统性介绍了 GENCODE 团队是如何在大规模人类参考基因组中精确界定和分类上万个假基因的，为提升全外显子组（WES）和转录组分析的准确率扫清了重大障碍。&amp;lt;/span&amp;gt;&lt;br /&gt;
        &amp;lt;/p&amp;gt;&lt;br /&gt;
    &amp;lt;/div&amp;gt;&lt;br /&gt;
&lt;br /&gt;
    &amp;lt;div style=&amp;quot;margin: 40px auto; width: 90%; border: 1px solid #e2e8f0; border-radius: 8px; overflow: hidden; font-family: 'Helvetica Neue', Arial, sans-serif; font-size: 0.9em;&amp;quot;&amp;gt;&lt;br /&gt;
        &amp;lt;div style=&amp;quot;background-color: #eff6ff; color: #1e40af; padding: 8px 15px; font-weight: bold; text-align: center; border-bottom: 1px solid #dbeafe;&amp;quot;&amp;gt;&lt;br /&gt;
            [[GENCODE项目]] · 知识图谱&lt;br /&gt;
        &amp;lt;/div&amp;gt;&lt;br /&gt;
        &amp;lt;table style=&amp;quot;width: 100%; border-collapse: collapse; background-color: #ffffff; text-align: center;&amp;quot;&amp;gt;&lt;br /&gt;
            &amp;lt;tr style=&amp;quot;border-bottom: 1px solid #f1f5f9;&amp;quot;&amp;gt;&lt;br /&gt;
                &amp;lt;td style=&amp;quot;width: 150px; background-color: #f8fafc; color: #334155; font-weight: 600; padding: 10px 12px; vertical-align: middle;&amp;quot;&amp;gt;核心构建策略&amp;lt;/td&amp;gt;&lt;br /&gt;
                &amp;lt;td style=&amp;quot;padding: 10px 15px; color: #334155;&amp;quot;&amp;gt;&amp;lt;strong&amp;gt;[[Ensembl数据库|Ensembl 自动化预测]]&amp;lt;/strong&amp;gt; • &amp;lt;strong&amp;gt;[[人工审阅|HAVANA 手工精校]]&amp;lt;/strong&amp;gt;&amp;lt;/td&amp;gt;&lt;br /&gt;
            &amp;lt;/tr&amp;gt;&lt;br /&gt;
            &amp;lt;tr style=&amp;quot;border-bottom: 1px solid #f1f5f9;&amp;quot;&amp;gt;&lt;br /&gt;
                &amp;lt;td style=&amp;quot;width: 150px; background-color: #f8fafc; color: #334155; font-weight: 600; padding: 10px 12px; vertical-align: middle;&amp;quot;&amp;gt;输出格式与文件&amp;lt;/td&amp;gt;&lt;br /&gt;
                &amp;lt;td style=&amp;quot;padding: 10px 15px; color: #334155;&amp;quot;&amp;gt;&amp;lt;strong&amp;gt;[[GTF格式|GTF / GFF3 注释库]]&amp;lt;/strong&amp;gt; • &amp;lt;strong&amp;gt;[[FASTA格式|转录本/多肽序列库]]&amp;lt;/strong&amp;gt;&amp;lt;/td&amp;gt;&lt;br /&gt;
            &amp;lt;/tr&amp;gt;&lt;br /&gt;
            &amp;lt;tr&amp;gt;&lt;br /&gt;
                &amp;lt;td style=&amp;quot;width: 150px; background-color: #f8fafc; color: #334155; font-weight: 600; padding: 10px 12px; vertical-align: middle;&amp;quot;&amp;gt;覆盖生物学靶点&amp;lt;/td&amp;gt;&lt;br /&gt;
                &amp;lt;td style=&amp;quot;padding: 10px 15px; color: #334155;&amp;quot;&amp;gt;&amp;lt;strong&amp;gt;[[蛋白质|蛋白编码基因]]&amp;lt;/strong&amp;gt; • &amp;lt;strong&amp;gt;[[假基因]]&amp;lt;/strong&amp;gt; • &amp;lt;strong&amp;gt;[[长链非编码RNA|lncRNA]]&amp;lt;/strong&amp;gt;&amp;lt;/td&amp;gt;&lt;br /&gt;
            &amp;lt;/tr&amp;gt;&lt;br /&gt;
        &amp;lt;/table&amp;gt;&lt;br /&gt;
    &amp;lt;/div&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/div&amp;gt;&lt;/div&gt;</summary>
		<author><name>185.180.13.102</name></author>
	</entry>
</feed>