<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="zh-Hans-CN">
	<id>https://www.yiliao.com/index.php?action=history&amp;feed=atom&amp;title=RefSeq</id>
	<title>RefSeq - 版本历史</title>
	<link rel="self" type="application/atom+xml" href="https://www.yiliao.com/index.php?action=history&amp;feed=atom&amp;title=RefSeq"/>
	<link rel="alternate" type="text/html" href="https://www.yiliao.com/index.php?title=RefSeq&amp;action=history"/>
	<updated>2026-04-18T10:01:51Z</updated>
	<subtitle>本wiki的该页面的版本历史</subtitle>
	<generator>MediaWiki 1.35.1</generator>
	<entry>
		<id>https://www.yiliao.com/index.php?title=RefSeq&amp;diff=310453&amp;oldid=prev</id>
		<title>77921020：建立内容为“{{Infobox | bodystyle    = width: 300px; float: right; clear: right; margin: 0 0 1em 1em; border: 1px solid #a2a9b1; background: #f9f9f9; | abovestyle   = backgro…”的新页面</title>
		<link rel="alternate" type="text/html" href="https://www.yiliao.com/index.php?title=RefSeq&amp;diff=310453&amp;oldid=prev"/>
		<updated>2025-12-23T09:52:56Z</updated>

		<summary type="html">&lt;p&gt;建立内容为“{{Infobox | bodystyle    = width: 300px; float: right; clear: right; margin: 0 0 1em 1em; border: 1px solid #a2a9b1; background: #f9f9f9; | abovestyle   = backgro…”的新页面&lt;/p&gt;
&lt;p&gt;&lt;b&gt;新页面&lt;/b&gt;&lt;/p&gt;&lt;div&gt;{{Infobox&lt;br /&gt;
| bodystyle    = width: 300px; float: right; clear: right; margin: 0 0 1em 1em; border: 1px solid #a2a9b1; background: #f9f9f9;&lt;br /&gt;
| abovestyle   = background: #e0e0e0; font-size: 110%; font-weight: bold; text-align: center;&lt;br /&gt;
| headerstyle  = background: #eeeeee; font-weight: bold;&lt;br /&gt;
&lt;br /&gt;
| above        = 参考序列数据库&amp;lt;br&amp;gt;&amp;lt;small&amp;gt;RefSeq&amp;lt;/small&amp;gt;&lt;br /&gt;
| image        = &lt;br /&gt;
&lt;br /&gt;
| label1       = 全称&lt;br /&gt;
| data1        = NCBI Reference Sequence Database&lt;br /&gt;
&lt;br /&gt;
| label2       = 维护机构&lt;br /&gt;
| data2        = [[NCBI]]&lt;br /&gt;
&lt;br /&gt;
| label3       = 核心特征&lt;br /&gt;
| data3        = '''非冗余''' (Non-redundant)、&amp;lt;br&amp;gt;经过人工审编 (Curated)&lt;br /&gt;
&lt;br /&gt;
| label4       = 核心用途&lt;br /&gt;
| data4        = 基因组注释、变异检测标准、&amp;lt;br&amp;gt;引物设计&lt;br /&gt;
&lt;br /&gt;
| label5       = 典型前缀&lt;br /&gt;
| data5        = NM_ (mRNA), NP_ (蛋白),&amp;lt;br&amp;gt;NG_ (基因组)&lt;br /&gt;
&lt;br /&gt;
| label6       = 对AI价值&lt;br /&gt;
| data6        = 标准化的训练基准 (Ground Truth)&lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
'''RefSeq'''（Reference Sequence Database），即'''NCBI 参考序列数据库'''，是一个由美国国家生物技术信息中心（[[NCBI]]）维护的公开数据库。它提供了一套全面的、整合的、经过注释的非冗余序列集合，涵盖了 DNA、RNA 和蛋白质。&lt;br /&gt;
&lt;br /&gt;
在生物医学界，RefSeq 被视为“金标准”。当您的“基因医生”系统告诉患者“您的 P53 基因发生了突变”时，潜台词实际上是：“您的 P53 基因序列与 RefSeq 中的标准序列（如 `NM_000546`）不一致”。&amp;lt;ref name=&amp;quot;RefSeq_Paper&amp;quot; /&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== 核心前缀体系 (AI必须识别的编码) ==&lt;br /&gt;
RefSeq 使用独特的前缀系统来区分不同的分子类型。您的 AI 数据清洗脚本必须能够精准识别这些 ID：&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
! 前缀 !! 分子类型 !! 含义 !! 您的业务场景&lt;br /&gt;
|-&lt;br /&gt;
| '''NM_''' || mRNA || 经过实验验证的转录本 || '''最核心'''。临床报告中描述 cDNA 突变（如 c.524G&amp;gt;A）必须基于 NM 编号。&lt;br /&gt;
|-&lt;br /&gt;
| '''NP_''' || 蛋白质 || 对应的蛋白序列 || 用于描述氨基酸层面的改变（如 p.R175H）。&lt;br /&gt;
|-&lt;br /&gt;
| '''NG_''' || 基因组 || 基因组区域 || 用于描述跨越内含子的大片段缺失或扩增（CNV）。&lt;br /&gt;
|-&lt;br /&gt;
| '''XM_ / XP_''' || mRNA/蛋白 || 模型预测 (未验证) || '''慎用'''。这些是计算机算出来的，未经人工确认，临床准确度较低。&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
== RefSeq 与 GenBank 的区别 ==&lt;br /&gt;
这是构建数据库时的核心架构问题：&lt;br /&gt;
&lt;br /&gt;
* '''GenBank (存档库)'''：&lt;br /&gt;
** '''多余性'''：如果有 100 个实验室测了同一个胰腺癌基因，GenBank 里就会有 100 条记录（良莠不齐）。&lt;br /&gt;
** '''所有权'''：记录属于提交者，NCBI 无权修改错误，只能等作者改。&lt;br /&gt;
&lt;br /&gt;
* '''RefSeq (标准库)'''：&lt;br /&gt;
** '''非冗余'''：NCBI 专家从那 100 条里挑出（或合成）最好的一条，作为“标准答案”。&lt;br /&gt;
** '''所有权'''：归 NCBI 所有，专家会根据最新科研进展实时修正注释。&lt;br /&gt;
** ''结论''：您的 AI 训练集输入可以包含 GenBank 以增加多样性，但'''输出标准（Ground Truth）必须是 RefSeq'''。&lt;br /&gt;
&lt;br /&gt;
== MANE 项目 (临床新标准) ==&lt;br /&gt;
对于您的“智慧医生”项目，这是一个非常高端的知识点。&lt;br /&gt;
* '''问题'''：过去，美国的 NCBI (RefSeq) 和欧洲的 EBI (Ensembl) 对同一个基因的定义有时不一样（比如外显子长度不同），导致跨国临床数据打架。&lt;br /&gt;
* '''解决方案'''：'''MANE''' (Matched Annotation from NCBI and EMBL-EBI)。这是一套美欧统一的“超级标准”。&lt;br /&gt;
* '''建议'''：在您的临床报告中，优先引用 '''MANE Select''' 转录本，这是目前国际遗传学界推荐的最佳实践。&lt;br /&gt;
&lt;br /&gt;
== 对 AI 药物研发的价值 ==&lt;br /&gt;
* '''靶点确认'''：在设计针对特定蛋白（如 KRAS G12D）的药物时，必须依据 RefSeq 的 `NP_` 序列来构建蛋白质三维结构模型（AlphaFold 通常也是基于参考序列预测）。&lt;br /&gt;
* '''脱靶分析'''：使用 [[BLAST]] 将药物设计的序列（如 siRNA）与 RefSeq 全库比对，以确保它不会意外结合到其他重要的正常基因上。&lt;br /&gt;
&lt;br /&gt;
== 参见 ==&lt;br /&gt;
* [[GenBank]]&lt;br /&gt;
* [[NCBI]]&lt;br /&gt;
* [[BLAST]]&lt;br /&gt;
* [[ClinVar]] - 变异必须基于RefSeq描述&lt;br /&gt;
* [[人类基因组计划]]&lt;br /&gt;
&lt;br /&gt;
== 参考资料 ==&lt;br /&gt;
&amp;lt;references&amp;gt;&lt;br /&gt;
&amp;lt;ref name=&amp;quot;RefSeq_Paper&amp;quot;&amp;gt;O'Leary, N. A., et al. (2016). Reference sequence (RefSeq) database at NCBI: current status, taxonomic expansion, and functional annotation. ''Nucleic Acids Research'', 44(D1), D733-D745. [https://academic.oup.com/nar/article/44/D1/D733/2502662]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&amp;lt;/references&amp;gt;&lt;br /&gt;
&lt;br /&gt;
[[Category:生物信息学]]&lt;br /&gt;
[[Category:在线数据库]]&lt;br /&gt;
[[Category:基因组学]]&lt;/div&gt;</summary>
		<author><name>77921020</name></author>
	</entry>
</feed>