<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="zh-Hans-CN">
	<id>https://www.yiliao.com/index.php?action=history&amp;feed=atom&amp;title=PMC</id>
	<title>PMC - 版本历史</title>
	<link rel="self" type="application/atom+xml" href="https://www.yiliao.com/index.php?action=history&amp;feed=atom&amp;title=PMC"/>
	<link rel="alternate" type="text/html" href="https://www.yiliao.com/index.php?title=PMC&amp;action=history"/>
	<updated>2026-04-18T09:00:25Z</updated>
	<subtitle>本wiki的该页面的版本历史</subtitle>
	<generator>MediaWiki 1.35.1</generator>
	<entry>
		<id>https://www.yiliao.com/index.php?title=PMC&amp;diff=310439&amp;oldid=prev</id>
		<title>2025年12月23日 (二) 09:07 77921020</title>
		<link rel="alternate" type="text/html" href="https://www.yiliao.com/index.php?title=PMC&amp;diff=310439&amp;oldid=prev"/>
		<updated>2025-12-23T09:07:02Z</updated>

		<summary type="html">&lt;p&gt;&lt;/p&gt;
&lt;table class=&quot;diff diff-contentalign-left diff-editfont-monospace&quot; data-mw=&quot;interface&quot;&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;tr class=&quot;diff-title&quot; lang=&quot;zh-Hans-CN&quot;&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;←上一版本&lt;/td&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;2025年12月23日 (二) 09:07的版本&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot; id=&quot;mw-diff-left-l54&quot; &gt;第54行：&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;第54行：&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;== 法律与政策背景 ==&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;== 法律与政策背景 ==&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;PMC 的快速壮大得益于强有力的政策推动：&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;PMC 的快速壮大得益于强有力的政策推动：&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;−&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;* '''NIH 公共获取政策 (2008)'''：美国法律规定，凡是拿了 NIH 经费（纳税人的钱）做出来的研究，必须在发表后的 12 个月内，将最终审稿手稿（Author Manuscript）上传到 PMC。&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;* '''NIH 公共获取政策 (2008)'''：美国法律规定，凡是拿了 NIH 经费（纳税人的钱）做出来的研究，必须在发表后的 12 个月内，将最终审稿手稿（Author Manuscript）上传到 PMC。&lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;&amp;lt;ref name=&amp;quot;NIH_Policy&amp;quot; /&amp;gt;&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;* '''Plan S (欧洲)'''：类似的开放获取计划也在欧洲推行，催生了 PMC 的姊妹站点 '''Europe PMC'''。&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;* '''Plan S (欧洲)'''：类似的开放获取计划也在欧洲推行，催生了 PMC 的姊妹站点 '''Europe PMC'''。&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;/table&gt;</summary>
		<author><name>77921020</name></author>
	</entry>
	<entry>
		<id>https://www.yiliao.com/index.php?title=PMC&amp;diff=310438&amp;oldid=prev</id>
		<title>77921020：建立内容为“{{Infobox | bodystyle    = width: 300px; float: right; clear: right; margin: 0 0 1em 1em; border: 1px solid #a2a9b1; background: #f9f9f9; | abovestyle   = backgro…”的新页面</title>
		<link rel="alternate" type="text/html" href="https://www.yiliao.com/index.php?title=PMC&amp;diff=310438&amp;oldid=prev"/>
		<updated>2025-12-23T09:04:53Z</updated>

		<summary type="html">&lt;p&gt;建立内容为“{{Infobox | bodystyle    = width: 300px; float: right; clear: right; margin: 0 0 1em 1em; border: 1px solid #a2a9b1; background: #f9f9f9; | abovestyle   = backgro…”的新页面&lt;/p&gt;
&lt;p&gt;&lt;b&gt;新页面&lt;/b&gt;&lt;/p&gt;&lt;div&gt;{{Infobox&lt;br /&gt;
| bodystyle    = width: 300px; float: right; clear: right; margin: 0 0 1em 1em; border: 1px solid #a2a9b1; background: #f9f9f9;&lt;br /&gt;
| abovestyle   = background: #e0e0e0; font-size: 110%; font-weight: bold; text-align: center;&lt;br /&gt;
| headerstyle  = background: #eeeeee; font-weight: bold;&lt;br /&gt;
&lt;br /&gt;
| above        = PubMed Central&lt;br /&gt;
| image        = &lt;br /&gt;
&lt;br /&gt;
| label1       = 英文缩写&lt;br /&gt;
| data1        = '''PMC'''&lt;br /&gt;
&lt;br /&gt;
| label2       = 维护机构&lt;br /&gt;
| data2        = [[NIH]] 下属的 NLM&lt;br /&gt;
&lt;br /&gt;
| label3       = 上线时间&lt;br /&gt;
| data3        = 2000年2月&lt;br /&gt;
&lt;br /&gt;
| label4       = 核心特征&lt;br /&gt;
| data4        = '''免费全文''' (Free Full Text)&lt;br /&gt;
&lt;br /&gt;
| label5       = 收录文章数&lt;br /&gt;
| data5        = &amp;gt; 930 万篇 (2024年)&lt;br /&gt;
&lt;br /&gt;
| label6       = 法律依据&lt;br /&gt;
| data6        = NIH 公共获取政策&amp;lt;br&amp;gt;(Public Access Policy)&lt;br /&gt;
&lt;br /&gt;
| label7       = 对AI价值&lt;br /&gt;
| data7        = 医疗[[大模型]]训练的&amp;lt;br&amp;gt;最大全文语料库&lt;br /&gt;
}}&lt;br /&gt;
&lt;br /&gt;
'''PubMed Central'''（简称'''PMC'''），是由美国国家医学图书馆（NLM）运营的一个免费的、永久性的生物医学和生命科学期刊文献数字档案库。&lt;br /&gt;
&lt;br /&gt;
与 [[PubMed]] 不同（PubMed 主要提供摘要），PMC 提供'''全文'''（Full Text）访问。它是全球开放科学（Open Science）运动的里程碑。所有由美国国立卫生研究院（[[NIH]]）资助的研究成果，在发表后必须强制上传至 PMC 供公众免费阅读。&amp;lt;ref name=&amp;quot;PMC_About&amp;quot; /&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== PMC 与 PubMed 的关键区别 ==&lt;br /&gt;
这是初学者最容易混淆的概念，但对于数据工程师至关重要：&lt;br /&gt;
&lt;br /&gt;
* '''PubMed''' = '''搜索引擎'''（类似 Google）。&lt;br /&gt;
** 它包含超过 3600 万条记录，但绝大多数只展示标题和摘要（Abstract）。&lt;br /&gt;
** 如果您想看全文，通常需要点击链接跳转到出版商（如 Nature, Elsevier）的网站，而那里通常有付费墙（Paywall）。&lt;br /&gt;
&lt;br /&gt;
* '''PMC''' = '''数字图书馆'''（类似书架）。&lt;br /&gt;
** 它存储的是文章的物理文件（XML/PDF）。&lt;br /&gt;
** 在 PMC 里的每一篇文章，您都可以直接免费下载全文。&lt;br /&gt;
** ''关系''：PMC 收录的所有文章都能在 PubMed 里搜到，但 PubMed 里搜到的文章只有一部分（约 1/4）存放在 PMC 里。&lt;br /&gt;
&lt;br /&gt;
== 核心数据集：PMC Open Access Subset ==&lt;br /&gt;
对于您的“智慧医生”AI 项目，这是最有价值的部分。&lt;br /&gt;
* '''定义'''：PMC 中有一部分文章不仅免费阅读，还允许'''机器挖掘'''（Text Mining）和二次使用。这就是 '''PMC Open Access Subset'''。&lt;br /&gt;
* '''规模'''：包含数百万篇结构化良好的 XML 格式全文。&lt;br /&gt;
* '''用途'''：这是目前训练医疗垂直大模型（LLM）最核心的全文语料库。&lt;br /&gt;
** ''摘要 vs 全文''：仅训练摘要，AI 只能学会“结果”；训练全文，AI 才能学会“方法”和“逻辑推理”。例如，具体的药物配方、实验步骤、[[不良事件]]的详细描述，通常只存在于全文的“方法”或“讨论”章节中。&lt;br /&gt;
&lt;br /&gt;
== 法律与政策背景 ==&lt;br /&gt;
PMC 的快速壮大得益于强有力的政策推动：&lt;br /&gt;
* '''NIH 公共获取政策 (2008)'''：美国法律规定，凡是拿了 NIH 经费（纳税人的钱）做出来的研究，必须在发表后的 12 个月内，将最终审稿手稿（Author Manuscript）上传到 PMC。&lt;br /&gt;
* '''Plan S (欧洲)'''：类似的开放获取计划也在欧洲推行，催生了 PMC 的姊妹站点 '''Europe PMC'''。&lt;br /&gt;
&lt;br /&gt;
== 对 AI 药物研发的意义 ==&lt;br /&gt;
* '''挖掘负面结果'''：很多药物研发的失败案例（Negative Results）隐藏在全文的图表或附件中。通过挖掘 PMC 全文，AI 可以帮助药企避免重复前人的失败路径。&lt;br /&gt;
* '''多模态学习'''：PMC 文章中包含大量病理切片、CT 影像和图表。这是训练多模态 AI（既能看图又能读文）的最佳数据源。&lt;br /&gt;
&lt;br /&gt;
== 参见 ==&lt;br /&gt;
* [[PubMed]]&lt;br /&gt;
* [[MEDLINE]]&lt;br /&gt;
* [[NIH]]&lt;br /&gt;
* [[开放获取]] (Open Access)&lt;br /&gt;
* [[自然语言处理]] (NLP)&lt;br /&gt;
&lt;br /&gt;
== 参考资料 ==&lt;br /&gt;
&amp;lt;references&amp;gt;&lt;br /&gt;
&amp;lt;ref name=&amp;quot;PMC_About&amp;quot;&amp;gt;National Library of Medicine. (2023). PMC Overview. [https://www.ncbi.nlm.nih.gov/pmc/about/intro/]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&amp;lt;ref name=&amp;quot;NIH_Policy&amp;quot;&amp;gt;National Institutes of Health. (2008). NIH Public Access Policy Details. [https://publicaccess.nih.gov/]&amp;lt;/ref&amp;gt;&lt;br /&gt;
&amp;lt;/references&amp;gt;&lt;br /&gt;
&lt;br /&gt;
[[Category:数字图书馆]]&lt;br /&gt;
[[Category:生物信息学]]&lt;br /&gt;
[[Category:开放获取]]&lt;/div&gt;</summary>
		<author><name>77921020</name></author>
	</entry>
</feed>