CNN

卷积神经网络（Convolutional Neural Network，简称 CNN），是一种专门为处理具有网格结构数据（如图像、时间序列）而设计的深度学习架构。
它的设计灵感来源于生物学中的视觉皮层（Visual Cortex）机制——特别是 Hubel 和 Wiesel 发现的“感受野”概念。与传统神经网络（全连接层）不同，CNN 通过“卷积”（Convolution）操作和“权值共享”（Weight Sharing）机制，能够自动从图像中提取从低级（边缘、线条）到高级（形状、物体）的层级特征。
在医学领域，CNN 是AI辅助诊断的绝对核心技术。无论是 LDCT 上的肺结节检出、数字病理切片的癌细胞识别，还是眼底照片中的糖网分级，背后几乎都是 CNN 在发挥作用。 [Image of CNN architecture diagram]

CNN

The Eye of AI (点击展开)

计算机视觉的基石

技术档案
全称	Convolutional Neural Network
核心组件	卷积层, 池化层, 激活函数
数学基础	线性代数 (矩阵运算)
关键特性	平移不变性, 局部连接
经典模型	ResNet, U-Net (医学常用)
医学应用
图像分类	判断良恶性 (如皮肤癌)
目标检测	框出病灶 (如肺结节)
图像分割	勾画器官/肿瘤边界 (U-Net)
数据格式	DICOM (2D/3D)

三大法宝：CNN 是如何“看”图的？

如果把一张 CT 图像看作一个数字矩阵，CNN 通过以下三个核心操作来“消化”这些数据：

操作层	形象比喻	功能原理
卷积层 (Convolution)	提取特征的“滤镜”	利用一个个小的卷积核（Kernel）在图像上滑动。 • 浅层卷积：识别边缘、线条、颜色。 • 深层卷积：识别眼睛、纹理、结节形状。
激活层 (ReLU)	神经元的“开关”	引入非线性（Non-linearity）。如果没有它，神经网络就退化成了普通的线性回归，无法处理复杂的医学图像。常用 ReLU 函数。
池化层 (Pooling)	信息的“浓缩”	下采样（Downsampling）。保留主要特征，丢弃不重要的细节，减小图像尺寸，防止过拟合。

U-Net：医学影像界的“神网”

在通用领域，ResNet、VGG 是王者；但在医学图像分割（Segmentation）领域，U-Net 是绝对的统治者。

结构特点： 呈“U”形对称结构。左边是收缩路径（编码器，提取特征），右边是扩张路径（解码器，还原位置）。
跳跃连接 (Skip Connection)： 将左边丢失的空间信息直接“复制粘贴”到右边。这解决了深层网络容易丢失病灶边缘细节的问题。
应用： 几乎所有需要“勾画”的任务——如勾画肿瘤靶区（放疗）、勾画心室边界、分割细胞核——首选模型都是 U-Net 及其变体。

       关键相关概念 [Key Concepts]

1. Filter / Kernel (卷积核)： CNN 的核心参数。一个 3x3 的矩阵，像手电筒一样在图像上扫描。训练 CNN 的本质，就是让计算机通过反向传播算法，自动找到最适合识别肿瘤的“卷积核”参数。

2. Receptive Field (感受野)： 指网络中某一层神经元能“看到”的原图范围。层数越深，感受野越大，看到的特征越宏观（如整个肺）；层数越浅，感受野越小，看到的越微观（如毛玻璃纹理）。

3. Transfer Learning (迁移学习)： 医学影像数据标注极难（需要专家）。因此，通常先让 CNN 在海量的自然图像（ImageNet，如猫狗照片）上预训练，学会看线条和形状，然后再用少量的医学图像（CT/MRI）进行“微调”（Fine-tuning）。

       学术参考文献 [Academic Review]

[1] LeCun Y, et al. (1998). Gradient-based learning applied to document recognition. Proceedings of the IEEE.
[点评]：CNN 的开山之作（LeNet-5）。Yann LeCun 首次系统性地提出了卷积、池化和反向传播的联合应用，奠定了现代深度学习的基础。

[2] Ronneberger O, et al. (2015). U-Net: Convolutional Networks for Biomedical Image Segmentation. MICCAI.
[点评]：医学影像 AI 的必读经典。提出了 U-Net 架构，在只有少量标注样本的情况下，依然实现了极高精度的细胞分割，彻底改变了医学图像分析领域。

           人工智能 · 知识图谱

上级分类	深度学习 (Deep Learning)
核心应用	计算机视觉 (CV) • 医学影像分析
相关架构	U-Net • ResNet • Transformer (ViT)

匿名

搜索

CNN

名字空间

更多

页面选项

三大法宝：CNN 是如何“看”图的？

U-Net：医学影像界的“神网”

导航

导航

功能菜单

Wiki工具

Wiki工具

匿名

搜索

CNN

三大法宝：CNN 是如何“看”图的？

U-Net：医学影像界的“神网”

导航

Wiki工具

页面工具