CNN

来自医学百科

卷积神经网络(Convolutional Neural Network,简称 CNN),是一种专门为处理具有网格结构数据(如图像、时间序列)而设计的深度学习架构。
它的设计灵感来源于生物学中的视觉皮层(Visual Cortex)机制——特别是 Hubel 和 Wiesel 发现的“感受野”概念。与传统神经网络(全连接层)不同,CNN 通过“卷积”(Convolution)操作和“权值共享”(Weight Sharing)机制,能够自动从图像中提取从低级(边缘、线条)到高级(形状、物体)的层级特征。
在医学领域,CNN 是AI辅助诊断的绝对核心技术。无论是 LDCT 上的肺结节检出、数字病理切片的癌细胞识别,还是眼底照片中的糖网分级,背后几乎都是 CNN 在发挥作用。 [Image of CNN architecture diagram]

CNN
The Eye of AI (点击展开)
计算机视觉的基石
技术档案
全称 Convolutional Neural Network
核心组件 卷积层, 池化层, 激活函数
数学基础 线性代数 (矩阵运算)
关键特性 平移不变性, 局部连接
经典模型 ResNet, U-Net (医学常用)
医学应用
图像分类 判断良恶性 (如皮肤癌)
目标检测 框出病灶 (如肺结节)
图像分割 勾画器官/肿瘤边界 (U-Net)
数据格式 DICOM (2D/3D)

三大法宝:CNN 是如何“看”图的?

如果把一张 CT 图像看作一个数字矩阵,CNN 通过以下三个核心操作来“消化”这些数据:

操作层 形象比喻 功能原理
卷积层
(Convolution)
提取特征的“滤镜” 利用一个个小的卷积核(Kernel)在图像上滑动。
               
• 浅层卷积:识别边缘、线条、颜色。

• 深层卷积:识别眼睛、纹理、结节形状。
激活层
(ReLU)
神经元的“开关” 引入非线性(Non-linearity)。如果没有它,神经网络就退化成了普通的线性回归,无法处理复杂的医学图像。常用 ReLU 函数。
池化层
(Pooling)
信息的“浓缩” 下采样(Downsampling)。保留主要特征,丢弃不重要的细节,减小图像尺寸,防止过拟合。

U-Net:医学影像界的“神网”

在通用领域,ResNet、VGG 是王者;但在医学图像分割(Segmentation)领域,U-Net 是绝对的统治者。

  • 结构特点: 呈“U”形对称结构。左边是收缩路径(编码器,提取特征),右边是扩张路径(解码器,还原位置)。
  • 跳跃连接 (Skip Connection): 将左边丢失的空间信息直接“复制粘贴”到右边。这解决了深层网络容易丢失病灶边缘细节的问题。
  • 应用: 几乎所有需要“勾画”的任务——如勾画肿瘤靶区(放疗)、勾画心室边界、分割细胞核——首选模型都是 U-Net 及其变体。
       关键相关概念 [Key Concepts]
       

1. Filter / Kernel (卷积核): CNN 的核心参数。一个 3x3 的矩阵,像手电筒一样在图像上扫描。训练 CNN 的本质,就是让计算机通过反向传播算法,自动找到最适合识别肿瘤的“卷积核”参数。

2. Receptive Field (感受野): 指网络中某一层神经元能“看到”的原图范围。层数越深,感受野越大,看到的特征越宏观(如整个肺);层数越浅,感受野越小,看到的越微观(如毛玻璃纹理)。

3. Transfer Learning (迁移学习): 医学影像数据标注极难(需要专家)。因此,通常先让 CNN 在海量的自然图像(ImageNet,如猫狗照片)上预训练,学会看线条和形状,然后再用少量的医学图像(CT/MRI)进行“微调”(Fine-tuning)。

       学术参考文献 [Academic Review]
       

[1] LeCun Y, et al. (1998). Gradient-based learning applied to document recognition. Proceedings of the IEEE.
[点评]:CNN 的开山之作(LeNet-5)。Yann LeCun 首次系统性地提出了卷积、池化和反向传播的联合应用,奠定了现代深度学习的基础。

[2] Ronneberger O, et al. (2015). U-Net: Convolutional Networks for Biomedical Image Segmentation. MICCAI.
[点评]:医学影像 AI 的必读经典。提出了 U-Net 架构,在只有少量标注样本的情况下,依然实现了极高精度的细胞分割,彻底改变了医学图像分析领域。

           人工智能 · 知识图谱
上级分类 深度学习 (Deep Learning)
核心应用 计算机视觉 (CV) • 医学影像分析
相关架构 U-NetResNetTransformer (ViT)