一种通过第四天的图像预测肿瘤球形成率的机器学习方法。
Introduction
由于癌细胞基因组和表观遗传学的不稳定性,肿瘤细胞在病人间和病人内的异质性造成了癌症基础理解和治疗的困扰。研究者假设细胞的关键亚群(如,肿瘤起始细胞(tumor initiating cells, TICs)/干细胞样肿瘤细胞(cancer stem-like cells, CSCs))具有在转移位点播种并发展肿瘤和治疗后复发的能力。
虽然有大量CSC标记物被鉴定,然而这些标记物与肿瘤起始和转移能力没有直接联系。作为有吸引力的替代,已经建立了使用单细胞衍生球形成对CSCs进行功能性分离的方法。癌细胞在恶劣的悬浮环境中生长的特性与其在循环系统中存活并在远处转移的能力有关。
单细胞悬浮培养用于鉴定CSC有2个根本困难:
- 其一是如何保证一个细胞球是来自单细胞而不是细胞聚集。
- 肿瘤球分析需要相对较长的时间。
Figure 1. Early prediction of single-cell derived sphere formation using deep learning
- (a)单SUM159乳腺癌细胞被接种到不粘连的8×8的微孔阵列上。由于泊松分布,17个微孔分离了单细胞。细胞悬浮培养,用于球形成试验。
- (b)第2天和第4天的微孔中细胞图像用于预测第14天的细胞/球的最终大小。三个CNN层用于预测。
Figure 2. Representative cases of single cells cultured in nonadherent microwells
第2天和第4天的荧光图像用于预测。蓝圈代表微孔边界,黄色方块代表裁剪的用于预测的区域,绿色十字代表细胞中心。
- (a)成球的细胞在第2天和第4天增殖,表明成球的潜力很大。
- (b)静止的细胞保持细胞面积和亮度,但是不能增值。
- (c)凋亡细胞在第4天显著变暗并且死亡。
Figure 3. Correlation between cell area on Days 0, 2, and 4 with the final cell/sphere area on Day 14
第0、2和4天的细胞面积与第14天的最终细胞/球体面积之间的相关性。X轴表示(a)第0,(b)2和(c)4天以及Y轴表示第14天的细胞面积。两个轴均为对数刻度。每个蓝色点代表一个细胞,红色虚线代表趋势线。相关性随时间增加,但即使第4天的相关性也很弱。
Figure 4. Prediction of sphere formation using cellular fluorescence images of Days 2 and 4 with a CNN model
- (a-b)基于(a)第2天和(b)第4天的图像的预测的混淆矩阵。绿色框代表正确的预测,红色框代表错误的预测,灰色框代表行/列的总和。框内描述了预测事件的数量和百分比。
- (c-d)使用CNN模型使用(c)第2天和(d)第4天的图像预测第14天的细胞/球体大小。 X轴表示第14天的细胞/球体大小的地面真相,Y轴表示使用经过训练的CNN模型使用第2天和第4天的细胞图像在第14天的预测细胞/球体大小。每个点代表一个单元。使用第2天的图像进行线性回归的R值为0.62,使用第4天的图像进行线性回归的R值为0.81,这表明真值与预测之间具有很强的相关性。
Figure 5. Ground truth and estimated sphere formation rates using cellular images on Days 2 and 4
- (a)使用第2天和第4天的图像均低估了球形成率,该数据集的原始训练数据集具有明显更多的非形成球的细胞,即为不平衡的训练集。
- (b)使用具有可比数量的非球形成和球形成细胞的平衡训练数据集,使用第4天细胞图像进行的估算接近于真实情况。
Reference
Chen Y-C, Zhang Z, Yoon E. Early Prediction of Single-Cell Derived Sphere Formation Rate Using Convolutional Neural Network Image Analysis[J]. Analytical Chemistry, 2020, 92(11): 7717–7724.