目的通过所检测到的肽段丰度计算蛋白质丰度是蛋白质组学的一个重要部分。由于退化肽段的丰度可能由多个蛋白质提供,简单剔除退化肽段可消除这种不确定性并简化问题。但是由于退化肽段的信息没有被充分利用,蛋白质定量的准确性会受到影...目的通过所检测到的肽段丰度计算蛋白质丰度是蛋白质组学的一个重要部分。由于退化肽段的丰度可能由多个蛋白质提供,简单剔除退化肽段可消除这种不确定性并简化问题。但是由于退化肽段的信息没有被充分利用,蛋白质定量的准确性会受到影响,还可能显著降低可以定量的蛋白质规模。如何充分利用退化肽段的信息,提高蛋白定量的准确性和全面性,并且不会导致问题规模更为复杂,成为一个重要的问题。方法为了在不引入更多误差的情况下充分利用退化肽段来进行更准确的定量,本文提出一个基于误差最小化的方法(error-minimization-based quantification for protein,EMQ)。不同于以往的大多数算法,EMQ利用退化肽段中的信息,最大限度地将肽段层面信息还原到蛋白质层面,得到了更多的蛋白质定量结果并提高了结果的精度。结果多个实验数据上的表现证明本方法可以在较小的时间代价下获得更高的精度,并提高结果的规模。结论本文提出的基于误差最小化的方法可以快速准确地对大规模蛋白质组学问题进行定量。展开更多
文摘目的通过所检测到的肽段丰度计算蛋白质丰度是蛋白质组学的一个重要部分。由于退化肽段的丰度可能由多个蛋白质提供,简单剔除退化肽段可消除这种不确定性并简化问题。但是由于退化肽段的信息没有被充分利用,蛋白质定量的准确性会受到影响,还可能显著降低可以定量的蛋白质规模。如何充分利用退化肽段的信息,提高蛋白定量的准确性和全面性,并且不会导致问题规模更为复杂,成为一个重要的问题。方法为了在不引入更多误差的情况下充分利用退化肽段来进行更准确的定量,本文提出一个基于误差最小化的方法(error-minimization-based quantification for protein,EMQ)。不同于以往的大多数算法,EMQ利用退化肽段中的信息,最大限度地将肽段层面信息还原到蛋白质层面,得到了更多的蛋白质定量结果并提高了结果的精度。结果多个实验数据上的表现证明本方法可以在较小的时间代价下获得更高的精度,并提高结果的规模。结论本文提出的基于误差最小化的方法可以快速准确地对大规模蛋白质组学问题进行定量。