只有一小部分存入数据库的
基因已通过实验表征。大多数蛋白质的功能是自动分配的,这可能会导致错误的注释。公共数据库中当前注释的可靠性在很大程度上是未知的;缺乏验证单个酶类内准确性的实验尝试。在这项研究中,我们对 BREN
DA 酶数据库的功能注释进行了概述。我们首先应用高通量实验平台来验证 S-2-羟酸氧化酶 (
EC 1.1.3.15) 酶类的功能注释。我们选择了该类的 122 个代表性序列,并筛选了它们的预测功能。基于实验结果、预测的域结构和与先前表征的 S-2-羟酸氧化酶的相似性,我们推断酶类中至少有 78% 的序列被错误注释。我们通过实验证实了错误注释序列中的四种替代活动,并表明酶类中的错误注释随着时间的推移而增加。最后,我们对 BREN
DA 数据库中所有酶类的注释进行了计算分析,并表明所有序列中有近 18% 被注释为酶类,同时与实验表征的代表没有相似性或域结构。我们表明,即使经过充分研究