Информация о конотоксинах


Download 75.03 Kb.
bet2/9
Sana24.12.2022
Hajmi75.03 Kb.
#1051763
1   2   3   4   5   6   7   8   9
Bog'liq
Molekulyar biologiya fanidan tayyorlagan (1)

1.1 Надлежащие методы
и классификации гомологии белков , причем большинство успешных методов основаны на последовательности профиля или сопоставлении профиля профиля. Некоторыми из предыдущих методов являются скрытые марковские модели (HMM) [10], PSI-BLAST [11, 12], COACH [13] и HHsearch [14]. Другими методами, использующими структурную информацию, являются PROSPECT [15 ] и ProfNet [16]. Profile Comparer [17 ] также является оценочной схемой, которая сопоставляет HMM-профили белковых семейств и хорошо распознает отношения отдаленной гомологии. Кроме того, в последние годы наблюдалось значительное повышение производительности классификации белков в результате использования машин опорных векторов (SVM) в качестве популярного инструмента статистического машинного обучения [18 , 19]. Примерами являются SVM-Pairwise [20 ], HMM, сочетающие метод оценки [21] и сопоставление профилей с SVM [22]. Кроме того, несколько ядерных методов, таких как локальные сглаживающие ядра [23], прямые ядра на основе профилей [24], SVM-SK [25] и кластерные ядра [26].] в конечном итоге предложили разработать более мощные методы удаленного обнаружения гомологии, чтобы помочь в классификации белков. Кроме того, применение нового метода извлечения признаков, такого как неотрицательная матричная факторизация (NMF), для признаков выравнивания профилей значительно повысило эффективность обнаружения складок [27 ].
Несмотря на высокую эффективность, профильные SVM-методы имеют один существенный недостаток — необходимость в длительном обучении. Для преодоления этой проблемы были найдены более простые и общие алгоритмы [28 ]. В дополнение к методам профиля расстояний, о которых сообщалось в [29], Rankprot [26 ] предложил простой процесс сравнения, использующий попарное сходство белковых последовательностей. Подход SCOOP [30 ] исследовал общее выравнивание последовательностей между двумя результатами поиска профилей Pfam HMM и показал лучшие результаты, чем разработанные методы, такие как HHsearch, в идентификации взаимосвязей белковых суперсемейств.
Хотя большинство вышеупомянутых методов основаны на выравнивании белковых последовательностей, некоторые исследователи сосредоточились на классификации суперсемейств конотоксинов с использованием подходов без выравнивания. Мондал и др. [8 ] использовали несколько теоретических подходов для классификации белков конотоксинов в их соответствующие суперсемейства на основе основной последовательности зрелого конотоксина. Они включают концепцию псевдоаминокислотного состава (PseAAC) [31 ]] для представления пептидов в математической структуре, которая включает эффект порядка последовательности наряду с их нормальным аминокислотным составом. Атрибут индекса полярности — кодирующая информация, такая как захоронение остатков на поверхности, полярность и гидропатия — использовался для сохранения эффекта порядка последовательности. Затем представление использовалось в сочетании с несколькими классификаторами, такими как мультиклассовые SVM, предиктор ISort (Intimate Sorting) [32 ], алгоритмы наименьшего расстояния [33, 34] и множественные бинарные подходы [35]. -остальные (1-я вр) SVM. Другой метод, называемый IDQD, был недавно разработан Hao Lin et al. [9 ], использует подход извлечения признаков, аналогичный мультиклассовым SVM. Однако вместо SVM в качестве метода классификации использовался новый алгоритм усиления разнообразия в сочетании с модифицированным дискриминантом Махаланобиса. В этом случае предполагается, что последовательность является членом конкретного надсемейства конотоксинов, если соответствующее увеличение значения разнообразия минимально.

Download 75.03 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling