Информация о конотоксинах
Download 75.03 Kb.
|
Molekulyar biologiya fanidan tayyorlagan (1)
1.1 Надлежащие методы
и классификации гомологии белков , причем большинство успешных методов основаны на последовательности профиля или сопоставлении профиля профиля. Некоторыми из предыдущих методов являются скрытые марковские модели (HMM) [10], PSI-BLAST [11, 12], COACH [13] и HHsearch [14]. Другими методами, использующими структурную информацию, являются PROSPECT [15 ] и ProfNet [16]. Profile Comparer [17 ] также является оценочной схемой, которая сопоставляет HMM-профили белковых семейств и хорошо распознает отношения отдаленной гомологии. Кроме того, в последние годы наблюдалось значительное повышение производительности классификации белков в результате использования машин опорных векторов (SVM) в качестве популярного инструмента статистического машинного обучения [18 , 19]. Примерами являются SVM-Pairwise [20 ], HMM, сочетающие метод оценки [21] и сопоставление профилей с SVM [22]. Кроме того, несколько ядерных методов, таких как локальные сглаживающие ядра [23], прямые ядра на основе профилей [24], SVM-SK [25] и кластерные ядра [26].] в конечном итоге предложили разработать более мощные методы удаленного обнаружения гомологии, чтобы помочь в классификации белков. Кроме того, применение нового метода извлечения признаков, такого как неотрицательная матричная факторизация (NMF), для признаков выравнивания профилей значительно повысило эффективность обнаружения складок [27 ]. Несмотря на высокую эффективность, профильные SVM-методы имеют один существенный недостаток — необходимость в длительном обучении. Для преодоления этой проблемы были найдены более простые и общие алгоритмы [28 ]. В дополнение к методам профиля расстояний, о которых сообщалось в [29], Rankprot [26 ] предложил простой процесс сравнения, использующий попарное сходство белковых последовательностей. Подход SCOOP [30 ] исследовал общее выравнивание последовательностей между двумя результатами поиска профилей Pfam HMM и показал лучшие результаты, чем разработанные методы, такие как HHsearch, в идентификации взаимосвязей белковых суперсемейств. Хотя большинство вышеупомянутых методов основаны на выравнивании белковых последовательностей, некоторые исследователи сосредоточились на классификации суперсемейств конотоксинов с использованием подходов без выравнивания. Мондал и др. [8 ] использовали несколько теоретических подходов для классификации белков конотоксинов в их соответствующие суперсемейства на основе основной последовательности зрелого конотоксина. Они включают концепцию псевдоаминокислотного состава (PseAAC) [31 ]] для представления пептидов в математической структуре, которая включает эффект порядка последовательности наряду с их нормальным аминокислотным составом. Атрибут индекса полярности — кодирующая информация, такая как захоронение остатков на поверхности, полярность и гидропатия — использовался для сохранения эффекта порядка последовательности. Затем представление использовалось в сочетании с несколькими классификаторами, такими как мультиклассовые SVM, предиктор ISort (Intimate Sorting) [32 ], алгоритмы наименьшего расстояния [33, 34] и множественные бинарные подходы [35]. -остальные (1-я вр) SVM. Другой метод, называемый IDQD, был недавно разработан Hao Lin et al. [9 ], использует подход извлечения признаков, аналогичный мультиклассовым SVM. Однако вместо SVM в качестве метода классификации использовался новый алгоритм усиления разнообразия в сочетании с модифицированным дискриминантом Махаланобиса. В этом случае предполагается, что последовательность является членом конкретного надсемейства конотоксинов, если соответствующее увеличение значения разнообразия минимально. Download 75.03 Kb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling