Информация о конотоксинах


Download 75.03 Kb.
bet3/9
Sana24.12.2022
Hajmi75.03 Kb.
#1051763
1   2   3   4   5   6   7   8   9
Bog'liq
Molekulyar biologiya fanidan tayyorlagan (1)

1.2 Слабость последних работ
для экспрессии белковой последовательности . Традиционный аминокислотный состав состоит из 20 компонентов, каждый из которых отражает частоту встречаемости одной из 20 последовательных нативных аминокислот. Напротив, PseAAC включает дополнительные компоненты, которые включают некоторую информацию о последовательности через различные режимы [31 ]. Однако дополнительные атрибуты фактора ограничены длиной последовательности белка. Поскольку большинство белков конотоксинов обычно короткие (длиной 10–30 аминокислот) [36 ], данные о PseAAC очень ограничены. Что касается первых 20 атрибутов, которые представляют нормализованную частоту встречаемости 20 нативных аминокислот в последовательности белка конотоксина, то короткая последовательность может статистически не отражать истинную частоту встречаемости. Во-вторых, не установлены эволюционные и структурные связи внутри надсемейства конотоксинов . О гомологии можно судить по сходству последовательностей, а гомологичные отношения обычно подразумевают идентичные или, по крайней мере, очень похожие структурные отношения [20 , 37].
1.3 Предлагаемое решение
Мы стремимся предоставить более точный метод классификации белковых последовательностей на примере конотоксинов. Конечная ценность этого нового метода заключается в его применении для точной классификации структуры/функции семейств белков, важных для открытия лекарств. Работа в этой статье основана на наблюдении, что оценка попарного выравнивания обеспечивает подходящую меру сходства между белковыми последовательностями. Сходство может включать биологические знания об эволюционных структурных отношениях белков [23 ]. Однако из-за высокой изменчивости последовательностей зрелых токсинов методы подобия часто недостаточно чувствительны, чтобы показать все эволюционные отношения, особенно при слабой гомологии.
Хотя было предложено много методов для выравнивания или сравнения белков, альтернативные меры подобия все еще крайне желательны из-за потребности в быстром скрининге и запросе крупномасштабных баз данных белков [38 ]. В этом исследовании мы вводим сглаживающий тип выделения признаков для экспрессии белка. Он основан на идее метода SVM-Pairwise, основанного на выравнивании [20 ]. В методе SVM-Pairwise авторы предложили простой способ представления белковых последовательностей в виде вектора фиксированной длины действительных чисел, где полученные векторы можно использовать в качестве входных данных для алгоритма различительного обучения. Основная идея заключалась в том, что интересные особенности белковой последовательности можно эффективно улавливать, измеряя, насколько белок похож на большой набор других белков. Поэтому конкретный белок сравнивали с каждым белком в наборе. Однако в этом случае шкала Смита-Уотермана, использованная Liao et al. [20 ] были заменены так называемыми свободными баллами для сравнения двух аминокислотных последовательностей. Базовая модель представляет собой версию локального выравнивания последовательностей слов конечного размера с «конечной температурой».
Вместо того, чтобы сосредотачиваться только на оптимальной оценке (как в алгоритме Смита-Уотермана), бесплатные оценки включают возможные альтернативные выравнивания, подобные индикатору вперед в HMM. Включение возможных альтернативных выравниваний особенно важно, когда ожидается много независимых регионов с высокими показателями [39 ], например замена окна на этапе извлечения признаков (см. Раздел 2.1 ниже). Поэтому мы ожидаем, что бесплатные баллы будут полезны.
Способ 2
Предлагаемый метод, который мы называем методом SVM-Freescore, состоит из двух основных этапов .
• Извлечение признаков: представление каждой белковой последовательности вектором оценок попарного сходства. Оценка попарного сходства рассчитывается с использованием выравнивания слов с конечной температурой.
• Классификация: Использование внутреннего продукта векторных изображений признаков в качестве ядра, используемого в сочетании с SVM.

Download 75.03 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling