Информация о конотоксинах


Оценка производительности SVM-Freescore


Download 75.03 Kb.
bet8/9
Sana24.12.2022
Hajmi75.03 Kb.
#1051763
1   2   3   4   5   6   7   8   9
Bog'liq
Molekulyar biologiya fanidan tayyorlagan (1)

3.4 Оценка производительности SVM-Freescore
Тест складного ножа использовался для оценки производительности подхода SVM-Freescore. Параметр температуры T, максимальный размер слова k max и размер окна ℓ W были установлены на 3, 4 и 300 соответственно. Применительно к DATASET-1 и DATASET-2 предложенный метод позволил достичь превосходной точности AC, SN, SP и ROC , как показано в Таблице .. Таблице 7 и Таблице 8 Таблице 8. ROC — это процент истинных положительных результатов (TPR = доля истинных положительных результатов) и процент ложных срабатываний (FPR = доля ложных положительных результатов).
Метод также был протестирован с использованием m-кратной перекрестной проверки, когда мы сначала разделили обучающую выборку на m подмножеств одинакового размера. Одно последующее подмножество тестировалось с использованием классификатора, обученного на оставшихся m-1 подмножествах . Таким образом, каждый экземпляр всего обучающего набора был предсказан один раз , поэтому точность перекрестной проверки представляла собой процент правильно классифицированных данных. В Table.7 Table7 и Table.8 Table 8 мы перечислили результаты 10-кратной перекрестной проверки на основе DATASET-1 и DATASET-2 соответственно.
4. Дискуссия
Алгоритм BLAST был протестирован Mondal et al. [8 ] для сканирования неизбыточной базы данных Swiss-Prot, содержащей 202 310 последовательностей. Значения точности идентификации членов надсемейств A, M, O и T составили 88,0 %, 69,2 %, 85,2 % и 11,8 % соответственно. Таким образом, по характеристикам можно сделать вывод, что инструмент BLASTP для поиска гомологов не подходит для гипервариабельных конотоксинов. Поэтому необходимо было использовать более высокую систему классификации. Сравнение производительности с использованием традиционного сопоставления Смита-Уотермана в сочетании с SVM и SVM-Freescore также показано на рис. 2 рис. 2. Использовались стандартные параметры подгонки Смита-Уотермана; 11 и 1 штраф за открытие гэпа и штрафы за продление, а также матрица BLOSUM 62. Размер окна установлен на ℓ W 300 . Результаты показаны на рис.2 , 2 , показывая значительное улучшение точности, когда традиционная аппроксимация Смита-Уотермана заменена моделью сглаживания слов с конечной температурой. Сравнение производительности SVM (SVM-SW) и SVM-Freescore с использованием обычного сопоставления Смита-Уотермана.
Тот факт, что наш алгоритм SVM-Freescore смог классифицировать набор данных о конотоксинах по суперсемействам его генов, указывает на то, что собранные аминокислотные последовательности содержат достаточно информации, чтобы классифицировать их по биологически значимым группам. Было доказано, что конотоксин эффективен при производстве лекарств и может использоваться для лечения различных заболеваний. Таким образом, SVM-Freescore можно использовать, например, для отнесения белков конотоксинов, обнаруженных в недавно аннотированных геномах, к их правильному надсемейству.

Download 75.03 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling