Вы здесь

Главная

Аннотация промоторов E.coli: весовые матрицы для текстовых и позиционных параметров

ID_Статьи: 
20.00

Работа является этапом в создании компьютерного алгоритма для картиро­вания регуляторных участков (промоторов) в геноме E. coli. Для этого исполь­зована обучающая компиляция биохимически аннотированных бактериальных промоторов (всего 397), имеющих одну стартовую точку и равный по размеру контрольный набор непромоторых ДНК. Предварительное выравнивание про­моторов обучающей компиляции было осуществлено с использованием весо­вых матриц для канонических элементов и длин спейсера (Hertz, Stormo. Methods Enzymol. 1996). Положение этих элементов определялось по максимальному значению показателя соответствия идеальному промотору при разрешенных вариациях спейсера (от 15 до 21 нуклеотидных пар). Выявленные таким обра­зом канонические элементы были использованы для уточнения числовых зна­чений весовых матриц и последующей идентификации сигнальных элементов. Это привело к перевыравниванию - 10% промоторов и позволило оптимизиро­вать параметры матриц. Следующим шагом было построение весовой матри­цы отражающей вариации (от 4 до 10 пар оснований) в расстоянии между стартовой точкой транскрипции и элементом - 10. Учет обоих параметров при­вел к перевыравниванию - 25% промоторов. В качестве следующего шага была построена весовая матрица, отражающая частоту присутствия различных динук-леотидов вблизи стартовой точки транскрипции (F). Значения F рассчитыва­лись в диапазоне от -4 до +3 и варьировали от - 3,1 (АС в -1) до +1,1 (ТА там же). Предпочтительными в области локального плавления; ДНК оказались ди-нуклеотиды YR (Y = Т = С, R = А = G), которые являются наиболее дефор­мируемыми звеньями в структуре двойной спирали. Учет характера доминиро­вания динуклеотидов вблизи стартовой точки транскрипции на 5% уменьшил процент промоторов, имеющих отрицательные показатели подобия идеальной мат­рице и, следовательно, увеличил предсказательную cилу алгоритма.

 

Брок-Волчанский А.С., Озолинь О.Н.

Институт биофизики клетки РАН, Пущино