Самообучающееся веб-приложение повышает скорость и точность классификации вариаций ДНК среди сортов злаков

Самообучающееся веб-приложение повышает скорость и точность классификации вариаций ДНК среди сортов злаков

С быстрым прогрессом в области геномики за последние 25 лет появился революционный метод улучшения сельхозкультур — пангеном, определяемый как собранные последовательности генома из нескольких разновидностей внутри вида. Но понимание и улучшение селекции на основе огромного количества полученных данных также создало проблему для исследователей из-за отсутствия эффективных и удобных в использовании биоинформационных инструментов, особенно тех, которые предназначены для обработки больших объемов вариаций ДНК у видов. Американские ученые предложили свой вариант решения проблемы.

Ученые Службы сельскохозяйственных исследований (ARS) МСХ США в сотрудничестве с коллегами Университета штата Вашингтон разработали инновационное веб-приложение под названием BRIDGEcereal, способное быстро и точно анализировать огромное количество геномных данных, доступных в настоящее время для зерновых культур, и организовывать материал в интуитивно понятные диаграммы, которые определяют закономерности обнаружения интересующих генов.

Например, пшеница. Стандартный эталонный геном пшеницы, который был сделан для сорта пшеницы «Китайская весна», в пять раз больше, чем геном человека. Кроме того, исследователи долгое время боролись с большими различиями в расположении генов, которые контролируют основные агротехнические признаки в 21 хромосоме пшеницы. Сейчас в открытом доступе дюжина геномов пшеницы.

Это приводит к огромному количеству данных, что делает их анализ утомительным процессом даже для экспертов с продвинутыми биоинформационными навыками. Особенно сложно отсортировать все данные, чтобы идентифицировать похожие участки ДНК, которые могут контролировать один и тот же признак, независимо от того, где они расположены на хромосоме.

Приложение BRIDGEcereal разработано, чтобы превратить процесс идентификации больших вариаций ДНК из утомительного в эффективный.

«Просто предоставив BRIDGEcereal интересующую вас последовательность ДНК, он завершит процесс поиска менее чем за одну минуту, упорядочит найденные данные и представит их вам в виде понятных диаграмм, которые подчеркнут любые закономерности того, где находится эта ДНК», — пояснил биолог-исследователь ARS Ксианран Ли, руководитель проекта BRIDGEcereal. Ли работает в отделе исследования здоровья, генетики и качества пшеницы ARS в Пуллмане, штат Вашингтон.

Так, искусственному интеллекту потребовалась всего минута, чтобы идентифицировать многообещающий ген-кандидат в качестве контроллера мутации пшеницы, которая уменьшает длину ости, щетиноподобных отростков от колоса пшеницы. С 1940-х годов было известно, что ген в хромосоме 4А пшеницы контролирует развитие ости, но точный ген, отвечающий за эту черту, оставался неизвестным.

«Проведя поиск десятков потенциальных генов с помощью BRIDGEcereal, мы смогли быстро идентифицировать ген с большой вариацией ДНК как тот, что ускользал от исследователей», — сказал Ли.

Приложение самообучаемо, то есть может автономно учиться распознавать новые модели без необходимости следовать явным инструкциям. «Итак, мы разработали универсальный шлюз для эффективного поиска и анализа общедоступных пангеномов злаковых по мере того, как данные продолжают накапливаться», — пояснил Ли.

Бозен Чжан, научный сотрудник Вашингтонского государственного университета и один из разработчиков веб-приложения, добавил: «Наш инструмент упрощает работу для выбора и определения приоритетов генов-кандидатов, которые контролируют определенные признаки зерновых культур. После пшеницы инструмент уже адаптирован для анализа аналогичных данных по ячменю, кукурузе, сорго и рису». 

(Источник: United States Department of Agriculture. Автор: Ким Каплан). 

agroxxi.ru