«Детская школа искусств» Мошенского муниципального района

Гдз по биологии таблица: ГДЗ Биология 5-6 класс учебник Пасечник с ракушкой ©✔

Содержание

ГДЗ таблицы по биологии 6 класс Ксеноксс ответы и решения онлайн

Многообразие форматов подачи и контроля знаний позволяет выбрать наиболее оптимальный в каждом конкретном случае. Многие специалисты предлагают обратить внимание на таблицы — как набирающий популярность инструмент предоставления данных и проверки усвоения материала. Удобные и функциональные таблицы по биологии 6 класс позволят школьникам и учителям достичь поставленных целей: быстро освоить даже большие блоки сложной информации, качественно и оперативно проверить усвоение материала, найти и устранить проблемы.

Что следует учесть при составлении таблиц?

Несмотря на то, что таблицы по биологии 6 класс признаны результативным и практичным форматом подачи и проверки знаний, значительное число шестиклассников испытывает трудности с их заполнением и составлением. Среди основных причин появления проблем:

  • необходимость проработки большого количества информационных источников для составления кратких формулировок, которые используются в табличных формах;
  • многообразие форматов подачи данных, из которых следует выбрать необходимые для заполнения строк и столбцов;
  • неумение качественно анализировать поступающие сведения, сравнивать их и выделять главное, отображаемое в таблице;
  • отсутствие прочных базовых знаний, полученных в рамках программ начальной школы по дисциплине «Окружающий мир» и по биологии за предшествующий пятый класс;
  • сжатые сроки, в течение которых нужно составить и предоставить на проверку учителю выполненные табличные задания.

Во избежание проблем, вызванных этими объективными факторами, школьники могут обратиться за профессиональной помощью. Необязательно записываться на дорогостоящие платные курсы, кружки или нанимать репетиторов. Можно найти всю необходимую табличную информацию по всем разделам и курсам биологии за шестой класс на портале еуроки. Обширная коллекция таблиц позволит подобрать оптимальный, нужный вариант для каждого конкретного урока и оперативно воспользоваться этими данными.

Информация в табличном виде — наглядно и понятно

Преимущества, за которые ценятся таблицы по биологии 6 класс многочисленными пользователями, таковы:

  • наглядность представленной в них информации. Это позволяет быстро, в считанные минуты, отыскать и применить нужные данные;
  • краткость, сжатость представленных сведений, что удобно и для запоминания, и для оформления ответа на вопрос учителя, задания на контрольной, экзамене;
  • сочетание двух первых перечисленных выше плюсов позволяет, не напрягая память, надолго зафиксировать в ней информацию;
  • написание, заполнение таблиц — практичный способ эффективно готовиться к экзаменам и зачетам. Такие «шпаргалки» даже необязательно применять впоследствии — табличные данные уверенно запомнятся пользователям.

Учителям-предметникам эти материалы позволят оперативно проверить знания шестиклассников, затратив на такую работу минимум времени и получив качественный и достоверный результат.

ГДЗ по Биологии для 5 класса Сивоглазов В.И., Плешаков А.А. на 5

Авторы:

Сивоглазов В.И., Плешаков А.А..

Издательство: Просвещение 2019

«ГДЗ по биологии 5 класс Учебник Сивоглазов, Плешаков (Просвещение)» помогает школьникам легко справляться с практическими заданиями, и осваивать важный предмет. Дисциплина необходима для расширения кругозора, и получения правильного научного представления об окружающем мире. Программа этого года включает в себя несколько разделов:

  1. История науки, развитие биологических знаний.
  2. Царства живой природы.
  3. Строение организмов.
  4. Возникновение жизни на нашей планете.

Пятиклассники изучают методы биологических исследований, учатся работать с приборами и инструментами, знакомятся с классификацией существ, рассматривают особенности приспособления организмов к среде обитания. Также на уроках затрагиваются вопросы экологии, влиянии человека на природу. При выполнении домашних заданий ребята могут обращаться к данному вспомогательному ресурсу. Он поможет не только развеять сомнения в правильности собственных рассуждений, но и при необходимости подскажет верные ответы.

Содержание решебника по биологии 5 класс Сивоглазов

«ГДЗ по биологии 5 класс Учебник В.И. Сивоглазов, А.А. Плешаков (Просвещение)» состоит из 30 параграфов. Каждый содержит в себе ответы на вопросы, касающиеся пройденного материала. Здесь можно найти расшифровку терминов, объяснения, примеры, доказательства, заполненные таблицы, схемы, и другую ценную информацию. Все вопросы разобраны максимально подробно. Это позволяет использовать приведенные сведения для развернутых ответов. Поиск выполненных заданий осуществляется по номерам.

Польза ГДЗ

Самостоятельные работы с помощью онлайн-пособия выполняются быстро и качественно. При этом они всегда получают высокий балл. Благодаря этому у ребят появляется больше времени на отдых и развлечения. Впрочем, переписывать информацию слово в слово не стоит. Лучше внимательно изучать ее, и излагать по-своему. Такой подход позволяет не только получать хорошие оценки, но и запоминать материал, максимально углубляться в предмет. Также решебник можно использовать для выявления ошибок в самостоятельно выполненных работах, и для тщательного изучения пропущенных тем. При невозможности задать вопрос преподавателю наличие виртуального советчика становится особенно ценным. Регулярные занятия с ним заметно повышают уровень подготовки к следующим урокам, и ликвидируют пробелы в знаниях.

Ответ § 10. Ткани — Рабочая тетрадь по биологии 5 класс Пасечник В.В.

36)  Закончите определение.

  

Ответ:

Тканью называют – совокупность клеток и межклеточного вещества, имеющих общее происхождение, строение и выполняемые функции.

 

37)  Заполните схему.

 

  • Ответ:

     

 

38)  Заполните таблицу.

 

Ответ:

Название ткани

Выполняемая функция

Особенности строения клеток

Основная

Синтез

Запас различных веществ

Живые клетки

Покровная

Защитная

Живые или мертвые клетки с утолщенными оболочками

Механическая

Опорная

Утолщенные, одревесневшие оболочки

Проводящая

Транспорт органических и минеральных веществ

Живые или мертвые клетки в виде трубок

Образовательная

Образование новых клеток

Рост растения

Крупное ядро

Тонкая оболочка

Небольшие размеры

 

39)  Решите кроссворд № 2.

 

  • Ответ:

     

 

По горизонтали:

  1. Пластиды, содержащие хлорофилл.
  2. Структура растительной клетки, отделяющая ее от окружающей среды.
  3. Часть микроскопа.
  4. Мелкие тельца, находящиеся в цитоплазме клетки.
  5. Группа клеток, сходных по строению и выполняющих одинаковые функции
  6. Межклеточные пространства.
  7. Бесцветное вязкое вещество, находящееся внутри клетки.
  8. Основная составная единица всех живых организмов.

 

По вертикали:

  1. Плотное тельце в цитоплазме клетки.
  2. Полость, заполненная клеточным соком.
  3. Тельца в ядре клетки, передающие наследственные признаки.
  4. Зрительная трубка микроскопа.
  5. Образование внутри ядра.
  6. Простейший увеличительный прибор.
  7. Подставка, к которой крепятся части микроскопа.
  8. Увеличительный прибор.

 

Тренировочные задания

 

ЗАДАНИЯ ЧАСТИ А

Выберите один правильный ответ из четырех предложенных.

 

А1) Хлоропласты имеют окраску

 

  • Ответ:

    1) Желтую

    2) Зеленую

    3) Красную

    4) Бесцветную

 

А2) Увеличение изображения, обеспечиваемое световым микроскопом, соответствует

 

  • Ответ:

    1) Сумме увеличений объектива и окуляра

    2) Увеличение, которое обеспечивается окуляром

    3) Произведению увеличений объектива и окуляра

    4) Увеличение, которое обеспечивается объективом

 

А3) В растительной клетке пластиды находятся в

 

 

А4) В растительной клетке вакуоли находятся в

 

 

А5) В растительной клетке хромосомы находятся в

 

 

А6) Хромосомы

 

  • Ответ:

    1) Переносят питательные вещества в клетке

    2) Накапливают питательные вещества

    3) Образуют органические вещества

    4) Передают наследственные признаки

 

А7) Ткань – это

 

  • Ответ:

    1) Группа клеток, расположенных рядом в теле растений

    2) совокупность клеток и межклеточного вещества, имеющих общее происхождение, строение и выполняющих определенные функции

    3) все клетки, образующие данный орган растений

    4) Вещество, выделяемое клетками для защиты растений

     

    ЗАДАНИЯ ЧАСТИ В

    Выберите три правильных ответа из шести предложенных.

 

В1) Пластиды могут быть

 

  • Ответ:

    1) синими

    2) белыми

    3) черными

    4) зелеными

    5) бесцветными

    6) красными, желтыми или оранжевыми

 

В2)  К растительным тканям, в состав которых входят только живые клетки, относятся

 

 

Установите правильную последовательность биологических процессов, явлений, практических действий.

 

В3)  Укажите последовательность процессов, происходящих в клетке при ее делении.

 

  • Ответ:

    А) Удвоение хромосом

    Б) Деление клетки на две дочерние

    В) Ядерная оболочка разрушается, хромосомы располагаются в экваториальной плоскости клетки

    Г) Хромосомы расходятся к полюсам клетки

    Д) Оформляются два ядра

     


ГДЗ Биология 7 класс Пасечник Суматохин Калинова учебник

Введение. Многообразие организмов, их классификация
§1. Многообразие организмов, их классификация
§2. Вид — Основная единица систематики
Моя лабораторная: Многообразие организмов, их классификация
Глава 1. Бактерии, грибы, лишайники
§3. Бактерии — Доядерные организмы
§4. Роль бактерий в природе и жизни человека
§5. Грибы — царство живой природы и Моя лабораторная
§6. Многообразие грибов, их роль в жизни человека и Моя лабораторная
§7. Грибы — паразиты растений, животных, человека
§8. Лишайники — комплексные симбиотические организмы
Глава 2. Многообразие растительного мира
§9. Общая характеристика водорослей
§10. Многообразие водорослей
§11. Значение водорослей в природе и жизни человека
§12. Высшие споровые растения
§13. Моховидные
§14. Папоротниковидные
§15. Плауновидные Хвощевидные
Глава 3. Многообразие животного мира
§34. Общие сведения о животном мире
§35. Одноклеточные животные или простейшие
§36. Паразитические простейшие. Значение простейших
§37. Ткани, органы и системы органов многоклеточных животных
§38. Тип Кишечнополостные
§39. Многообразие кишечнополостных
§40. Общая характеристика червей. Тип плоские черви
§41. Тип Круглые черви и тип Кольчатые черви
§42. Брюхоногие и двустворчатые моллюски
§43. Головоногие моллюски
§44. Тип Членистоногие. Класс Ракообразные
§45. Класс Паукообразные
§46. Класс Насекомые
§47. Многообразие насекомых
§48. Тип Хордовые
§49. Строение и жизнедеятельность рыб
§50. Приспособления рыб к условиям обитания. Значение рыб
§51. Класс Земноводные
§52. Класс Пресмыкающиеся
§53. Класс Птицы
§54. Многообразие птиц и их значение. Птицеводство
§55. Класс Млекопитающие или Звери
§56. Многообразие зверей
§57. Домашние млекопитающие
Глава 4. Эволюция растений и животных, их охрана
§58. Этапы эволюции органического мира
§59. Освоение суши растениями и животными
§60. Охрана растительного и животного мира
Глава 5. Экосистемы
§61. Экосистема
§62. Среда обитания организмов. Экологические факторы
§63. Биотические и антропогенные факторы
§64. Искусственные экосистемы
Данный материал содержит ответы по биологии 7 класс. У нас вы найдете ответы на вопросы в конце параграфов из учебника по биологии. ГДЗ по биологии 7 класс Пасечник Суматохин Калинова с правильными ответами на вопросы. «Пять уроков» будут рады, если вы найдете ошибки в ответах и отправите нам по форме выше, нажам кнопку «Нашли ошибку?». Решебник удобен в поиске ответов, достаточно выбрать необходимый параграф и нажать на ссылку и тем самым вы перейдете к ответам на вопросы параграфа(к примеру «64. Искусственные экосистемы»). ГДЗ к учебнику биология поможет в выполнении домашнего задания, тем самым сократит время на их решение.
В сложный период переходного возраста всем участникам воспитательного процесса необходимо сосредоточиться на учебе. Ведь именно это должно стать главной задачей для семиклассника. Окончив 6 класс, подросток сталкивается со многими новыми предметами, которые появляются как раз-таки в 7 классе. Теперь многие научные дисциплины расширяют свои границы, увеличивают объем учебного материала, усложняют понятийный аппарат. Предмет биологи не является исключением. Если раньше школьник формировал у себя представления о природе в общем, то теперь, в 7 классе, школьник узнает о том, что природа подразделяется на группы, классы. Каждое живое создание имеет сове место в биологической цепочке, выполняет определенные функции, а объединяет их одна научная дисциплина. В таком возрасте ученик хочет много всего знать и уметь, он радуется каждому своему новому открытию. Поэтому сейчас у подростков появляются хобби и любимые занятия. Разобраться в сложной терминологии и непростых понятиях помогут ГДЗ и пособия по биологии для 7 классов. Здесь ребенок встретит актуальные подсказки и практичные пояснения учебного материала, которые, кстати, полностью отвечают программе.

ГДЗ по Биологии за 6 класс Сивоглазов В. И., Плешаков А. А.

Биология 6 класс Сивоглазов В. И.

Авторы: Сивоглазов В. И., Плешаков А. А.

Биология считается одним из самых интересных предметов. На уроках можно узнать много новых сведений о растениях и животных, об их строении и развитии, о взаимодействии человека с ними. Но школьный курс с каждым годом становится все сложнее, на дом задают гораздо больше, а учителя предъявляют высокие требования. И на фоне такой ситуации реально может пропасть интерес к самому увлекательному предмету. Чтобы этого не произошло и ребенок с радостью шел в школу, стоит обратиться к методической литературе. «ГДЗ по биологии 6 класс Сивоглазов, Плешаков (Просвещение)» призван развить любовь к этой дисциплине.

Для того, чтобы получить ожидаемый эффект в виде положительных отметок от работы с книгой, нужно действовать по определенному алгоритму. В первую очередь рекомендуем сделать все заданное на дом самому. Только после этого можно сверить свои ответы с верными ключами, приведенными в конце параграфа. В конце необходимо исправить имеющиеся ошибки, если они есть, и постараться их больше не допускать. Стоит добавить, что для лучшего результата занятия по нашему справочнику должны носить регулярный и систематический характер.

Как поможет решебник по биологии для 6 класса от Сивоглазова

Среди родителей и преподавателей бытует расхожее мнение о бесполезности и даже вреде онлайн-справочников с готовыми домашними заданиями. Считается, что после них в голове у школьника ничего не остается. Но это заблуждение. Уже после первых занятий по этому изданию можно заметить следующие изменения:

  • повысится успеваемость;
  • проснется тяга к предмету;
  • появится активность на уроке и при ответах у доски;
  • разовьется привычка к самоанализу и усердие;

Также отметим, что после работы по «ГДЗ по биологии за 6 класс Сивоглазов В. И., Плешаков А. А. (Просвещение)» время, затрачиваемое на подготовку заданного на дом, значительно сократится, и его можно будет потратить на спорт или прогулки с друзьями.

Заблуждается тот, кто считает, что сборники с ГДЗ помогут только ребятам с проблемами в учебе. Книга от издательства «Просвещение» придет на помощь и педагогам, старающимся разнообразить свои уроки, и отличникам, которые готовятся к ответственному тестированию. А мамы и папы освежат с ее помощью школьные знания и всегда будут готовы помочь своему чаду.

Решебники и ГДЗ по Биологии 7 класс

Нравится ли школьникам биология? Наверно, далеко не всем. Конечно, слушать информацию о живых организмах достаточно интересно, но когда дело доходит до самостоятельных работ все рвения учеников к данной науке пропадает. Занятия становятся скучными и не интересными. Ведь не всегда удается сразу найти ответ на поставленный вопрос, а некоторые лабораторные работы вообще заводят в тупик. В подобных случаях на помощь придет ГДЗ по биологии, 7 класс, онлайн. Электронная версия пособия доступна каждому.

Пользуйтесь ГДЗ биология, 7 класс, чтобы учеба стала в радость

Решебник включает в себя все готовые работы, которые будут задавать на протяжении седьмого класса. Это не только домашние задачи, но и вопросы, которые часто включены в контрольные работы. Таким образом, пособие пригодится не только дома, но и на уроке. В любой ситуации можно заглянуть в полезную онлайн-книгу.

Решебник сделан в простом формате, который поделен на главы и подразделы. Это позволяет в считанные секунды найти соответствующий номер лабораторного и практического задания. У вас всегда под рукой будут правильно выполненные упражнения, которые остается только списать или сверить со своими ответами. Что может быть удобнее?

Каждый ответ на вопрос детально изложен, поэтому задания доступны для понимания любого школьника. Ученики с неоднозначной успеваемостью могут воспользоваться решебником. Здесь вы также получили информацию, которую раньше пропустили в школе из-за отсутствия на уроке или невнимательного прослушивания темы.

Решебник по биологии, 7 класс – отличный помощник каждому школьнику

Специфический предмет теперь будет интересен семикласснику. Пособие содержит все задания, которые подразумевает учебник по биологии за представленный год. Не стоит переживать, что задания устаревшие, так как наш сайт следит за всеми обновлениями, которые происходят в школьной программе.

Решебник пригодится как двоечнику, так и отличнику:

  • В ГДЗ по биологии, 7 класс, содержатся ответы на все вопросы, которые следует изучить по биологии в седьмом классе.
  • Это прекрасная возможность подтянуть свои знания по предмету или углубить их.

Готовые домашние задания хороши тем, что использовать их можно в любом удобном для вас месте. Если есть доступ в интернет, то достаточно выбрать подходящий учебник, а также номер лабораторной или практической работы. Нажмите мышкой на нужное задание, перед вашими глазами откроется готовый вариант решения, в правильности которого сомневаться не нужно. Постарайтесь вникнуть в задание, чтобы запомнить его и понять.

Решебник «Биология», 7 класс скачать будет разумнее

Готовые домашние задания можно просматривать в онлайн-версии, но если нет доступа к интернету, то это сделать невозможно. А ведь решения могут понадобиться в любой момент. Лучше скачать решебник и загрузить его на свой телефон, чтобы им можно было воспользоваться во время выполнения домашних заданий или на контрольной работе в школе.

Таким образом, вы всегда сможете заглянуть в решебник за подсказкой. Верный помощник не подведет вас никогда. Благодаря пособию вы будете уверены на 100% в правильности своих решений. Однако не следует бездумно списывать упражнения. Лучше вникать в ход действий и в выводы лабораторных и практических работ, чтобы биология стала для вас понятной дисциплиной. ГДЗ помогут значительно повысить вашу успеваемость по биологии. Если что-то было непонятно в течение урока, то дома помощник в виде решебника обязательно даст ответы на все волнующие вопросы. Главное – обдуманно подходить к выполнению каждой работы, чтобы полученная информация отложилась у вас в памяти и пригодилась на контрольном срезе.

Таблица по биологии «Ученые — биологи»

Учёные, их вклад в развитие биологии.

Учёный

Его вклад в развитие биологии

Гиппократ 470-360 до н.э.

Первый учёный, создавший медицинскую школу. Древнегреческий врач, сформулировал учение о четырёх основных типах телосложения и темперамента, описал некоторые кости черепа, позвонки, внутренние органы, суставы, мышцы, крупные сосуды.

Аристотель

Один из основателей биологии как науки, впервые обобщил биологические знания, накопленные до него человечеством. Создал систематику животных, посвятил многие работы происхождению жизни.

Клавдий Гален

130-200 н.э.

Древнеримский учёный и врач. Заложил основы анатомии человека. Медик, хирург и философ. Гален внёс весомый вклад в понимание многих научных дисциплин, включая анатомию, физиологию, патологию, фармакологию и неврологию, а также философию и логику.

Авиценна 980-1048 г.

Выдающийся учёный в области медицины. Автор многих книг и работ по восточной медицине. Самый известный и влиятельный философ-учёный средневекового исламского мира. От того времени в современной анатомической номенклатуре сохранилось множество арабских терминов.

Леонардо да Винчи 1452-1519

Описал многие растения, изучал строение тела человека, деятельность сердца, зрительную функцию. Сделал 800 точных рисунков костей, мышц, сердца и научно описал их. Его рисунки – первые анатомически верные изображения тела человека, его органов, систем органов с натуры.

Андреас Везалий

1514-1564

Основоположник описательной анатомии. Создал труд «О строении человеческого тела».

Везалий исправил свыше 200 ошибок канонизированного античного автора. Также исправил ошибку Аристотеля о том, что мужчина имеет 32 зуба, а женщина 38. Классифицировал зубы на резцы, клыки и моляры. Трупы ему приходилось тайно добывать на кладбище, так как в то время вскрытие трупа человека было запрещено церковью.

Уильям Гарвей

Открыл круги кровообращения.

ГАРВЕЙ Уильям (1578-1657), английский врач, основатель современных наук физиологии и эмбриологии. Описал большой и малый круги кровообращения. Заслугой Гарвея,
в частности, является то, что именно он
экспериментально доказал наличие замкнутого
круга кровообращения у человека, частями
которого являются артерии и вены, а сердце –
насосом. Впервые высказал мысль, что «все живое происходит из яйца».

Карл Линней 1707-1778

Линней — создатель единой системы классификации растительного и животного мира, в которой были обобщены и в значительной степени упорядочены знания всего предыдущего периода развития биологической науки. Среди главных заслуг Линнея — введение точной терминологии при описании биологических объектов, внедрение в активное употребление биноминальной (бинарной) номенклатуры, установление чёткого соподчинения между систематическими (таксономическими) категориями.

Карл Эрнст Бэр

Профессор Петербургской медико-хирургической академии. Открыл яйцеклетку у млекопитающих, описал стадию бластулы, изучил эмбриогенез цыпленка, установил сходство эмбрионов высших и низших животных, теорию последовательного появление в эмбриогенезе признаков типа, класса, отряда и т.п. Изучая внутриутробное развитие, установил, что зародыши всех животных на ранних этапах развития схожи. Основатель эмбриологии, сформулировал закон зародышевого сходства (установил основные типы эмбрионального развития).

Жан Батист Ламарк

Биолог, создавший первую целостную теорию эволюции живого мира. Ламарк ввел термин » биология » (1802). Ламарку принадлежат два закона эволюции:
1. Витализм. Живыми организмами управляет внутреннее стремление к совершенствованию. Изменения условий сразу вызывают изменения привычек и посредством упражнений соответствующие органы изменяются.
2. Приобретенные изменения наследуются.

 

Жорж Кювье

Создатель палеонтологии – науки об ископаемых животных и растениях. Автор «теории катастроф»: после катастрофических событий, уничтожавших животных, возникали новые виды, но проходило время, и снова происходила катастрофа, приводившая к вымиранию живых организмов, но природа возрождала жизнь, и появлялись хорошо приспособленные к новым условиям окружающей среды виды, затем снова погибавшие во время страшной катастрофы.

Т.Шванн и М. Шлейден

Основатели клеточной теории: клетка — основная единица строения, функционирования и развития всех живых организмов; клетки всех одноклеточных и многоклеточных организмов сходны по своему строению, химическому составу, жизнедеятельности и обмену веществ; размножение клеток происходит путем их деления, в сложных многоклеточных организмах клетки специализированы по выполняемым ими функциям и образуют ткани; из тканей состоят органы. Эти положения доказывают единство происхождения всех живых организмов, единство всего органического мира.

Ч. Дарвин

1809-1882г.

Создал теорию эволюции, эволюционное учение. Сущность эволюционного учения заключается в следующих основных положениях:
Все виды живых существ, населяющих Землю, никогда не были кем-то созданы.

Возникнув естественным путем, органические формы медленно и постепенно преобразовывались и совершенствовались в соответствии с окружающими условиями.
В основе преобразования видов в природе лежат такие свойства организмов, как наследственность и изменчивость, а также постоянно происходящий в природе естественный отбор. Естественный отбор осуществляется через сложное взаимодействие организмов друг с другом и с факторами неживой природы; эти взаимоотношения Дарвин назвал борьбой за существование.

Результатом эволюции является приспособленность организмов к условиям их обитания и многообразие видов в природе.

Г. Мендель

1822-1884г.

Основоположник генетики как науки.

1 закон: Единообразие гибридов первого поколения. При скрещивании двух гомозиготных организмов, относящихся к разным чистым линиям и отличающихся друг от друга по одной паре альтернативных проявлений признака, всё первое поколение гибридов (F1) окажется единообразным и будет нести проявление признака одного из родителей.
2 закон: Расщепление признаков. При скрещивании двух гетерозиготных потомков первого поколения между собой во втором поколении наблюдается расщепление в определенном числовом отношении: по фенотипу 3:1, по генотипу 1:2:1.
3 закон: Закон независимого наследования. При скрещивании двух гомозиготных особей, отличающихся друг от друга по двум (и более) парам альтернативных признаков, гены и соответствующие им признаки наследуются независимо друг от друга и комбинируются во всех возможных сочетаниях .

Карл Максимович

Бэр

Основоположник сравнительной эмбриологии. Бэр установил сходство эмбрионов высших и низших животных, последовательное появление в эмбриогенезе признаков типа, класса, отряда и т. д.; описал развитие всех основных органов позвоночных.

Николай Алексеевич Северцов

Особенно много внимания он уделял изучению птиц- он был одним из крупнейших орнитологов своего времени.

А.И.Опарин

Теория происхождения жизни на Земле. «О возникновении жизни», в котором предложил теорию возникновения жизни из бульона органических веществ. В середине XX века были экспериментально получены сложные органические вещества при пропускании электрических зарядов через смесь газов и паров, которая гипотетически совпадает с составом атмосферы древней Земли.

Луи Пастер

Основоположник микробиологии. Разработал методы прививок против заразных болезней.(сибирская язва, краснуха, бешенство)

С.Г. Навашин

Открыл двойное оплодотворение у растений

Р. Кох 1843-1910

Один из основателей микробиологии. В 1882 году Кох сообщил о своем открытии возбудителя туберкулеза, за которое был удостоен Нобелевской премии и мировой славы. В 1883 году опубликована еще одна классическая работа Коха – о возбудителе холеры. Этот выдающийся успех был достигнут им в результате изучения холерных эпидемий в Египте и Индии.

Д. И. Ивановский 1864-1920г.

Русский физиолог растений и микробиолог, основоположник вирусологии. Открыл вирусы.

Установил наличие фильтрующихся вирусов, являвшихся причинами болезни наряду с видимыми в микроскоп микробами. Это дало начало новой отрасли науки — вирусологии, которая получила бурное развитие в 20 в.

И. Мечников

1845-1916г.

Заложил основы иммунологии. Российский биолог и патолог, один из основоположников сравнительной патологии, эволюционной эмбриологии и отечественной микробиологии, иммунологии, создатель учения о фагоцитозе и теории иммунитета, создатель научной школы, член-корреспондент (1883), почетный член (1902) Петербургской АН. Совместно с Н. Ф. Гамалеей основал (1886) первую в России бактериологическую станцию. Открыл (1882) явление фагоцитоза. В трудах «Невосприимчивость в инфекционных болезнях» (1901) изложил фагоцитарную теорию иммунитета. Создал теорию происхождения многоклеточных организмов.

Л. Пастер 1822-1895г.

Заложил основы иммунологии.

Л. Пастер является основоположником научной иммунологии, хотя и до него был известен метод предупреждения оспы путем заражения людей коровьей оспой, разработанный английским врачом Э. Дженнером. Однако этот метод не был распространен на профилактику других болезней.

И. Сеченов

1829-1905г.

Физиолог. Заложил основы изучения высшей нервной деятельности. Сеченов открыл так называемое центральное торможение — особые механизмы в головном мозге лягушки, подавляющие или угнетающие рефлексы. Это было совершенно новое явление, которое получило название «сеченовского торможения». Открытое Сеченовым явление торможения позволило установить, что вся нервная деятельность складывается из взаимодействия двух процессов — возбуждения и торможения.

И. Павлов 1849-1936г.

Физиолог. Заложил основы изучения высшей нервной деятельности. Создал учение об условных рефлексах. Далее идеи И. М. Сеченова получили развитие в трудах И.П. Павлова, который открыл пути объективного экспериментального исследования функций коры, разработал метод выработки условных рефлексов и создал учение о высшей нервной деятельности. Павлов в своих трудах ввел деление рефлексов на безусловные, которые осуществляются врожденными, наследственно закрепленными нервными путями, и условные, которые, осуществляются посредством нервных связей, формирующихся в процессе индивидуальной жизни человека или животного.

Гуго де Фриз

Создал мутационную теорию. Гуго де Фриз  (1848–1935) — голландский ботаник и генетик, один из основателей учения об изменчивости и эволюции, провёл первые систематические исследования мутационного процесса. Исследовал явление плазмолиза (сокращения клеток в растворе, концентрация которого выше концентрации их содержимого) и в итоге разработал метод определения осмотического давления в клетке. Ввёл понятие «изотонический раствор».

Т. Морган 1866-1943г.

Создал хромосомную теорию наследственности.

Основным объектом, с которым работали Т. Морган и его ученики, была плодовая мушка дрозофила, имеющая диплоидный набор из 8 хромосом. Эксперименты показали что гены, находящиеся в одной хромосоме при мейозе попадают в одну гамету, т. е. наследуются сцепленно. Это явление получило название закона Моргана. Было также показано что у каждого гена в хромосоме есть строго определенное место — локус.

В. И. Вернадский

1863-1945

Основал учение о биосфере. Идеи Вернадского сыграли выдающуюся роль в становлении современной научной картины мира. В центре его естественнонаучных и философских интересов — разработка целостного учения о биосфере, живом веществе (организующем земную оболочку) и эволюции биосферы в ноосферу, в которой человеческий разум и деятельность, научная мысль становятся определяющим фактором развития, мощной силой, сравнимой по своему воздействию на природу с геологическими процессами. Учение Вернадского о взаимоотношении природы и общества оказало сильное влияние на формирование современного экологического сознания.

А. Флеминг

1881-1955

Открыл антибиотики.

Фле́минг — британский бактериолог. Открыл лизоцим (антибактериальный фермент, вырабатываемый человеческим организмом) и впервые выделил пенициллин из плесневых грибов Penicillium notatum — исторически первый антибиотик.

И. Шмальгаузен

1884-1963

Разработал учение о факторах эволюции. Ему принадлежат многочисленные труды по вопросам эволюционной морфологии, по изучению закономерностей роста животных, по вопросам о факторах и закономерностях эволюционного процесса. Ряд работ посвящен истории развития и сравнительной анатомии. Предложил свою теорию роста животных организмов, в основе к-рой лежит представление об обратном соотношении между скоростью роста организма и скоростью его дифференцировки. В ряде исследований разработал теорию стабилизирующего отбора как существенного фактора эволюции. С 1948 занимается изучением вопроса о происхождении наземных позвоночных.

Дж. Уотсон (1928г.) и Ф. Крик (1916- 2004г)

1953г. Установили структуру ДНК. Джеймс Дьюи Уотсон – американский специалист по молекулярной биологии, генетик и зоолог; более всего известен участием в открытии структуры ДНК в 1953-м. Лауреат Нобелевской премии по физиологии и медицине.

После успешного окончания Университета Чикаго и Университета Индианы Уотсон некоторое время вел исследования по химии вместе с биохимиком Германом Калькаром в Копенгагене. Позже он перебрался в лабораторию Кэвендиша при Университете Кембриджа, где ему впервые довелось встретить его будущего коллегу и товарища Фрэнсиса Крика.

СОЗДАТЬ БИО | Национальный институт неврологических расстройств и инсульта


Программа совместных исследований NINDS для создания и развития трансляционных предприятий в области биотехнологических продуктов и биопрепаратов (CREATE Bio) предназначена для лечения расстройств, подпадающих под миссию NINDS, на основе биотехнологических продуктов и биопрепаратов.

Срок действия последних анонсов программы NINDS CREATE Bio (PAR-17-456, PAR-17-457, PAR-18-542 и PAR-18-543) истекает в мае 2021 года.

Кандидатам, ищущим поддержку в открытии и разработке биотехнологических продуктов и биопрепаратов (например, пептидов, белков, олигонуклеотидов, генной терапии и клеточной терапии), предлагается рассмотреть новую программу Blueprint Neurotherapeutics Network for Biologics (BPN-Biologics). См. https://neuroscienceblueprint.nih.gov/neurotherapeutics/bpn-biologics для получения дополнительной информации.


Ресурсы и инструменты

Программа CREATE Bio имеет контракты с консультантами, которые консультируют сотрудников NIH и предлагают помощь исследователям на разовой основе.Консультанты обладают опытом в области разработки биологических КМЦ, нормативно-правового регулирования и статистики.

Зная, что разработка терапии — это сложный процесс, NINDS попросила своих подрядчиков-консультантов по биологии подготовить учебные руководящие документы, чтобы лучше подготовить исследователей. Дорожная карта IND для матрицы разработки продуктов для белковой и пептидной терапии и генной терапии.

Список всех текущих (активных) поддерживаемых CREATE Bio проектов, доступных в базе данных NIH RePORTER, с соответствующими публикациями.

Библиотека поддержки трансляционных приложений содержит ресурсы, которые помогут успешно подать заявку на участие в программе CREATE Bio, такие как видеоролики, справочные таблицы профилей для каждого метода, примеры этапов, пример таблицы профиля целевого продукта и ответы на часто задаваемые вопросы.

Кандидатам, использующим стволовые клетки для лечения, следует ознакомиться с Информацией о стволовых клетках NIH. Например, по ссылке на архив вы можете найти информацию о прошедшем семинаре по плюрипотентным стволовым клеткам в переводе: доклинические аспекты.

CREATE Bio Примеры: вехи | Национальный институт неврологических расстройств и инсульта

Что такое вехи?

Веха — это открытие или набор результатов, которые сигнализируют о достижении определенной цели в вашем плане исследования. Кандидаты должны предложить одну или несколько вех для каждой конкретной цели. Для каждой вехи предоставьте достаточно подробностей о методах, допущениях, планах экспериментов, плане анализа данных (если результаты измеряются количественно) и укажите количественные критерии для измерения успеха и соответствующее обоснование.Количественные критерии должны быть надежными и соответствовать последнему слову техники в данной области. В большинстве случаев количественные критерии успеха на этапах также будут использоваться для принятия решений «годен / не годен», и это следует указать. Укажите временную шкалу для каждой вехи. Ежегодно должно быть не менее одной вехи.

Как они будут использоваться?

Поскольку разработка терапии — это по своей природе процесс с высоким риском, ожидается, что по мере продвижения проектов через процесс разработки терапии может наблюдаться значительный отток.Таким образом, достижение основных этапов может быть использовано при принятии решений о продолжении финансирования на протяжении всего жизненного цикла предлагаемого проекта.

Перед финансированием заявки сотрудники программы NINDS свяжутся с кандидатом, чтобы обсудить предложенные этапы и любые изменения, предложенные комиссией по рассмотрению NINDS или сотрудниками программы NINDS. Окончательный набор утвержденных этапов будет указан в Уведомлении о награждении.

Прогресс в достижении окончательного набора контрольных показателей будет оцениваться персоналом программы NINDS.Персонал программы NINDS может при необходимости проконсультироваться с независимыми консультантами, обладающими соответствующими знаниями. Если это оправдано, контрольные показатели будущего года могут быть пересмотрены на основе данных и информации, полученных в течение предыдущего года. Если, согласно отчету о ходе работ, финансируемый проект не соответствует основным этапам, финансирование проекта может быть прекращено. Помимо контрольных точек, решение о продолжении финансирования также будет основываться на общей надежности пакета данных, который позволяет адекватно интерпретировать результаты (независимо от того, были ли они отражены в контрольных точках), общий прогресс, баланс портфеля NINDS и программу. приоритеты, конкурентная среда и наличие средств.

NINDS подчеркивает важность надежности и внутренней согласованности экспериментальных результатов. В некоторых случаях для NINDS важно провести дополнительные критические эксперименты для уверенности в принятии решения о финансировании. Поэтому сотрудники программы NINDS по согласованию с PI могут добавить эксперименты, которые необходимо провести до или во время награждения, в качестве дополнительных этапов. В большинстве случаев эти исследования будут поддерживаться дополнительными средствами от NINDS.

Каковы передовые методы разработки контрольных точек?

  • Вехи следует описать в разделе C стратегии исследования: Подробные планы стратегии исследования (включая вехи и сроки).
  • Предоставьте достаточно подробностей о методах, допущениях, планах экспериментов, плане анализа данных (если результаты измеряются количественно) и укажите количественные критерии для измерения успеха и соответствующее обоснование.
  • Количественные критерии должны быть надежными и соответствовать последнему слову техники в данной области. В большинстве случаев количественные критерии успеха на этапах также будут использоваться для принятия решений «годен / не годен», и это следует указать.Если критерий не должен использоваться для принятия решений «годен / не годен», он должен быть четко обозначен и обоснован.
  • Укажите временную шкалу для каждой вехи.
  • Будьте агрессивны, но реалистичны
  • Определите как минимум одну контрольную точку на каждый год финансирования
  • Включите взаимодействие FDA в основные этапы (если возможно?)

Заявление об ограничении ответственности: Примеры, показанные ниже, предназначены ТОЛЬКО для иллюстративных целей. NINDS не поддерживает конкретные планы развития или модели, параметры или пороговые значения для какой-либо болезни, способа или стадии развития.Таким образом, NINDS ожидает, что исследователи установят этапы, соответствующие каждому плану развития, но в соответствии с рекомендациями, указанными выше .

Пример № 1 (Оптимизация)

Конкретная цель 3: Продемонстрировать in vivo эффективность PB-19 в Y-лабиринте по его влиянию на рабочую память.

Методы: Спонтанное чередование поведения в Y-лабиринте является мерой пространственной рабочей памяти, исследовательского поведения и восприимчивости к новизне и может использоваться для оценки методов лечения, которые потенциально могут улучшить рабочую память.Мы будем тестировать мышей в Y-лабиринте с руками 34 x 8 x 14 см. Каждая мышь получит одно 5-минутное испытание, в течение которого будут записаны выбор руки и общее количество вводов руки. Самопроизвольное чередование, выраженное в процентах, относится к отношению вариантов выбора руки, отличного от двух предыдущих вариантов, к общему количеству входов руки.

План эксперимента и план анализа данных: Мышам (n = 12 / группа) будут вводить подкожно один раз в день в течение 1 месяца носитель или PB-19 (25 мг / кг).Трансгенным (Tg) или нетрансгенным однопометникам (не-Tg) будут вводиться дозы в каждой группе лечения (положительный контроль и PB-19). Мышей оценивают в Y-лабиринте, при этом экспериментатор не знает генотипа и лечения в соответствии с графиком рандомизации, созданным статистиком. Будут собраны данные об общем выборе руки и выборе руки по сравнению с предыдущим выбором. Данные будут выражены как% спонтанного изменения (Среднее +/- SEM), которое является мерой отношения вариантов выбора руки, отличной от двух предыдущих вариантов, к общему количеству записей руки.Статистический анализ будет проводиться с использованием двухфакторного дисперсионного анализа с генотипом и лечением в качестве факторов. Первичной конечной точкой является предотвращение снижения когнитивных функций (p <0,05) у мышей Tg, получавших PB-19, по сравнению с животными, получавшими Tg, по сравнению с контрольными животными, не получавшими Tg.

Допущения для анализа мощности : В нашей лаборатории у мышей есть возможность делать повторные вводы в одну руку, что приводит к уровню вероятности 22% (2/9) для спонтанных чередований. У здоровых молодых мышей 60-70% самопроизвольных чередований.У трансгенных мышей мы наблюдали снижение на 26%% спонтанных чередований по сравнению с возрастом и мышами дикого типа, совпадающими с пометом. Типичная дисперсия внутри группы составляет <10%. Это согласуется с данными литературы, в которой использовался тот же тест в том же возрасте.

Анализ мощности: Для обнаружения 50% предотвращения снижения когнитивных функций у мышей Tg по сравнению с мышами без Tg при альфа-уровне <0,05, дисперсии внутри группы <10%, с группой из 12 мышей мощность составляет> 80% в обнаружении лечебного эффекта.

Веха, связанная с конкретной целью 3: Продемонстрировать предотвращение (Tg) когнитивного снижения с помощью лечения на модели поведения мышей (Tg) в Y-лабиринте, измеренное по спонтанным чередованиям . (Полный конец 1 года).

Когнитивными конечными точками будут Y-лабиринт, измеренный как количество входов в руку (как мера исследовательских уровней / уровней активности), и процент спонтанных изменений как мера рабочей памяти. Данные будут представлены в виде спонтанного чередования, выраженного в процентах.Самопроизвольное чередование, выраженное в процентах, относится к отношению вариантов выбора руки, отличного от двух предыдущих вариантов, к общему количеству входов руки. Все группы лечения (носитель, PB-19, как у мышей Tg, так и у мышей без Tg) будут представлены в одном наборе данных.

• Критерии успеха и отказа:

1. Статистически значимая разница> 35% (p <0,05) между однопометниками без Tg (Veh) и Tg (Veh), поэтому существует достаточно большое окно для определения эффекта лечения.

2. Продемонстрировать> 50% статистически значимое предотвращение снижения когнитивных функций (p <0,05) у мышей Tg, получавших PB-19, по сравнению с животными, получавшими Tg, (т.е.> 50% разницы между Tg-мышами, получавшими носитель, и мышами, не получавшими Tg. элементы управления).

Пример № 2 (Оптимизация)

Конкретная цель 3: Разработать и установить контроль процесса и спецификации для облегчения воспроизводимого производства [гуманизированного антитела] в поддержку будущих доклинических исследований.

План эксперимента: Будет разработана панель биохимических анализов и анализов высвобождения для оценки чистоты и качества [гуманизированного антитела], полученного из существующего стабильного клона. Производственная партия [гуманизированного антитела] будет тщательно проанализирована, а затем назначена в качестве контрольного реагента (хранится при -80 ° C) для всех целей будущего сравнения. За этим последует разработка процесса и расширение [гуманизированного антитела] с оптимизацией восходящего (культивирование клеток) и нисходящего (очистка) процессов, чтобы максимизировать количество продуцируемого [гуманизированного антитела] для продолжения доклинических исследований. и подготовиться к будущей передаче технологии организации контрактного производства (ОКП) для крупномасштабного клинического производства.

Допущения :

Разработка биохимических анализов, анализов активности и эндотоксинов, отвечающих критериям, указанным ниже в качестве основных этапов проекта, будет способствовать дальнейшему расширению производства и исследованиям характеристик продуктов, необходимых для завершения доклинической разработки [гуманизированных антител]. Выполнение этой цели также позволит нам начать эксперименты по PK / PD и токсикологии, запланированные для дальнейшей доклинической разработки [гуманизированного антитела].

Вехи:

Этап 3a: Разработка и оптимизация биохимических анализов и анализов высвобождения [гуманизированных антител] с СОП для каждого из них, которые будут использоваться в будущих последующих процессах разработки и производства. В таблице ниже приведены СОП, которые необходимо разработать, измерить атрибуты и предлагаемые спецификации для каждого метода тестирования. (Завершено к концу 1 года)

Тестовая СОП

Атрибут

Спецификация

SDS-PAGE или SEC-HPLC Идентичность, Масса ~ 150 кДа
SDS-PAGE или HPLC-SEC Идентичность, Чистота > 90% мономера
HPLC-SEC Идентификатор, мономер < 4% совокупно
ELISA Сила Эквивалент ссылочного стандарта
A280 Концентрация > 0.4 мг / мл
LAL Эндотоксин Эндотоксин <0,5 ЕС / мл

а. Биохимические анализы: [гуманизированное антитело] будет характеризоваться оптической плотностью A280 нм для определения концентрации, методами SDS-PAGE и аналитической HPLC-SEC для оценки молекулярной массы, структуры и чистоты.

г. Анализ активности: Первоначально для оценки активности антитела будет использоваться количественный анализ связывания на основе ELISA, выявляющий связывание [гуманизированного антитела] с [мишенью].Вступая в клиническую разработку, мы намерены разработать анализ биологической активности, основанный на функциональной активности [гуманизированного антитела].

г. Анализ эндотоксина: мы будем использовать тест на обнаружение эндотоксина, чтобы определить уровень эндотоксина [гуманизированные антитела] в ЕС / мл.

Этап 3b: Разработка оптимизированного производственного процесса для [гуманизированного антитела] с документацией (СОП) для обеспечения воспроизводимости и облегчения передачи производственного процесса. (завершено во 2 год)

а.Разработка процесса культивирования клеток: Оптимальные условия производства для клеток CHO-S будут определены с помощью пилотных производственных циклов с использованием системы биореактора. СОП по оптимизации клеточных культур будет описывать такие параметры, как плотность посева, мониторинг жизнеспособности и скорости роста, время сбора урожая и компоненты среды.

г. Разработка процесса очистки: мы ожидаем, что очистка будет состоять из аффинной очистки протеина A, катионообменной и заключительной стадии хроматографии на гидроксиапатите.Также будет включено удаление ДНК клетки-хозяина и шаги по уменьшению вируса. Все эти методы будут масштабироваться и оптимизироваться во время разработки процесса для повышения выхода и чистоты [гуманизированного антитела] и информирования о крупномасштабном производстве. Будут разработаны СОП с описанием каждого этапа процессов производства и очистки, включая критерии приемки для каждого этапа.

Этап 3c: Произвести одну партию [гуманизированного антитела]> 1 грамма и успешно протестировать и выпустить для будущих исследований PK / PD и токсикологии. (Завершено к концу 2 года)

Произвести партию для PD / PK и токсикологических исследований: Будет проведен единичный крупномасштабный (> 1 грамм) производственный цикл [гуманизированного антитела] в соответствии с СОП, разработанными на этапе 2a. Очищенное [гуманизированное антитело] будет изучено, протестировано и квалифицировано с использованием оптимизированных методов тестирования, описанных в СОП, разработанных на этапе 2b, и сравнено с установленным эталонным стандартом.

Этап 3d: Продемонстрировать, что [гуманизированное антитело] стабильно до года в растворе при 4 ° C, используя биохимические критерии и критерии эффективности, установленные выше, и сравнивая с установленным эталонным стандартом, сохраняющим биоактивность> 90%. (Текущая деятельность, но к концу проекта доступны данные о стабильности за 1 год)

Мы определим, сохраняет ли [гуманизированное антитело] свою биологическую активность до 1 года в растворе при 4 ° C. [Гуманизированное антитело] будет производиться и храниться в индивидуальных контейнерах для образцов при комнатной температуре, 4 ° C, -20 ° C и -80 ° C. Через 3, 6, 9 и 12 месяцев хранения образцы будут проанализированы с использованием тех же тестов и критериев выпуска, которые были произведены годом ранее, и сравнены с установленным эталонным стандартом.

Пример № 3 (Разработка)

Конкретная цель 3: Завершить исследования CMC, позволяющие IND, для Ab305.

Экспериментальный подход: На основе данных предыдущих встреч с FDA и нашего прогресса в доклинической разработке Ab305 на сегодняшний день, мы проведем исследование характеристик конечного продукта и его состав, а затем подготовим и отправим пакет IND в FDA.

Допущение : Мы ожидаем, что потребуется переписка с FDA для оценки адекватности наших данных или ответа на конкретные вопросы до подачи пакета IND.

Вехи:

Этап 3а. Завершите описание, квалификацию и характеристику банков основных и рабочих клеток Ab305 (завершено в год 1).

Мы установим процедуры для описания характеристик и тестирования основного и рабочего банка клеток, чтобы подтвердить идентичность, чистоту и пригодность этих банков клеток для промышленного использования:

Элемент

Тест

MCB

WCB

Спецификация

Пройден / Не пройден

Личность Ген: секвенирование ДНК

Х

НЕТ

Подтвердите правильность последовательности ДНК

Вектор: задержка плазмиды в колониях

Х

Х

Подтверждено экстракцией мини-препаратом и ДНК-электрофорезом

Вектор: картирование рестрикционной эндонуклеазой

Х

Х

Подтвердите карту EcoR1 по сравнению со стандартной

Вектор: определение числа копий

Х

Х

> 1

Хозяин: морфология на носителе

Х

Однородный

Идентификационные данные секретируемого белка

Х

Х

Вестерн-блот положительный

Пептидное картирование очищенного белка

Х

НЕТ

Подтвердите правильную аминокислотную последовательность по сравнению со стандартом

Чистота Чистота культуры: морфология колоний на среде

Х

Х

Однородный

Отсутствие бактериофагов

Х

Х

Не обнаружено

Пригодность Жизнеспособность клеток

Х

Х

> 80%

* MCB: основной банк клеток, WCB: рабочий банк клеток

X: применимо

Н / Д: Не применимо

Этап 3b.Завершить оптимизацию критических параметров процесса очистки Ab305 (Завершить в год 1).

Мы установим процедуры, описывающие все последовательные этапы с описанием критических параметров процесса для очистки Ab305, начиная с очищенной массы до очищенного API.

Очистка Шаг

Критический параметр

Спецификация

Пройден / Не пройден

Хроматография белка А
  1. Белковая нагрузка
  2. Буфер для элюирования pH

1 г — 2 г

4.5–5,0

Инкубация с низким pH
  1. pH
  2. Время
  3. Температура
  4. Белковая нагрузка

5,0

1–1,5 часа

4-8 ° С

> 1 г

Катионообменная хроматография
  1. Проводимость нагрузки
  2. Элюирование pH

> 80 мСм / см

4.5

Анионообменная хроматография
  1. Загрузка pH
  2. Проводимость промывки

4,0 — 4,5

<10 мСм / см

Ультрафильтрация / диафильтрация
  1. Рабочее давление
  2. Объем фильтрации

1,0 — 1,2 бара

200 — 300 мл

Этап 3c.Установить контрольные параметры производства конечной продукции (Завершить в 1 год).

Мы установим процедуры, описывающие все последовательные этапы с описанием критических параметров процесса для сборки конечного продукта, начиная с очищенного API и заканчивая конечным биологическим продуктом:

Шаг производства

Критический параметр

Параметры

Успешно / неуспешно

Состав

Используемые вспомогательные вещества

Температура

Время смешивания

Скорость вращения

25 мг / мл сахарозы и 0.01% (об. / Об.) Полисорбат 80

18-24 ° С

30-60 мин.

80-100 об / мин

Стерильная фильтрация Проверка целостности фильтра Пройти тест на целостность фильтра до и после использования
Наполнение / укупорка / укупорка Точность дозирования < 2% отклонение от маркировки
Сборка и маркировка Отсутствие агрегации белков Бионагрузка

Прозрачный раствор

Не более 10 КОЕ / 100 мл

* Не более

Этап 3d: Завершить квалификацию анализа активности Ab305 (Завершить в 1-й год).

Мы квалифицировали ELISA для измерения связывания Ab305 с его лигандом. Следующие рабочие характеристики анализа будут оценены, и будут установлены спецификации теста:

Рабочие характеристики

Измеряется

Спецификация

Пройден / Не пройден

Линейность R в квадрате > 0.9
Диапазон От верхнего к нижнему Верхний и нижний эталоны
Специфичность % Помехи * Не более 1%
Предел обнаружения Нижний предел линейного диапазона * Не более нижнего предела диапазона
Прецизионный % CV * Не более 5%
Точность % Смещение * Не более 5%

* Не более

границ | Интегративный системный биологический анализ проясняет заболевание маститом, лежащее в основе функциональных модулей у молочного скота

Фон

Мастит — тяжелое заболевание, характеризующееся воспалительным заболеванием молочных желез (Gelasakis et al., 2015). Escherichia coli, Staphylococcus aureus и Streptococcus uberis являются тремя основными бактериальными патогенами, связанными с маститом (Vasudevan et al., 2003), причем E. coli вызывают тяжелое воспаление у молочного скота (Vangroenweghe et al., 2005). Акцент текущих исследований сместился на выяснение основных механизмов и разработку эффективных стратегий лечения мастита (Takeshima et al., 2008; Compton et al., 2009). E.coli обычно поражает молочные железы в засушливый период, а воспаление прогрессирует на ранних стадиях лактации (Burvenich et al., 2003). Недавние исследования показывают, что патогенность E. coli полностью зависит от белка под названием FecA (Blum et al., 2018).

Последние достижения в высокопроизводительных технологиях профилирования транскриптомов, таких как микроматрица и секвенирование РНК (RNA-seq), открыли возможности для точной медицины интенсивной терапии, чтобы лучше понять молекулярные механизмы, лежащие в основе различных биологических функций (Bansal and Di Bernardo, 2007; Farhadian и другие., 2020; Панахи и др., 2020). С другой стороны, определение биомаркеров болезней может помочь заводчикам оптимизировать свои генетические программы для молочных животных (Kulkarni and Kaliwal, 2013; Duarte et al., 2015; Lai et al., 2017). Предыдущее исследование идентифицировало TNF, — и SAA3 (Swanson et al., 2009), STAT3, MAPK14, TNF (Gorji et al., 2019), IL8RB, CXCL6, MMP9 (Li et al., 2019 ), IRF9, CCL (Buitenhuis et al., 2011), S100A12, MT2A, SOD2 (Mitterhuemer et al., 2010), CXCL8, CXCL2 , S100A9 (Sharifi et al., 2018), PSMA6, HCK и STAT1 (Bakhtiarizadeh et al., 2020) в качестве потенциальных биомаркеров мастита.

Мета-анализ — это методология систематического и количественного исследования, используемая для оценки предшествующих исследований и достижения заключения (Haidich, 2010). С другой стороны, независимые исследования имеют ограничения по размеру выборки, статистической мощности и надежности результатов (Panahi and Hejazi, 2021). Мета-анализ показал, что объединение значений p решает несколько проблем (Rhodes et al., 2002; Ценг и др., 2012; Panahi et al., 2019a). При объединении значений p с использованием метода Фишера нулевая гипотеза состоит в том, что фактический эффект равен нулю в каждом из объединенных наборов данных (Evangelou and Ioannidis, 2013), что предполагает, что методы должны быть чувствительными, даже когда только подмножество объединенных наборов данных имеет величину воздействия более значительную, чем ноль. Подход Фишера превзошел другие методы создания ассоциаций. Кроме того, метод комбинации значений p показывает большие перспективы для идентификации новых маркеров или дифференциально экспрессируемых генов (DEG) (Evangelou and Ioannidis, 2013).Более того, анализ связности известных мета-генов был представлен как многообещающий подход для разделения сложного метода (Panahi et al., 2020).

Взвешенный сетевой анализ коэкспрессии генов (WGCNA) был предложен в качестве универсального инструмента для анализа коэкспрессии генов, который предоставляет ценную информацию о связности генов на основе уровней экспрессии генов (Ebrahimie et al., 2014; Farhadian et al., 2021). Комбинация алгоритмов машинного обучения и метаанализа микрочипов использовалась для идентификации генов мастита у молочного скота (Sharifi et al., 2018), однако они не включили данные RNA-seq в свой анализ и вместо этого сосредоточились на паттернах экспрессии мета-генов.

Настоящее исследование — первое, известное авторам, которое объединяет метаанализ микроматрицы и наборов данных РНК-seq, анализ связности и оптимизацию модели при мастите. Таким образом, в этом интегративном исследовании мы идентифицировали главные гены, связанные с маститом, используя комбинацию метаанализа, WGCNA и алгоритмов машинного обучения.

Материалы и методы

Сбор данных

Репозиторий Омнибуса экспрессии генов (GEO) Национального центра биотехнологической информации (https://www.ncbi.nlm.nih.gov/gds/) был исследован на предмет наборов данных, связанных с маститом молочного скота. В этой базе данных был проведен поиск исследований РНК-seq и микрочипов с использованием ключевых слов « Bos taurus », «мастит» и « Escherichia coli ». Для этого исследования были выбраны шесть микрочипов и два набора данных RNA-seq.В таблице 1 перечислены платформа, инвентарный номер, виды и ссылки для каждого набора данных. Все образцы здоровых животных и животных с маститом были взяты из видов Bos taurus , которые обладают высокой чувствительностью к E. coli . Пятнадцать здоровых коров немецкой голштино-фризской породы в период средней лактации (3–6 месяцев после родов) были включены в набор данных GSE15025. Животные были заражены E. coli в одной четверти и умерли через 6 часов ( n = 5) или 24 часа ( n = 5) в двух различных сценариях заражения.В качестве контроля использовали пять телок; им не давали никаких лекарств, и они умерли через 24 часа. Через 4-6 недель после отела 16 здоровых первородящих коров датской голштино-фризской породы были протестированы с использованием E. coli для набора данных GSE24217. Общее состояние вымени 24 дойных коров оценивали до заражения. Контрольные четверти были выбраны на основании бактериологических тестов, проведенных перед инокуляцией E. coli и четвертью SCC перед молоком через 24 и 192 часа. Из общей популяции немецкой голштинской породы для набора данных GSE24560 были выбраны 11 телок на 42-й день после родов, с высокой или низкой чувствительностью к маститу.Инактивированные нагреванием E. coli плюс S. aureus использовали для заражения клеток в качестве контроля. Клетки собирали через 1, 6 и 24 часа и сравнивали экспрессию мРНК. Четыре коровы голштинской породы первой лактации на четвертом месяце лактации также были экспериментально инокулированы штаммом 1303 возбудителя мастита E. coli , вызывающим мастит, для набора данных GSE25413. Транскриптомы обработанных и необработанных клеток исследовали через 1, 3, 6 и 24 часа. В наборе данных GSE32186 четырем коровам голштинской породы в первый период лактации давали первичные культуры MEC (pbMEC) в течение 6 часов, а некоторые культуры стимулировали. E.coli. частицы были собраны из вымени трех здоровых стельных (130-й день беременности) коров в середине их первой лактации через 12 или 42 часа. Шесть коров голштино-фризской породы были заражены маститом E. coli для исследований GSE50685. Каждые 6 ч после заражения брали пробы крови и молока. При последовательных дойках обработку повторяли (12, 24 и 36 ч после испытания). Через 24 часа ( n = 3) и 48 часов ( n = 3) после заражения коров умерщвляли для сбора тканей.GSE75379 и GSE159286 были двумя наборами данных, связанными с RNA-seq. Шестнадцать здоровых первородящих коров голштинской породы на 4–6 неделях лактации были включены в набор данных GSE75379. Образцы биопсии здоровой и пораженной ткани вымени были взяты через T = 24 часа и T = 192 часа после заражения. В общей сложности 12 телок были внутримышечно вакцинированы убитыми нагреванием E. coli для исследований GSE159286. Половина телок (группа IM, n = 6) получила бустерную инъекцию через 2 месяца.Другие (группа IMM, n = 6) получали 50 г белкового концентрата, полученного из E. coli в двух четвертях. Затем коров заражали инфузией бактериальной суспензии E. coli P4 через 49 дней в молоке внутри одной здоровой четверти (бактерии 10e3). Перед испытанием кровь брали через 7 дней после первой и второй инъекций (фаза иммунизации), а затем через 0, 12 и 40 часов после инфицирования (фаза заражения).

Таблица 1 . Отобранные микроматрицы и наборы данных RNA-seq для анализа системной биологии мастита.

Предварительная обработка и анализ наборов данных микрочипов

База данных GEO использовалась для сбора всех исходных данных экспрессии микрочипов и связанных аннотаций для каждого исследования, а данные микрочипов были предварительно обработаны для получения надежных результатов. Затем отклонения небиологических данных были удалены, и соответствующие шкалы были использованы для дальнейшего анализа (Bolstad et al., 2003). Метод квантильной нормализации и снижение эффекта партии использовались для проведения эффективного анализа экспрессии генов и устранения вариабельности между исследованиями.Программное обеспечение Limma (2.16.0) (Smyth et al., 2005) использовалось для расчета DEG среди каждой контрольной и экспериментальной группы после предварительной обработки необработанных данных. ДЭГ считались значимыми, когда коэффициент ложного обнаружения (FDR) с использованием метода Бенджамини-Хохберга составлял p <0,05 и логарифм кратного изменения> ± 0,5 (Benjamini and Hochberg, 1995).

Предварительная обработка и анализ отдельных наборов данных RNA-seq

Данные, полученные с помощью RNA-seq, могут быть искажены из-за смещений, вносимых во время подготовки библиотеки, полимеразной цепной реакции и секвенирования.Метод усеченного среднего m-значений был использован для устранения влияния известных небиологических особенностей на данные РНК-seq (Robinson and Oshlack, 2010). Каждый образец проверялся на качество с помощью инструмента FastQC версии 0.11.5 (Trapnell et al., 2012), а показания низкого качества были обрезаны с помощью программного обеспечения Trimmomatic (v 0.32) (Goldman et al., 2006). Программное обеспечение Bowtie2 (2.2.4) использовалось для индексации эталонных геномов, а затем чистые считывания были сопоставлены с эталонным геномом B. taurus (ARS-UCD1.2) с использованием программного обеспечения Tophat2 (2.0.10) (Kim et al., 2013; Love et al., 2014) с настройками по умолчанию. Частоты отображения выборки перечислены в дополнительном материале 1, таблица 1. Пакет htseq-count (2.7.3) (Anders et al., 2013) использовался для расчета матрицы подсчета выражений. Программное обеспечение Bioconductor DESeq2 (1.10.1) использовалось для определения дифференциальной экспрессии генов в каждом исследовании (Love et al., 2014). Что касается нормализации и пакетной коррекции эффекта, методы, изложенные в исследованиях (Farhadian et al., 2021; Панахи и Хиджази, 2021). Таким образом, гены с CV <10% изначально были удалены. Затем группа использовалась в качестве коварианты с использованием размера библиотеки DESeq2, коэффициентов нормализации размерного фактора. Функция преобразования со стабилизацией дисперсии (VST) использовалась для уменьшения несоответствия выборки. Функция VST обычно не удаляет вариации, связанные с пакетом или другими переменными. В результате была использована функция «removeBatchEffect» для удаления пакетных вариаций. Был выбран вариант слепой = ложный, поскольку повторная оценка значений дисперсии не требовалась.Этот процесс выровнял размер библиотеки и другие переменные нормализации. Выборки каждого исследования были нормализованы совместно, что означает, что каждый набор данных был нормализован индивидуально (Love et al., 2014).

Мета-анализ микрочипов и наборов данных РНК-seq

В исследованиях микрочипов для идентификации мета-генов использовался пакет MetaDE (1.0.5) (Wang et al., 2012). Мета-анализ включал следующие этапы: после нормализации квантилей маркировка образцов как «инфицированных» или «здоровых»; «Символ гена» был сопоставлен с множественными идентификаторами зонда с использованием межквартильного диапазона для выбора зонда (Wang et al., 2012). Слияние генов — это подход, используемый для определения того, какие гены следует изучать в дальнейшем (Wang et al., 2021). Поскольку количество генов в исследовании варьировалось, наборы данных по экспрессии нескольких генов, возможно, не были адекватно сопоставлены генами. В этом исследовании метод прямого слияния использовался для получения общих генов в различных исследованиях. Методика Фишера (Marot et al., 2020) была использована для идентификации метагенов в данных РНК-seq с использованием программного обеспечения metaRNASeq (1.0.5). Первоначально DEG для каждого исследования определялись с помощью пакета DESeq2 (1.30.1), и было извлечено соответствующее значение p . Затем функция fishcomb, включенная в пакет metaRNASeq, использовалась для объединения значений p . Для последующего анализа были извлечены гены, общие для метаанализов микрочипов и данных РНК-seq (рис. 1).

Рисунок 1 . Блок-схема различных этапов метаанализа микроматрицы мастита и RNA-seq на основе значения p при расчесывании.

Взвешенный анализ сети коэкспрессии генов

общих генов были использованы для построения сетей коэкспрессии с использованием пакета WGCNA Bioconductor R (версия 3.5.1), чтобы понять закономерности корреляции между генами и определить важные модули, связанные с маститом (Langfelder and Horvath, 2008). Первоначально сети были построены с использованием корреляций Пирсона по всем распространенным генам (Botía et al., 2017). Мягкий порог использовался для оценки корреляции и мощности фильтрации шума для выполнения требований безмасштабной топологии. Дизайн сети взвешенной коэкспрессии генов способствует сильным корреляциям за счет низких корреляций за счет увеличения абсолютной величины корреляции до мягкого порога (Langfelder and Horvath, 2008).Матрица топологического перекрытия (TOM) и соответствующая ей матрица несходства (1 – TOM) использовались для визуализации сети, в результате чего была построена сетевая диаграмма для обнаружения модуля. Собственные гены модулей и членство в модулях использовали для идентификации узловых генов для каждого значимого коэкспрессируемого модуля (Langfelder and Horvath, 2008). Для построения модулей использовались следующие параметры: высота среза 0,975, минимальный размер модуля 30 генов, «гибридный» метод, deepSplit = 2.

Функциональный анализ обогащения

СТРОКА (Szklarczyk et al., 2015) была использована база данных для проведения анализа обогащения в Киотской энциклопедии генов и геномов (KEGG) и генной онтологии (GO) (Dennis et al., 2003). Поправка FDR (<0,05) использовалась для определения статистической значимости терминов GO и KEGG.

Белковые сети взаимодействия общих генов

Анализ генной сети белок-белкового взаимодействия между общими генами был выполнен с использованием программного обеспечения Cytoscape для визуализации генных сетей и идентификации узловых генов.Гены-концентраторы определяются как гены с наивысшей степенью связности и с большей биологической значимостью, чем другие члены генов (Shannon et al., 2003).

Модели машинного обучения с учителем

Идентифицированные общие мета-гены использовались для выбора признаков с использованием 10 различных алгоритмов взвешивания, включая получение информации, коэффициент усиления информации, χ 2 , отклонение, правило, машину опорных векторов, индекс Джини, неопределенность, облегчение и PCA для проверки эффективность узловых генов в различении различных генов, участвующих в заболевании маститом (Farhadian et al., 2018а, 2021). Программное обеспечение Rapid Miner (Rapid Miner 5.0.001, Дортмунд, Германия) использовалось для взвешивания атрибутов (Ebrahimi et al., 2011; Farhadian et al., 2018a; Panahi et al., 2019a; Nami et al., 2021). Основная цель алгоритмов взвешивания атрибутов заключалась в извлечении подмножества входных характеристик (генов) путем исключения тех, которые содержали мало информации или не содержали ее (Panahi et al., 2019b). Деревья решений (DT) были построены с использованием функций со значениями веса более 0,5. DT были построены с использованием следующих методов: получение информации, коэффициент получения информации, индекс Джини и критерии точности.На рисунке 2 представлена ​​блок-схема аналитической стратегии для микроматрицы и RNA-seq.

Рисунок 2 . Блок-схема прикладного подхода системной биологии в этом исследовании.

Результаты

Мета-анализ

Мы провели метаанализ DEG, используя данные экспериментов с микрочипами и RNA-seq. Шесть необработанных наборов данных микрочипов, содержащих 211 образцов, и два набора данных RNA-seq, содержащих 123 независимых эксперимента с молочным скотом, были выбраны отдельно для метаанализа.Наконец, с помощью метода Фишера в пакетах metaDE и metaRNASeq было обнаружено в общей сложности 2089 и 2794 мета-генов в ответ на мастит E. coli в микрочипах и данных РНК-seq соответственно. Дополнительный материал 2 и рисунок 3 содержат результаты мета-анализа данных RNA-seq.

Рисунок 3 . Результаты метаанализа данных РНК-секвенирования с использованием метода Фишера и инкорма.

Идентификация общих генов путем сравнения мета-генов

Всего 360 генов были идентифицированы как общие мета-гены в метаанализе микрочипов и данных РНК-seq (рис. 4).Таблица 2 и дополнительный материал 3 содержат дополнительную информацию о важных общих мета-генах.

Рисунок 4 . Результаты общих мета-генов с использованием диаграммы Венна.

Таблица 2 . Значимые общие мета-гены при мастите.

Функциональный анализ общих генов

База данных STRING использовалась для проведения GO-анализов 360 общих мета-генов, чтобы установить их роль в биологическом процессе (BP), молекулярной функции (MF) и клеточном компоненте (CC) при мастите.В результате было найдено 170, 33 и 36 терминов GO для BP, MF и CC соответственно. Термины «клеточный процесс», «ответ на стимул», «биологическая регуляция», «регуляция биологического процесса» и «регуляция клеточного процесса» использовались для обозначения наиболее критического процесса в категории АД. «Связывание», «связывание с ионами», «связывание с актином», «связывание с катионами» и «связывание с ионами металлов» были значительно перепредставлены в категории MF. Что касается СС, термины «внутриклеточный», «клетка», «цитоплазма», «внутриклеточная органелла» и «органелла» были значительно обогащены.Дополнительная информация доступна в таблице 3 и дополнительных материалах 4.

Таблица 3 . Значимые GO термины общих генов.

Этот анализ выявил в общей сложности девять важных путей KEGG. Кроме того, результаты показали, что «пероксисома», «путь передачи сигнала NOD-подобного рецептора», «путь передачи сигнала IL-17» и «путь передачи сигнала TNF» были значительно перепредставлены. Таблица 4 содержит дополнительную информацию о путях KEGG.

Таблица 4 .Значительные метаболические пути KEGG связаны с общими генами.

Cytoscape демонстрирует участие ДЭГ в межбелковых взаимодействиях. Рисунок 5 иллюстрирует визуализацию общих мета-генов генной сетью. Лучшими генами были STAT1, RTPRC, SOD2 и VCP (дополнительный материал 5).

Рисунок 5 . Сеть белок-белкового взаимодействия для общих генов с использованием Cytoscape.

Построение сети взвешенной коэкспрессии генов

WGCNA была выполнена для идентификации генов с высокой корреляцией и классифицировала общие гены на четыре модуля.Бирюзовый модуль ( n = 214 генов) и коричневый модуль ( n = 57 генов) были идентифицированы как критические функциональные модули, связанные с маститом, с помощью анализа WGCNA (рис. 6A). Остальные модули, такие как синий модуль ( n = 84 гена) плюс серый модуль ( n = 5 генов), не были примечательными. Рисунок 6B иллюстрирует иерархическую кластеризацию общих генов.

Рисунок 6 . WGCNA: (A) Кластерная дендрограмма общих генов.Ветви и цветные полосы демонстрируют конкретный модуль. (B) участок TOM; светлый цвет символизирует низкое перекрытие, а постепенно более темный красный цвет символизирует более высокое перекрытие между общими генами. Блоки более темного цвета по диагонали соответствуют модулям.

Коэффициент корреляции и значение p для значимых модулей в группах мастита и здоровых составили r = 0,28, p = 0,002 и r = 0,36, p = 4e — 05 соответственно для бирюзовый и коричневый модули (рис. 7).

Рисунок 7 . Отношение признака модуля (значение p ) для идентифицированных модулей (ось y) по отношению к признакам (ось x). Отношения были окрашены в соответствии с корреляцией между модулем и признаками (бирюзовый, сильная отрицательная корреляция; коричневый, сильная положительная корреляция).

У бирюзы отрицательная корреляция с маститом, тогда как у коричневого — положительная. В таблице 5 перечислены пять основных генов-концентраторов в коричневых и бирюзовых модулях.Дополнительный материал 6 содержит список наиболее значимых идентифицированных модулей.

Таблица 5 . Главные гены-концентраторы в важных модулях при мастите.

«Пероксисома», «вирусный канцерогенез» и «метаболизм аргинина и пролина» были определены как наиболее значительно обогащенные пути на основе расширенного функционального анализа в этих модулях, которые потенциально были связаны с развитием мастита. Эти модули обогащены генами, участвующими в «негативной регуляции фосфорилирования пептидил-серина», «ответе на стимул», «регуляции клеточного процесса», «гидроксилировании белка», «процессе, основанном на актиновых филаментах» и «клеточном процессе».Эти модули выполняли важные MF, такие как «связывание актина», «связывание», «связывание фактора транскрипции» и «пероксидазная активность». «Внутриклеточный», «органелла», «цитоплазма», «клетка», «кортикальный актиновый цитоскелет» и «микроворсинки» были идентифицированы как CC.

Взвешивание атрибута

Процесс очистки данных использовался для удаления избыточных и сильно коррелированных (> 95%) атрибутов. Наконец, моделирование было выполнено на 360 генах. Если атрибуту был присвоен вес> 0.5 с помощью специального алгоритма взвешивания атрибутов, это было сочтено необходимым. Дополнительный материал 7 содержит результаты 10 различных применений алгоритмов взвешивания атрибутов. Таблица 6 суммирует количество алгоритмов взвешивания атрибутов, которые поддерживали выбранные DEG.

Таблица 6 . Результаты различных алгоритмов взвешивания атрибутов подтвердили наиболее важные гены.

Гены-концентраторы валидации в коэкспрессируемых модулях

Метод DT был использован для проверки идентифицированных генов-концентраторов.Таким образом, точность различных моделей была рассчитана и представлена ​​в дополнительном материале 8 с использованием четырех различных критериев, а именно: коэффициент передачи информации, коэффициент передачи информации, индекс Джини и точность. По результатам наивысшей точности (75%) достиг ДТ с критерием коэффициента усиления (таблица 7). DT подтвердил роль ведущих генов в классификации мастита, используя значения экспрессии общих мета-генов.

Таблица 7 . Сравнение точности построенных моделей DT по разным критериям.

Как показано на рисунке 8, поскольку ген LOC407171 расположен в корне построенного дерева, его можно рассматривать как биомаркер мастита. Когда значение гена LOC407171 превышало 8,119, а значение гена SFN превышало 5,291, образцы были классифицированы как имеющие мастит. Если значение гена LOC407171 равно или <8,119, образец считается здоровым. Когда LOC407171 превышало 8,119, SFN было равно или <5.291 и PTPRC был равен или <14,390, образец был классифицирован как здоровый. Кроме того, если последний признак превышает 14,390 и присутствует экспрессия IDh2 , PTPRC будет классифицирован как имеющий мастит.

Рисунок 8 . Модель DT с использованием критерия коэффициента усиления в здоровых образцах и образцах с маститом.

Значимость генов LOC407171, PTPRC, ABCG2 и IDh2 в бирюзовом модуле была подтверждена с использованием моделей DT и взвешивания атрибутов, что подчеркивает их критическую роль в мастите.

Обсуждение

Мастит — серьезное заболевание, в котором участвует множество генов, которые могут взаимодействовать для обогащения определенных сигнальных путей. Мы выполнили мета-анализ данных РНК-seq и транскриптома микроматрицы, чтобы получить полное представление о главных / ключевых генах при мастите, которые могут играть важную роль в ответ на мастит E. coli . Поскольку отдельные исследования имеют ограничения в статистической мощности и воспроизводимости, несколько небольших генов воздействия остаются неизвестными.Метаанализ был предложен в качестве практического подхода к решению этой проблемы (Farhadian et al., 2018b; Sharifi et al., 2018). АД, биологическая регуляция и реакция на стимул, основные термины исследования, обогащенные ГО, были описаны как АД при мастите (Asselstine et al., 2019). Эти слова включают в себя различные виды деятельности, включая пролиферацию клеток, рост клеток, биохимические процессы и сигнальные пути (Long et al., 2001; Arnellos, 2018). Терминология, используемая для описания MF в этом исследовании, такая как связывание, связывание с ионами, связывание с протеином, связывание с актином, связывание катионов и каталитическая активность, ранее была описана в иммунном ответе и транспорте протеина (Swanson et al., 2009; Asselstine et al., 2019).

Обогащающий анализ метаболических путей KEGG был использован для выявления метаболических путей, которые были значительно больше представлены среди 360 общих генов. Было обогащено несколько важных путей, включая пероксисомы и три подкатегории сигнальных путей [путь передачи сигналов интерлейкина 17 (IL-17), путь передачи сигналов рецептора, подобного домену связывания нуклеотидов и олигомеризации (NOD), путь передачи сигналов TNF]. Пероксисомы необходимы для окисления определенных биомолекул и воспалительной реакции на стресс окружающей среды (Trindade Da Rosa, 2016; Su et al., 2019). Было показано, что эпителиальные клетки молочных желез обладают иммунной активностью, активируя сигнальные пути во время мастита (Song et al., 2014). TNF играет роль в различных патологических процессах, включая регуляцию иммунных клеток и модуляцию иммунного ответа (Shah et al., 2012; Gao et al., 2015). NOD-подобный рецептор регулирует иммунные и воспалительные реакции врожденной иммунной системы млекопитающих (Saxena and Yeretssian, 2014). Экспрессия IL-17 в молоке достигала пика через 24-48 ч после заражения патогеном. Эти данные показали, что IL-17 является важным цитокином в развитии мастита молочных коз и играет решающую роль в развитии мастита (Jing et al., 2012). Ранее опубликованные исследования показали, что мастит затрагивает NOD-подобные рецепторы, пути передачи сигналов IL-17 и TNF (Asselstine et al., 2019). В результате их функции мы можем сделать вывод, что эти пути участвуют в ответах иммунной системы на заболевание маститом.

Сети PPI, построенные с использованием Cytoscape, показали, что гены-концентраторы — это PTPRC , SOD2 и STAT1 . В результате эти гены-концентраторы могут влиять на мастит и, таким образом, требуют дальнейшей проверки.Ген PTPRC необходим для передачи сигналов Т- и В-клеточным антигенным рецепторам (Miterski et al., 2002; Porcu et al., 2012). PTPRC — это сильно связанный ген в сетях PPI, который участвует в развитии мастита (Bakhtiarizadeh et al., 2020). SOD2 и IDh2 гены были активированы в молочных железах овец с помощью анализа функционального обогащения (Gao et al., 2018, 2019). SOD2 экспрессия гена увеличилась в ткани молочной железы коров и овец с маститом, вызванным S.aureus и E. coli (Mitterhuemer et al., 2010; Jensen et al., 2013). Кроме того, STAT1 регулирует гены, участвующие в синтезе молочного белка, метаболизме жиров и активации иммунных клеток (Cobanoglu et al., 2006). Анализ общих сетей коэкспрессии мета-генов выявил четыре модуля, два из которых были значимыми. Эти модули были наиболее значимыми в текущем исследовании, основанном на расширенных функциональных терминах, связанных с развитием мастита. Наиболее важные гены коричневого модуля включали PRDX5, RAB5C, ACTN4 и MAPK6 .Ген PRDX5 повсеместно экспрессируется в тканях и защищает клетки от окислительного стресса за счет детоксикации пероксидов (Knoops et al., 2011). PRDX5 , как было показано, играет критическую роль в воспалении у мышей, защищая клетки от окислительного стресса (Argyropoulou et al., 2016). Кроме того, экспрессия гена PRDX5 повышена в овечьем молоке с маститом (Pisanu et al., 2015). RAB5C и MAPK6 Гены были идентифицированы как гены-кандидаты на мастит у молочного скота после интрамаммарной инфекции E.coli или S. uberis с использованием комбинации анализов данных GWAS и DEG (Chen et al., 2015). Ген ACTN4 был идентифицирован как DEG при мастите по сравнению со здоровыми образцами овечьего молока с помощью транскриптомного анализа (Bonnefont et al., 2011). Кроме того, ACTN4 был идентифицирован как центральный ген в модулях, связанных с маститом (Bakhtiarizadeh et al., 2020). С другой стороны, главными генами бирюзового модуля были гены CD53, ARHGEF2 и COL9A1 . CD53 регулирует развитие клеток, и его функция участвует в развитии мастита (Rinaldi et al., 2010). Результаты высокопроизводительного анализа инфицированных молочных желез крупного рогатого скота с помощью E. coli показали важность гена ARHGEF2 (Bagnicka et al., 2021). Ген COL9A1 был задействован в исследованиях, включающих определение областей генома и анализ экспрессии мастита (Lu et al., 2020).

Несколько генов, включая LOC407171, MT2A, LPCAT2, CXCL3, SFN, IDh2 и ABCG2 , были подтверждены как важные гены на основе результатов алгоритма взвешивания атрибутов.Ген LOC407171 связан с врожденным иммунным ответом у мясного скота и был идентифицирован как активированный ген у молочной коровы с маститом E. coli (Li et al., 2019). MT2A играет роль в ответной реакции на стимул в патогенезе коров E. coli у коров в раннем периоде лактации (Cheng et al., 2021). LPCAT2 регулирует метаболизм глицерофосфолипидов у перинатального молочного скота (Bakhtiarizadeh et al., 2020). CXCL3 признан провоспалительным цитокином у дойных коров с экспериментально индуцированным S.aureus клинический мастит (Peralta et al., 2020). SFN , как сообщалось, регулирует развитие клеточного цикла при мастите крупного рогатого скота посредством ассоциации по всему геному (Miles et al., 2021). IDh2 был идентифицирован как ген-кандидат в транскриптоме молока молочного скота, участвующий в врожденном иммунитете, путем анализа путей и сетевого анализа (Banos et al., 2017). ABCG2 Ген , который регулируется молочной железой, отвечает за активную секрецию некоторых соединений в молоко (Otero et al., 2015).

Модель DT определила, что в этом исследовании ген LOC407171 играет решающую роль в развитии мастита. LOC407171 был проверен с использованием алгоритма взвешивания атрибутов и алгоритма машинного обучения. Кроме того, SFN и IDh2 были идентифицированы с использованием взвешивания атрибутов и методов машинного обучения, с IDh2 , подтвержденными с помощью WGCNA. Кроме того, ABCG2 распознается с помощью взвешенных атрибутов, машинного обучения и WGCNA.Кроме того, для подтверждения PTPRC использовались машинное обучение, взвешивание атрибутов, сеть PPI и WGCNA.

Мы изучили возможные изменения в экспрессии генов и связности во время мастита, и пришли к выводу, что гены, участвующие в развитии, пролиферации и дифференцировке клеток молочной железы, а также гены, участвующие в улучшении иммунной системы, в первую очередь были изменены в их выражение.

Заключение

Из-за сложности мастита у молочных животных требуются гораздо более актуальные исследования для определения биомаркеров, связанных с маститом.Результаты текущего исследования на основе метаанализа, WGCNA и подхода машинного обучения позволяют нам внести основной вклад в наше понимание наиболее ценных генов мастита E. coli , которые могут обеспечить более надежную биосигнатуру и, таким образом, служить в качестве надежные кандидаты в биомаркеры в будущих исследованиях. Наше исследование предполагает, что все идентифицированные гены влияют на заболевание маститом через свои функции, связанные с иммунной системой.

Заявление о доступности данных

Оригинальные материалы, представленные в исследовании, включены в статью / дополнительные материалы, дальнейшие запросы можно направить соответствующему автору.

Авторские взносы

NG: концепция и дизайн исследования, анализ и интерпретация данных, автор статьи и окончательное утверждение статьи. JS, SR и KH: написали статью. БП: анализ данных, интерпретация, автор статьи и окончательное утверждение статьи. Все авторы внесли свой вклад в статью и одобрили представленную версию.

Конфликт интересов

Авторы заявляют, что исследование проводилось при отсутствии каких-либо коммерческих или финансовых отношений, которые могут быть истолкованы как потенциальный конфликт интересов.

Примечание издателя

Все утверждения, выраженные в этой статье, принадлежат исключительно авторам и не обязательно отражают претензии их дочерних организаций или издателей, редакторов и рецензентов. Любой продукт, который может быть оценен в этой статье, или заявление, которое может быть сделано его производителем, не подлежат гарантии или одобрению со стороны издателя.

Благодарности

Мы благодарны доктору Мохаммаду Фархадиану и доктору Сане Фархади за их любезную помощь.

Дополнительные материалы

Дополнительные материалы к этой статье можно найти в Интернете по адресу: https://www.frontiersin.org/articles/10.3389/fgene.2021.712306/full#supplementary-material

Список литературы

Андерс, С., Маккарти, Д. Дж., Чен, Ю., Оконевски, М., Смит, Г. К., Хубер, В. и др. (2013). Подсчетный анализ дифференциальной экспрессии данных секвенирования РНК с использованием R и Bioconductor. Nat. Protoc. 8: 1765. DOI: 10.1038 / nprot.2013.099

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Аргиропулу, В., Goemaere, J., Clippe, A., Lefort, C., Tissir, F., Schakman, O., et al. (2016). Пероксиредоксин-5 как новое действующее лицо в подавлении воспалений и опухолей. Free Radic. Биол. Med. 100: S92. DOI: 10.1016 / j.freeradbiomed.2016.10.229

CrossRef Полный текст | Google Scholar

Арнеллос, А. (2018). От организации процессов до организмов и других биологических индивидов. Все течет: навстречу. Процесс. Филон. Биол. 3, 199–221. DOI: 10,1093 / осо / 9780198779636.003.0010

CrossRef Полный текст | Google Scholar

Ассельстин В., Мильор Ф., Суарес-Вега А., Фонсека П., Маллард Б., Карроу Н. и др. (2019). Генетические механизмы, регулирующие реакцию хозяина при мастите. J. Dairy Sci. 102, 9043–9059. DOI: 10.3168 / jds.2019-16504

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Багницка Э., Кавецка-Грохоцка Э., Павлина-Тышко К., Залевска М., Капуста А., Костючук Э. и др.(2021 г.). Профиль экспрессии микроРНК в паренхиме молочной железы крупного рогатого скота, инфицированной коагулазоположительными или коагулазонегативными стафилококками. Вет. Res. 52, 1–20. DOI: 10.1186 / s13567-021-00912-2

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Бахтиаризаде, М. Р., Мирзаей, С., Норузи, М., Шейбани, Н., и Вафаэи Сади, М. С. (2020). Идентификация генных модулей и узловых генов, участвующих в развитии мастита, с использованием подхода системной биологии. Фронт.Genet. 11: 722. DOI: 10.3389 / fgene.2020.00722

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Банос, Дж., Брамис, Дж., Буш, С., Кларк, Э., Маккулок, М., Смит, Дж. И др. (2017). Геномная архитектура устойчивости к маститу у молочных овец. BMC Genom. 18, 1–18. DOI: 10.1186 / s12864-017-3982-1

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Бенджамини Ю. и Хохберг Ю. (1995). Контроль уровня ложного обнаружения: практичный и эффективный подход к множественному тестированию. Дж. Рой. Статистика. Soc. Серия B 57, 289–300. DOI: 10.1111 / j.2517-6161.1995.tb02031.x

CrossRef Полный текст | Google Scholar

Блюм, С. Е., Голдстоун, Р. Дж., Коннолли, Дж. П., Реперан-Фертер, М., Жермон, П., Инглис, Н. Ф. и др. (2018). Постгеномическая характеристика важной генетической детерминанты патогенной Escherichia coli молочной железы. МБио 9:18. DOI: 10.1128 / mBio.00423-18

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Болстад, Б.М., Иризарри, Р. А., Остранд, М., и Спид, Т. П. (2003). Сравнение методов нормализации для данных массива олигонуклеотидов высокой плотности на основе дисперсии и систематической ошибки. Биоинформатика 19, 185–193. DOI: 10.1093 / биоинформатика / 19.2.185

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Боннефонт, К. М., Туфер, М., Каубет, К., Фулон, Э., Таска, К., Аурел, М.-Р. и др. (2011). Транскриптомный анализ соматических клеток молока у устойчивых к маститу и восприимчивых овец при заражении Staphylococcus epidermidis и Staphylococcus aureus. BMC Genom. 12, 1–16. DOI: 10.1186 / 1471-2164-12-208

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Botía, J. A., Vandrovcova, J., Forabosco, P., Guelfi, S., D’sa, K., Hardy, J., et al. (2017). Дополнительный этап кластеризации k-средних улучшает биологические характеристики сетей коэкспрессии генов WGCNA. BMC Syst. Биол. 11, 1–16. DOI: 10.1186 / s12918-017-0420-6

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Бренд

, Б., Hartmann, A., Repsilber, D., Griesbeck-Zilch, B., Wellnitz, O., Kühn, C., et al. (2011). Сравнительное профилирование экспрессии E. coli и S. aureus инокулированных первичных клеток молочной железы, взятых у коров с различной генетической предрасположенностью для оценки соматических клеток. Gene. Выбирать. Evol. 43, 1–17. DOI: 10.1186 / 1297-9686-43-24

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Buitenhuis, B., Røntved, C.M., Edwards, S.M., Ingvartsen, K. L., and Sørensen, P.(2011). Углубленный анализ генов и путей молочной железы, вовлеченных в патогенез крупного рогатого скота, вызывающего Escherichia coli-мастит. BMC Genom. 12, 1–10. DOI: 10.1186 / 1471-2164-12-130

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Бурвенич, К., Ван Меррис, В., Мехрзад, Дж., Диец-Фрайле, А., и Дюшато, Л. (2003). Тяжесть мастита E. coli в основном определяется коровьими факторами. Veterinary Res. 34, 521–564. DOI: 10.1051 / ветрес: 2003023

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Cebron, N., Maman, S., Walachowski, S., Gausserès, B., Cunha, P., Rainard, P., et al. (2020). Связанный с Th27 иммунитет молочной железы, но не высокий системный иммунный ответ Th2, связан с защитой от мастита E. coli. Вакцины NPJ 5, 1–13. DOI: 10.1038 / s41541-020-00258-4

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Чен, X., Cheng, Z., Чжан, С., Верлинг, Д., и Уотес, Д. К. (2015). Сочетание полногеномных ассоциативных исследований и анализа данных дифференциальной экспрессии позволяет идентифицировать гены-кандидаты, влияющие на мастит, вызванный двумя разными патогенами у дойной коровы. Откройте J. Anim. Sci. 5, 358–393. DOI: 10.4236 / ojas.2015.54040

CrossRef Полный текст | Google Scholar

Cheng, Z., Buggiotti, L., Salavati, M., Marchitelli, C., Palma-Vera, S., Wylie, A., et al. (2021 г.). Глобальные транскриптомные профили циркулирующих лейкоцитов у коров в раннем периоде лактации с клиническим или субклиническим маститом .DOI: 10.21203 / rs.3.rs-204708 / v1

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Кобаноглу, О., Зайтун, И., Чанг, Ю., Шук, Г., и Хатиб, Х. (2006). Влияние преобразователя сигнала и активатора гена транскрипции 1 (STAT1) на показатели молочной продуктивности голштинского молочного скота. J. Dairy Sci. 89, 4433–4437. DOI: 10.3168 / jds.S0022-0302 (06) 72491-2

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Комптон, К. У., Курсонс, Р. Т., Барнет, К. М., и Макдугалл, С. (2009). Выражение факторов врожденной резистентности в секреции молочных желез от родильных телок и их связь с последующим инфекционным статусом. Вет. Иммунол. Immunopathol. 127, 357–364. DOI: 10.1016 / j.vetimm.2008.10.331

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Деннис, Г., Шерман, Б. Т., Хосак, Д. А., Янг, Дж., Гао, В., Лейн, Х. С. и др. (2003). DAVID: база данных для аннотаций, визуализации и интегрированного обнаружения. Genome Biol. 4, 1–11. DOI: 10.1186 / GB-2003-4-9-r60

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Дуарте, К. М., Фрейтас, П. П., и Бексига, Р. (2015). Технологические достижения в диагностике мастита крупного рогатого скота: обзор. J. Vet. Диаг. Расследование. 27, 665–672. DOI: 10.1177 / 1040638715603087

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Эбрахими, М., Лакизаде, А., Ага-Голзаде, П., Эбрахими, Э., и Эбрахими, М.(2011). Прогнозирование термостабильности на основе атрибутов аминокислот путем сочетания кластеризации с взвешиванием атрибутов: новая перспектива в инженерии ферментов. PLoS ONE 6: e23146. DOI: 10.1371 / journal.pone.0023146

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Эбрахими, М., Эсмаили, Ф., Чераги, С., Хушманд, Ф., Шабани, Л., и Эбрахими, Э. (2014). Эффективное и простое производство инсулин-продуцирующих клеток из стволовых клеток эмбриональной карциномы с использованием экстракта поджелудочной железы новорожденных мышей в качестве естественного индуктора. PLoS ONE 9: e. DOI: 10.1371 / journal.pone.00

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Фархадян М., Рафат С. А., Хасанпур К., Эбрахими М. и Эбрахими Э. (2018a). Межвидовой мета-анализ транскриптомных данных в сочетании с моделями контролируемого машинного обучения позволяет выявить общую генную сигнатуру процесса лактации. Фронт. Genet. 9: 235. DOI: 10.3389 / fgene.2018.00235

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Фархадян, М., Рафат, С.А., Хасанпур, К., Эбрахими, Э. (2018b). Сигнатура транскриптома процесса лактации, идентифицированная метаанализом микрочипов и данных RNA-Seq. BioTechnologia. J. Biotechnol. Comput. Биол. Bionanotechnol. 99: 75659. DOI: 10.5114 / bta.2018.75659

CrossRef Полный текст | Google Scholar

Фархадян М., Рафат С.А., Панахи Б. и Эбрахими Э. (2020). Сигнатура транскриптома двух стадий лактации у овец Ghezel идентифицируется с помощью секвенирования РНК. Anim. Biotechnol. 20, 1–11. DOI: 10.1080 / 10495398.2020.1784185

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Фархадян М., Рафат С.А., Панахи Б. и Маяк К. (2021 г.). Сетевой анализ взвешенной коэкспрессии генов определяет модули и функционально обогащенные пути в процессе лактации. Sci. Реп. 11, 1–15. DOI: 10.1038 / s41598-021-97893-1

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Гао, Дж., Ли, Т., Лу, З., Ван, X., Чжао, X., и Ма, Ю. (2019). Протеомный анализ молочных желез дает представление о механизмах иммунитета и метаболизма, связанных с клиническим маститом у мясных овец. Животные 9: 309. DOI: 10.3390 / ani

09

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Гао, Ю., Тенг, С.С., Мах, В.-К., и Ли, К.Г. (2015). Силибинин подавляет FAT10 и модулирует TNF-α / IFN-γ хромосомную нестабильность и чувствительность к апоптозу. Biol. Открыть 4, 961–969. DOI: 10.1242 / bio.011189

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Гао, Дж., Ма, Ю., Ли, Т., Лу, З., Чен, К., и Чжао, X. (2018). Экспрессия и локализация гена SOD2 в ткани груди овец с клиническим маститом (Ovis aries). J. Agric. Биотехнология . 26, 246–252. https://pubmed.ncbi.nlm.nih.gov/12154050/

Google Scholar

Геласакис, А., Мавроджанни, В., Петридис, И., Василеу, Н., и Фтенакис, Г. (2015). Мастит у овец — последние 10 лет и будущее исследований. Вет. Microbiol. 181, 136–146. DOI: 10.1016 / j.vetmic.2015.07.009

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Голдман, Б., Ниерман, В., Кайзер, Д., Слейтер, С., Дуркин, А.С., Эйзен, Дж. А. и др. (2006). Эволюция сенсорной сложности, зафиксированная в геноме миксобактерий. Proc. Nat. Акад. Sci. 103, 15200–15205. DOI: 10.1073 / pnas.0607335103

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Горджи, А.Э., Роудбари, З., Садеги, Б., Джавадманеш, А., и Садковски, Т. (2019). Транскриптомный анализ промоторных областей обнаруживает генные сети, связанные с маститом у крупного рогатого скота. Microb. Патог. 137: 103801. DOI: 10.1016 / j.micpath.2019.103801

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Günther, J., Esch, K., Poschadel, N., Petzl, W., Zerbe, H., Mitterhuemer, S., et al. (2011). Сравнительная кинетика активации Escherichia coli и Staphylococcus aureus ключевых иммунных путей в эпителиальных клетках молочной железы показывает, что S.aureus вызывает замедленный ответ, в котором преобладает интерлейкин-6 (IL-6), но не IL-1A или фактор некроза опухоли альфа. Заражение. Иммун. 79, 695–707. DOI: 10.1128 / IAI.01071-10

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Günther, J., Petzl, W., Zerbe, H., Schuberth, H.-J., Koczan, D., Goetze, L., et al. (2012). Прайминг липополисахаридов усиливает экспрессию эффекторов иммунной защиты при одновременном снижении экспрессии провоспалительных цитокинов в клетках эпителия молочной железы коров. BMC Genom. 13, 1–13. DOI: 10.1186 / 1471-2164-13-17

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Хайдич, А.-Б. (2010). Метаанализ в медицинских исследованиях. Гиппократия 14, 29.

Google Scholar

Йенсен К., Гюнтер Дж., Талбот Р., Петцл В., Зербе Х., Шуберт Х.-Дж. и др. (2013). Мастит, вызванный Escherichia coli и золотистым стафилококком, по-разному модулирует транскрипционные реакции в соседних неинфицированных четвертях молочной железы крупного рогатого скота. BMC Genom. 14, 1–19. DOI: 10.1186 / 1471-2164-14-36

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Jing, X., Zhao, Y., Shang, C., Yao, Y., Tian, ​​T., Li, J., et al. (2012). Динамика цитокинов, связанных с продуцирующими IL-17 клетками в сыворотке и молоке при мастите экспериментального заражения Staphylococcus aureus и Escherichia coli у молочных коз. J. Anim. Ветеринар. Adv. 11, 475–479. DOI: 10.3923 / javaa.2012.475.479

CrossRef Полный текст | Google Scholar

Ким, Д., Пертеа, Г., Трапнелл, К., Пиментел, Х., Келли, Р., и Зальцберг, С. Л. (2013). TopHat2: точное выравнивание транскриптомов при наличии вставок, делеций и слияний генов. Genome Biol. 14, 1–13. DOI: 10.1186 / GB-2013-14-4-r36

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Knoops, B., Goemaere, J., Van Der Eecken, V., and Declercq, J.-P. (2011). Пероксиредоксин 5: структура, механизм и функция атипичного 2-Cys пероксиредоксина млекопитающих. Антиоксид. Редокс-сигнал. 15, 817–829. DOI: 10.1089 / ars.2010.3584

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Лай, Ю.-К., Фудзикава, Т., Маэмура, Т., Андо, Т., Китахара, Г., Эндо, Ю., и др. (2017). На уровень экспрессии связанных с воспалением микроРНК в коровьем молоке влияет мастит. PLoS ONE 12: e0177182. DOI: 10.1371 / journal.pone.0177182

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Ли, Л., Чен, X., и Chen, Z. (2019). Идентификация ключевых генов-кандидатов у молочных коров в ответ на мастит, вызванный Escherichia coli, с помощью биоинформатического анализа. Фронт. Genet. 10: 1251. DOI: 10.3389 / fgene.2019.01251

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Long, E., Capuco, A., Wood, D., Sonstegard, T., Tomita, G., Paape, M., et al. (2001). Escherichia coli вызывает апоптоз и пролиферацию клеток молочной железы. Cell Death Differ. 8, 808–816.DOI: 10.1038 / sj.cdd.4400878

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Лав, М. И., Хубер, В., и Андерс, С. (2014). Умеренная оценка кратного изменения и дисперсии данных RNA-seq с помощью DESeq2. Genome Biol. 15, 1–21. DOI: 10.1186 / s13059-014-0550-8

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Лу, X., Дуань, А., Лян, С., Ма, X., и Дэн, Т. (2020). Геномная идентификация, эволюция и анализ экспрессии семейства генов коллагена у водяных буйволов во время лактации. Гены 11: 515. DOI: 10.3390 / genes11050515

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Майлз, А. М., Посберг, К. Дж., И Хьюсон, Х. Дж. (2021 г.). Прямое фенотипирование и анализ основных компонентов типовых признаков указывают на наличие нового QTL в мастите крупного рогатого скота через общегеномную ассоциацию. Животные 11: 1147. DOI: 10.3390 / ani11041147

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Митерский, Б., Зиндерн, Э., Хаупц, М., Шимригк, С., Эпплен, Дж. Т. (2002). PTPRC (CD45) не связан с рассеянным склерозом у большой группы немецких пациентов. BMC Med. Genet. 3, 1–3. DOI: 10.1186 / 1471-2350-3-3

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Mitterhuemer, S., Petzl, W., Krebs, S., Mehne, D., Klanner, A., Wolf, E., et al. (2010). Инфекция Escherichia coli вызывает различные локальные и системные ответы транскриптома в молочной железе. BMC Genom. 11, 1–16. DOI: 10.1186 / 1471-2164-11-138

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Мойес, К., Соренсен, П., и Бионаз, М. (2016). Влияние интрамаммарного заражения Escherichia coli на транскриптом печени и молочной железы и перекрестные помехи у дойных коров во время ранней лактации с использованием RNAseq. PLoS ONE 11: e0157480. DOI: 10.1371 / journal.pone.0157480

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Отеро, Дж., Баррера, Б., Де Ла Фуэнте, А., Прието, Дж., Маркес, М., Альварес, А. и др. (2015). Полиморфизм увеличения функции Y581S транспортера ABCG2 увеличивает секрецию в молоко данофлоксацина в терапевтической дозе для лечения мастита. J. Dairy Sci. 98, 312–317. DOI: 10.3168 / jds.2014-8288

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Панахи Б., Фархадиан М. и Хиджази М. А. (2020). Подход системной биологии определяет функциональные модули и регуляторные центры, связанные с накоплением вторичных метаболитов после перехода микроводорослей от автотрофных к гетеротрофным условиям роста. PLoS ONE 15: e0225677. DOI: 10.1371 / journal.pone.0225677

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Панахи Б., Фрахадиан М., Дамс Дж. Т. и Хиджази М. А. (2019a). Интеграция межвидового мета-анализа RNA-Seq и моделей машинного обучения позволяет определить наиболее важные пути реакции на солевой стресс у микроводоросли Dunaliella. Фронт. Genet. 10: 752. DOI: 10.3389 / fgene.2019.00752

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Панахи, Б., и Хиджази, М.А. (2021 г.). Анализ сети взвешенной коэкспрессии генов чувствительных к соли транскриптомов выявил новые гены-концентраторы у зеленых галофитных микроводорослей Dunaliella salina. Sci. Реп. 11, 1–11. DOI: 10.1038 / s41598-020-80945-3

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Панахи Б., Мохаммади С. А. и Дулати-Банех Х. (2019b). Характеристика сортов иранской виноградной лозы с использованием моделей машинного обучения. Продолжить. Nat. Акад.Sci. Индия, секта. В: Биол. Sci. 19, 1–7. DOI: 10.1007 / s40011-019-01131-8

CrossRef Полный текст | Google Scholar

Перальта, О., Карраско, К., Вейтес, К., Тамайо, М., Муньос, И., Сепульведа, С., и др. (2020). Безопасность и эффективность интрамаммарной терапии мезенхимальными стволовыми клетками у дойных коров с экспериментально вызванным клиническим маститом Staphylococcus aureus. Sci. Реп. 10, 1–12. DOI: 10.1038 / s41598-020-59724-7

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Писану, С., Cubeddu, T., Pagnozzi, D., Rocca, S., Cacciotto, C., Alberti, A., et al. (2015). Внеклеточные ловушки нейтрофилов при мастите овец. Вет. Res. 46, 1–14. DOI: 10.1186 / s13567-015-0196-x

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Porcu, M., Kleppe, M., Gianfelici, V., Geerdens, E., De Keersmaecker, K., Tartaglia, M., et al. (2012). Мутация рецептора тирозинфосфатазы PTPRC (CD45) при Т-клеточном остром лимфобластном лейкозе. Кровь 119, 4476–4479.DOI: 10.1182 / кровь-2011-09-379958

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Родс Д. Р., Барретт Т. Р., Рубин М. А., Гош Д. и Чиннайян А. М. (2002). Мета-анализ микроматриц: межисследовательская проверка профилей экспрессии генов выявляет нарушение регуляции пути при раке простаты. Cancer Res. 62, 4427–4433. https://pubmed.ncbi.nlm.nih.gov/12154050/

PubMed Аннотация | Google Scholar

Ринальди М., Ли Р.W., Bannerman, D. D., Daniels, K. M., Evock-Clover, C., Silva, M. V., et al. (2010). Контрольная функция тканей сосков у дойных коров: доминантные элементы врожденного иммунного ответа определяют ранний ответ на мастит, вызванный E. coli . Функц. Интегрировать. Геном. 10, 21–38. DOI: 10.1007 / s10142-009-0133-z

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Шах Н., Дхар Д., Мохаммед Ф. Э. З., Хабтезион А., Дэвис Н. А., Джовер-Кобос М. и др. (2012).Предотвращение острого повреждения почек на модели цирроза на грызунах после селективной деконтаминации кишечника связано со снижением экспрессии TLR4 в почках. J. Hepatol. 56, 1047–1053. DOI: 10.1016 / j.jhep.2011.11.024

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Шеннон П., Маркиел А., Озьер О., Балига Н. С., Ван Дж. Т., Рэймидж Д. и др. (2003). Cytoscape: программная среда для интегрированных моделей сетей биомолекулярного взаимодействия. Genome Res. 13, 2498–2504. DOI: 10.1101 / gr.1239303

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Шарифи С., Пакдел А., Эбрахими М., Риси Дж. М., Фазели Фарсани С. и Эбрахими Э. (2018). Интеграция машинного обучения и метаанализа позволяет определить транскриптомную биосигнатуру мастита у крупного рогатого скота. PLoS ONE 13: e01. DOI: 10.1371 / journal.pone.01

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Сипка, А., Клаессиг, С., Дюамель, Г. Э., Свинкелс, Дж., Райнард, П., и Шуккен, Ю. (2014). Влияние интрамаммарного лечения на профили экспрессии генов у крупного рогатого скота. Escherichia coli мастит. PLoS ONE 9: e85579. DOI: 10.1371 / journal.pone.0085579

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Смит Г. К., Ричи М., Торн Н. и Веттенхолл Дж. (2005). LIMMA: линейные модели для данных микрочипов. в биоинформатике и решениях вычислительной биологии с использованием R и биокондуктора. Stat. Биол. Здоровье 62:23. DOI: 10.1007 / 0-387-29362-0_23

CrossRef Полный текст | Google Scholar

Сун, X., Го, М., Ван, Т., Ван, В., Цао, Ю., и Чжан, Н. (2014). Генипозид подавлял индуцированный липополисахаридом апоптоз, модулируя TLR4 и факторы, связанные с апоптозом, в молочных железах мышей. Life Sci. 119, 9–17. DOI: 10.1016 / j.lfs.2014.10.006

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Су, Т., Ли, В., Ван П. и Ма К. (2019). Динамика гомеостаза пероксисом и его роль в стрессовой реакции и передаче сигналов у растений. Фронт. Plant Sci. 10: 705. DOI: 10.3389 / fpls.2019.00705

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Суонсон, К., Стелваген, К., Добсон, Дж., Хендерсон, Х., Дэвис, С., Фарр, В. и др. (2009). Профилирование транскриптома мастита, вызванного Streptococcus uberis, выявляет фундаментальные различия между экспрессией иммунных генов в молочной железе и в модели первичной клеточной культуры. J. Dairy Sci. 92, 117–129. DOI: 10.3168 / jds.2008-1382

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Шкларчик, Д., Франческини, А., Вайдер, С., Форслунд, К., Хеллер, Д., Уэрта-Сепас, Дж. И др. (2015). СТРОКА v10: сети белок-белкового взаимодействия, интегрированные в древо жизни. Nucleic Acids Res. 43, D447 – D452. DOI: 10.1093 / nar / gku1003

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Такэсима, С., Мацумото Ю., Чен Дж., Йошида Т., Мукояма Х. и Аида Ю. (2008). Доказательства преимущества гетерозиготного гена DQA1 класса II главного комплекса гистосовместимости крупного рогатого скота (BoLA) против клинического мастита, вызванного видами Streptococci и Escherichia. Тканевые антигены 72, 525–531. DOI: 10.1111 / j.1399-0039.2008.01140.x

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Trapnell, C., Roberts, A., Goff, L., Pertea, G., Kim, D., Kelley, D. R., et al. (2012).Анализ дифференциальной экспрессии генов и транскриптов в экспериментах с последовательностью РНК с TopHat и Cufflinks. Nat. Protoc. 7, 562. DOI: 10.1038 / nprot.2012.016

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Триндади да Роса, Ф. (2016). Роль гамма-рецепторов, активируемых пролифератором пероксисом, в профилактике / лечении мастита. Обзор 54 (8): 2460–2470. DOI: 10.2337 / диабет.54.8.2460

PubMed Аннотация | CrossRef Полный текст

Ценг, Г.К., Гош, Д., Фейнголд, Э. (2012). Всесторонний обзор литературы и статистические соображения по метаанализу микрочипов. Nucleic Acids Res. 40, 3785–3799. DOI: 10.1093 / nar / gkr1265

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Vangroenweghe, F., Duchateau, L., Boutet, P., Lekeux, P., Rainard, P., Paape, M., et al. (2005). Эффект лечения карпрофеном после экспериментально индуцированного мастита Escherichia coli у первородящих коров. J. Dairy Sci. 88, 2361–2376. DOI: 10.3168 / jds.S0022-0302 (05) 72914-3

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Васудеван П., Наир М. К. М., Аннамалай Т. и Венкитанараянан К. С. (2003). Фенотипическая и генотипическая характеристика изолятов мастита крупного рогатого скота Staphylococcus aureus для образования биопленок. Вет. Microbiol. 92, 179–185. DOI: 10.1016 / S0378-1135 (02) 00360-7

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Ван Х., Кан, Д. Д., Шен, К., Сонг, К., Лу, С., Чанг, Л.-К., и др. (2012). Пакет R для метаанализа микрочипов в целях контроля качества, анализа дифференциально экспрессируемых генов и обнаружения обогащения путей. Биоинформатика 28, 2534–2536. DOI: 10.1093 / биоинформатика / bts485

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Приложения облачных вычислений для биомедицинской науки: перспектива

Abstract

Биомедицинские исследования превратились в дело, требующее больших объемов цифровых данных, в основе которого лежат безопасные и масштабируемые вычисления, хранилище и сетевая инфраструктура, которые традиционно приобретаются, поддерживаются и обслуживаются на местном уровне.Для определенных типов биомедицинских приложений облачные вычисления стали альтернативой традиционным подходам к локальным вычислениям. Облачные вычисления предлагают пользователям доступ с оплатой по мере использования к таким сервисам, как аппаратная инфраструктура, платформы и программное обеспечение, для решения общих задач биомедицинских вычислений. Услуги облачных вычислений предлагают безопасное хранение и анализ данных по запросу и отличаются от традиционных высокопроизводительных вычислений своей быстрой доступностью и масштабируемостью услуг.Таким образом, облачные сервисы предназначены для решения проблем с большими данными и повышения вероятности обмена данными и аналитическими данными, воспроизводимости и повторного использования. Здесь мы даем вводный взгляд на облачные вычисления, чтобы помочь читателю определить их ценность для собственных исследований.

Образец цитирования: Navale V, Bourne PE (2018) Приложения облачных вычислений для биомедицинской науки: перспектива. PLoS Comput Biol 14 (6): e1006144. https://doi.org/10.1371/journal.pcbi.1006144

Редактор: Francis Ouellette, Genome Quebec, CANADA

Опубликовано: 14 июня 2018 г.

Это статья в открытом доступе, свободная от всех авторских прав, и ее можно свободно воспроизводить, распространять, передавать, модифицированы, созданы на основе или иным образом использованы кем-либо в любых законных целях. Работа сделана доступной по лицензии Creative Commons CC0 как общественное достояние.

Финансирование: Авторы не получали специального финансирования для этой статьи.

Конкурирующие интересы: Авторы заявили, что никаких конкурирующих интересов не существует.

Введение

Прогресс в биомедицинских исследованиях все в большей степени определяется знаниями, полученными в результате анализа и интерпретации больших и сложных наборов данных. Поскольку способность генерировать и проверять гипотезы с использованием высокопроизводительных технологий стала технически более осуществимой и даже обычной, задача получения полезных знаний сместилась с мокрого стенда на компьютер.Настольные компьютеры, высокопроизводительные рабочие станции и высокопроизводительные вычислительные системы (кластеры HPC) в настоящее время являются рабочими лошадками в исследованиях биомедицинских цифровых данных. Однако в последнее время облачные вычисления, которые стали возможными благодаря широкому распространению и расширению возможностей Интернета и обусловлены потребностями рынка, превратились в мощный, гибкий и масштабируемый подход к разрозненным вычислительным задачам и проблемам, связанным с большими объемами данных. Национальный институт стандартов и технологий (NIST) сообщает следующее:

Облачные вычисления — это модель для обеспечения удобного сетевого доступа по требованию к общему пулу конфигурируемых вычислительных ресурсов (например,g., сети, серверы, приложения и службы хранения), которые могут быть быстро предоставлены и выпущены с минимальными усилиями по управлению или взаимодействию с поставщиком услуг.

NIST разделяет облака на один из четырех типов: общедоступные, частные, коллективные и гибридные. В общедоступном облаке инфраструктура существует на территории поставщика облачных услуг и управляется поставщиком облака, тогда как в частном облаке инфраструктура может существовать на территории поставщика облачных услуг или за ее пределами, но управляется частной организацией.Примеры общедоступных облаков включают Amazon Web Services (AWS), Google Cloud Platform (GCP) и Microsoft Azure. Облако сообщества — это совместная работа, при которой инфраструктура совместно используется несколькими организациями — конкретным сообществом — у которых есть общие требования к безопасности и соответствию требованиям. Например, Федеральная программа управления рисками и авторизацией (FedRAMP) — это общегосударственная программа США, которая обеспечивает стандартизированный подход к оценке безопасности, авторизации и непрерывному мониторингу инфраструктуры информационных технологий (ИТ) [1].AWS GovCloud является примером ресурса, аккредитованного FedRAMP, который работает как облако сообщества, отвечающее потребностям сообщества правительства США. Jettream Cloud [2] служит облаком сообщества, обслуживающим научное сообщество. Гибридное облако представляет собой композицию из 2 или более отдельных облачных инфраструктур — частной, общественной и общедоступной — которые остаются уникальными объектами, но связаны вместе таким образом, чтобы обеспечить переносимость данных и программных приложений [3].

Типы облаков, описанные выше, могут использовать одну или несколько облачных служб: «Программное обеспечение как услуга» (SaaS), «Платформа как услуга» (PaaS) и «Инфраструктура как услуга» (IaaS).SaaS позволяет потребителю использовать приложения поставщика облачных услуг (например, Google Docs), которые работают в инфраструктуре поставщика облачных услуг, тогда как PaaS позволяет потребителям создавать или приобретать приложения и инструменты и развертывать их в инфраструктуре поставщика облачных услуг. IaaS позволяет потребителю выделять ресурсы обработки, хранения, сети и другие основные вычислительные ресурсы. Большинство поставщиков общедоступных облаков, таких как AWS, GCP и Microsoft Azure, предоставляют IaaS, PaaS и SaaS, и заказчик может выбрать наиболее подходящее решение для своих индивидуальных потребностей.

Внедрение облака, независимо от типа, варьируется в зависимости от отрасли из-за разных уровней безопасности и других функций, необходимых для работы. Раньше как государственные, так и частные облака больше использовались в нерегулируемых отраслях и в меньшей степени в регулируемых отраслях, но сейчас ситуация меняется [4]. Наборы научных данных, финансируемых из федерального бюджета, становятся доступными в публичных облаках [5]. Например, данные Проекта микробиома человека (HMP), финансируемого Национальными институтами здравоохранения (NIH), доступны в сервисе простого хранения AWS (S3) [6], и все больше наборов биомедицинских данных становится доступным в облаке.Исследователи теперь могут запрашивать разрешение у Национального института здоровья на передачу контролируемых геномных и связанных фенотипических данных, полученных из репозиториев данных, назначенных Национальным институтом здравоохранения, в общедоступные или частные облачные системы для хранения и анализа данных [7]. При условии надлежащего контроля доступа к данным людей, NIH стремится сделать публичный доступ к цифровым данным стандартом для всех исследований, финансируемых NIH [8].

Прогресс в биологических масштабах, от инструментов для секвенирования до устройств для мониторинга состояния здоровья, коллекций изображений и расширения платформ электронных медицинских карт (EHR), приведет к снижению затрат на получение данных.По оценкам, в 2016 году только Национальный институт здравоохранения поддерживал 650 петабайт (ПБ) данных в различных институциональных репозиториях. Как объем, так и сложность биомедицинских данных значительно увеличатся в ближайшие годы, что создаст проблемы для хранения, управления и сохранности, что предполагает более широкое использование облачных вычислений. Биомедицинские исследования могут извлечь выгоду из растущего числа облачных инструментов и платформ для работы с большими данными, которые разрабатываются и совершенствуются для других отраслей.

Принятие облака для биомедицинской работы

Рассмотрим примеры того, как облака и облачные сервисы были развернуты в биомедицинской работе (Таблица 1).Только в геномике использование варьируется от отдельных приложений до полных виртуальных машин с несколькими приложениями. Дополнительная информация об облачных ресурсах в биоинформатике была предоставлена ​​ранее [9].

Индивидуальные инструменты

BLAST [10] — один из наиболее часто используемых инструментов в исследованиях биоинформатики. Образ сервера BLAST можно разместить в общедоступных облаках AWS, Azure и GCP, чтобы пользователи могли выполнять автономный поиск с помощью BLAST. Пользователи также могут отправлять запросы с помощью BLAST через интерфейс прикладного программирования (API) Национального центра биотехнологической информации (NCBI) для запуска на AWS и Google Compute Engine [11].Кроме того, платформу Microsoft Azure можно использовать для выполнения больших задач сопоставления последовательности BLAST в разумные сроки. Azure позволяет пользователям загружать базы данных последовательностей из NCBI, запускать различные программы BLAST на указанном входе в отношении баз данных последовательностей и создавать визуализации на основе результатов для удобного анализа. Azure также предоставляет способ создания пользовательского веб-интерфейса для планирования и отслеживания задач сопоставления BLAST, визуализации результатов, управления пользователями и выполнения основных задач [12].

CloudAligner — это быстрый и полнофункциональный инструмент на основе MapReduce для сопоставления последовательностей, предназначенный для работы с длинными последовательностями [13], тогда как CloudBurst [14] может обеспечить высокочувствительное сопоставление короткого чтения с помощью MapReduce. Высокопроизводительный анализ секвенирования может быть выполнен с помощью пакета Eoulsan, интегрированного в облачную среду IaaS [15]. Для анализа повторного секвенирования всего генома Crossbow [16] представляет собой масштабируемый программный конвейер. Crossbow объединяет Bowtie, сверхбыстрый и эффективный с точки зрения памяти выравниватель короткого чтения, и SoapSNP, генотипер, в автоматическом параллельном конвейере, который может работать в облаке.

Рабочие процессы и платформы

Интеграция генотипа, фенотипа и клинических данных важна для биомедицинских исследований. Биомедицинские платформы могут предоставить среду для создания сквозного конвейера для сбора, хранения и анализа данных.

Galaxy, веб-платформа с открытым исходным кодом, используется для биомедицинских исследований с большим объемом данных [17]. Для крупномасштабного анализа данных Galaxy можно разместить в облачной IaaS (см. Руководство [18]). Надежные и хорошо масштабируемые облачные системы рабочих процессов для анализа секвенирования нового поколения были достигнуты путем интеграции системы рабочих процессов Galaxy с Globus Provision [19].

Bionimbus Protected Data Cloud (BPDC) — это частная облачная инфраструктура для управления, анализа и обмена большими объемами геномных и фенотипических данных в защищенной среде, которая использовалась для исследований слияния генов [20]. BPDC в основном основан на OpenStack, программном обеспечении с открытым исходным кодом, которое предоставляет инструменты для создания облачных платформ [21], с сервисным порталом для единой точки входа и единым входом для различных доступных ресурсов BPDC. Используя BPDC, был быстро проведен анализ данных для проекта ресеквенирования острого миелоидного лейкоза (AML) для выявления соматических вариантов, выраженных в образцах первичного AML неблагоприятного риска [22].

Масштабируемая и надежная инфраструктура для анализа секвенирования следующего поколения (NGS) необходима для диагностической работы в клинических лабораториях. CloudMan доступен в облачной инфраструктуре AWS [23]. Он использовался в качестве платформы для распространения инструментов, данных и результатов анализа. Усовершенствования в использовании CloudMan для анализа генетических вариантов были осуществлены за счет снижения затрат на хранение для работы по клиническому анализу [24].

В рамках Панорамного анализа полных геномов рака (PCAWG) были изучены общие закономерности мутаций в более чем 2800 последовательностях полногенома рака, что потребовало значительных научных вычислительных ресурсов для исследования роли некодирующих частей генома рака и для сравнения геномы опухолевых и нормальных клеток [25].Координационный центр данных PCAWG в настоящее время перечисляет соглашения о сотрудничестве с облачным провайдером AWS и Cancer Collaboratory [26], академическим вычислительным облачным ресурсом, поддерживаемым Институтом исследований рака Онтарио и размещенным в офисе Compute Canada.

Были использованы многочисленные академические ресурсы для завершения анализа 1827 образцов, занявшего более 6 месяцев. Это было дополнено использованием облачных ресурсов, где за 6 недель AWS проанализировало 500 образцов [27]. Это показало, что ресурсы общедоступного облака могут быть быстро выделены для быстрого масштабирования проекта, если требуется увеличение вычислительных ресурсов.В этом случае хранилище данных AWS S3 использовалось для масштабирования с 600 терабайт до нескольких ПБ. Необработанные чтения, выравнивание генома, метаданные и тщательно отобранные данные также могут быть постепенно загружены в AWS S3 для быстрого доступа сообществу исследователей рака. Инструменты поиска и доступа к данным также доступны другим исследователям для использования или повторного использования. Данные уровня последовательностей чтения и данные зародышевой линии хранятся на контролируемом уровне облака, а для доступа к данным чтения требуется предварительное одобрение из отдела контроля доступа к данным Международного консорциума генома рака (ICGC).

Национальный институт рака (NCI) профинансировал 3 пилотных проекта облачных вычислений для обеспечения геномного анализа, вычислительной поддержки и возможностей доступа к данным Атласа генома рака (TCGA) [28]. Целью пилотных проектов была разработка масштабируемой платформы для облегчения сотрудничества в исследованиях и повторного использования данных. Все три пилотных проекта облачных вычислений получили авторитетные и согласованные эталонные наборы данных от сообщества Genomic Data Commons (GDC) [29], которые были проанализированы с использованием общего набора рабочих процессов относительно эталонного генома (например,г., ГРЧ48). Пилотный проект Broad Institute разработал FireCloud [30] с использованием эластичных вычислительных мощностей Google Cloud для крупномасштабного анализа данных, курирования, хранения и совместного использования данных. Пользователи также могут загружать свои собственные методы анализа и данные в рабочие области и / или использовать передовые инструменты и конвейеры Broad Institute для предварительно загруженных данных. FireCloud использует язык описания рабочих процессов (WDL), чтобы пользователи могли запускать масштабируемые, воспроизводимые рабочие процессы [31].

Пилотный проект Института системной биологии (ISB) использует несколько сервисов GCP.Исследователи могут использовать сетевые программные приложения для интерактивного определения и сравнения когорт, изучения лежащих в основе молекулярных данных для конкретных генов или представляющих интерес путей, обмена информацией с коллегами и применения своих индивидуальных программных сценариев и программ к различным наборам данных [32].

Облако генома рака ISB (CGC) загрузило обработанные данные и метаданные проекта TCGA в службу управляемой базы данных BigQuery, что позволяет легко использовать методы интеллектуального анализа данных и хранилища данных для крупномасштабных геномных данных.Seven Bridges Genomics (SBG) CGC предлагает геномику SaaS и PaaS и использует AWS [33]. Платформа также позволяет исследователям совместно работать над анализом больших наборов данных геномики рака безопасным, воспроизводимым и масштабируемым образом. SGB ​​CGC реализует язык Common Work-Flow [34], чтобы облегчить разработчикам, аналитикам и биологам развертывание, настройку и запуск воспроизводимых методов анализа. Пользователи могут выбирать из более чем 200 инструментов и рабочих процессов, охватывающих многие аспекты обработки данных геномики, для применения к данным TCGA или их собственным наборам данных.

Центр передового опыта в области обработки больших данных NIH при Университете Иллинойса, Урбана-Шампейн, прилагает усилия по созданию системы знаний для геномики (KnowEnG). Система KnowEnG развертывается в общедоступной облачной инфраструктуре (в настоящее время AWS), чтобы позволить ученым-биомедикам получить доступ к алгоритмам интеллектуального анализа данных, сетевого анализа и машинного обучения, которые могут помочь в извлечении знаний из данных геномики [35]. В основе системы KnowEnG лежит обширная база знаний из наборов данных сообщества, называемая сетью знаний, и наборы данных, даже в виде электронных таблиц, могут быть переданы в KnowEnG для анализа.

Коммерческие (AWS, Microsoft Azure) облачные платформы (например, DNAnexus) позволяют анализировать огромные объемы данных секвенирования, интегрированных с фенотипической или клинической информацией [36]. Кроме того, применение инструментов анализа данных на основе глубокого обучения (например, Deep Variant) в сочетании с DNAnexus использовалось для вызова генетических вариантов из данных секвенирования следующего поколения [37]. Другие биоинформатические платформы (например, DNAstack) используют GCP для обеспечения возможности обработки более четверти миллиона полных последовательностей генома человека в год [38].

Здравоохранение

Приложения облачных вычислений в здравоохранении включают телемедицину / телеконсультации, медицинскую визуализацию, общественное здравоохранение, самоконтроль пациентов, управление больницами и информационные системы, терапию и вторичное использование данных.

Мониторинг состояния здоровья в режиме реального времени для пациентов с хроническими заболеваниями, которые проживают на значительном расстоянии от поставщиков медицинских услуг, испытывают трудности с отслеживанием состояния своего здоровья. Одним из ярких примеров являются пациенты, страдающие сердечной аритмией, которым требуется постоянное обнаружение и мониторинг эпизодов.Носимые датчики можно использовать для мониторинга электрокардиограммы (ЭКГ) в реальном времени, обнаружения и классификации эпизодов аритмии. Используя AWS EC2, были интегрированы технологии мобильных вычислений и продемонстрированы возможности мониторинга ЭКГ для записи, анализа и визуального отображения данных пациентов в удаленных местах. Кроме того, программные инструменты, отслеживающие и анализирующие данные ЭКГ, были доступны через облачное SaaS для публичного использования [39]. Также платформа Microsoft Azure была реализована для службы телемедицины ЭКГ по 12 отведениям [40].Для хранения и поиска медицинских изображений в публичном облаке были развернуты модули Picture Archive и Communication System [41]. Обзор публикаций по облачным вычислениям в здравоохранении показал, что во многих публикациях, связанных со здравоохранением, термин «облако» используется как синоним «виртуальных машин» или «веб-инструментов», что не соответствует характеристикам, которые определяют облачные вычисления, модели, и услуги [42]. Несколько коммерческих поставщиков взаимодействуют с больницами и поставщиками медицинских услуг для предоставления медицинских услуг с помощью облачных вычислений.

Инструмент общего назначения

CloVR — это виртуальная машина, которая имитирует компьютерную систему с предустановленными библиотеками и пакетами для анализа биологических данных [43]. Точно так же Cloud BioLinux является общедоступным ресурсом с образами виртуальных машин и предоставляет более 100 программных пакетов для высокопроизводительных биоинформатических вычислений [44]. Образы виртуальных машин (CloVR и BioLinux) доступны для использования в облачной среде IaaS.

Внедрение облака может также включать управляемые сервисы, предназначенные для решения общих проблем с большими данными.Например, каждый из основных поставщиков общедоступного облака предлагает набор услуг для машинного обучения и искусственного интеллекта, некоторые из которых предварительно обучены для решения общих проблем (например, преобразования текста в речь). Такие системы баз данных, как Google BigQuery [45] и Amazon Redshift [46], сочетают в себе масштабируемую и эластичную природу облака с настроенными программными и аппаратными решениями, чтобы обеспечить возможности и производительность базы данных, которые иначе было бы нелегко достичь. Для больших и сложных наборов биомедицинских данных такие базы данных могут снизить затраты на управление, упростить внедрение базы данных и облегчить анализ.Некоторые приложения для работы с большими данными, используемые в биомедицинских исследованиях, такие как программная библиотека Apache Hadoop, основаны на облаке [47].

Разработка облачной цифровой экосистемы для биомедицинских исследований

Представленные выше примеры, некоторые из которых продолжаются в течение нескольких лет, иллюстрируют отход от традиционного подхода к биомедицинским вычислениям. Традиционный подход заключался в загрузке данных в локальные вычислительные системы с общедоступных сайтов, а затем локальном выполнении обработки, анализа и визуализации.Время загрузки, стоимость и избыточность, необходимые для расширения локальных вычислительных возможностей для удовлетворения потребностей биомедицинских исследований с интенсивным использованием данных (например, в секвенировании и визуализации), делают этот подход достойным переоценки.

Крупномасштабные проекты, такие как PCAWG, представленная выше, продемонстрировали преимущество использования ресурсов, как локального, так и общедоступного облака, от различных сотрудничающих организаций. Для организаций с установленной локальной инфраструктурой (например, высокоскоростной сетевой инфраструктурой, безопасными репозиториями данных) разработка цифровой облачной экосистемы с возможностью использования любого из типов облаков (общедоступного, гибридного) может быть выгодной.Более того, разработка и использование облачной экосистемы увеличивает вероятность открытой науки.

Чтобы способствовать открытию знаний и инновациям, открытые данные и аналитика должны быть доступными для поиска, функциональной совместимостью и возможностью многократного использования (FAIR). Принципы FAIR служат руководством для производителей, распорядителей и распространителей данных по повышению возможности повторного использования данных, включая алгоритмы данных, инструменты и рабочие процессы, которые необходимы для хорошего управления жизненным циклом данных [48]. Экосистема биомедицинских данных должна иметь возможности для индексации данных, метаданных, программного обеспечения и других цифровых объектов — отличительная черта инициативы NIH Big Data to Knowledge (BD2K) [49].

Быть FAIR способствует развивающаяся парадигма для запуска сложных, взаимосвязанных наборов программных инструментов, подобных тем, которые используются при обработке данных геномики, и включает в себя упаковку программного обеспечения с использованием контейнерных технологий Linux, таких как Docker, а затем организацию «конвейеров» с использованием конкретных предметных областей. языки рабочего процесса, такие как WDL и Common Workflow Language [34]. Облачные провайдеры также предоставляют возможности пакетной обработки (например, AWS Batch), которые автоматически предоставляют оптимальное количество и тип вычислительных ресурсов в зависимости от объема и конкретных требований к ресурсам отправленных пакетных заданий, что значительно упрощает анализ в масштабе.

На рис. 1 мы проиллюстрировали интеграцию производителей, потребителей и репозиториев данных через облачную платформу для поддержки принципов FAIR.

Ядро облачной платформы должно поддерживать понятие всеобщего достояния — общей экосистемы, обеспечивающей максимальный доступ и повторное использование данных и методов биомедицинских исследований.

Общедоступная облачная экосистема может совмещать вычислительные мощности, ресурсы хранения, базу данных с инструментами и приложениями информатики для анализа и обмена данными исследовательским сообществом.Для взаимодействия нескольких сообществ друг с другом существует 6 основных требований — постоянные цифровые идентификаторы, постоянные метаданные, API-интерфейсы, переносимость данных, пиринг данных и оплата вычислений [50].

Другие особенности экосистемы включают возможности индексирования и поиска, аналогичные DataMed [51], и структуру метаобучения для ранжирования и выбора лучших алгоритмов прогнозирования [52]. Многие из программных инструментов биоинформатики, которые мы обсуждали в предыдущем разделе, были успешно развернуты в облачных средах и могут быть адаптированы к общей экосистеме, включая Apache Spark, преемник Apache Hadoop и MapReduce для анализа данных секвенирования данных следующего поколения [ 53].Кроме того, компонент передачи и совместного использования данных облачной экосистемы общего пользования может включать в себя функции, обсуждаемые для платформы управления данными исследований Globus [54]. Мы также предполагаем, что общедоступные облачные технологии будут поддерживаться методами и методами, использующими платформу обнаружения на основе семантических данных, предназначенную для непрерывного накопления знаний из множества геномных, молекулярных и клинических данных [55].

Безопасность является неотъемлемой частью общей облачной архитектуры, наряду с политикой данных, управлением и экономическим обоснованием для поддержки цифровой биомедицинской экосистемы.Для первоначальной оценки мер безопасности руководящие документы, такие как Федеральный закон об управлении информационной безопасностью (FISMA), NIST-800-53 и Федеральные стандарты обработки информации (FIPS), могут предоставить инструменты для организационной оценки риска и для целей проверки [56,57 , 58]. Безопасность в общедоступных облачных сервисах — это общая ответственность, при этом поставщик облачных услуг предоставляет услуги безопасности, а конечный пользователь сохраняет ответственность за данные и программное обеспечение, которые используют эти сервисы. На конфиденциальность данных влияет широкий спектр вопросов, связанных с этическими, правовыми, политическими и техническими границами, все из которых зависят от типа данных, которые обрабатываются и поддерживаются [59].

Регулярная программа обучения пользователей данных в облаке, особенно по работе с конфиденциальными данными (например, личной информацией), очень важна. Обучение должно включать методы защиты данных, перемещаемых в облако, и контроля доступа к облачным ресурсам, включая виртуальные машины, контейнеры и облачные сервисы, которые используются для управления жизненным циклом данных. Защита ключей доступа, использование многофакторной проверки подлинности, создание списков пользователей для управления удостоверениями и доступом с контролируемыми разрешениями в соответствии с принципом наименьших привилегий (настроенных для выполнения действий, необходимых для пользователей) — вот некоторые из рекомендуемых практик, которые могут минимизировать уязвимости системы безопасности, которые могут возникают от неопытных пользователей облака и / или от злонамеренных внешних объектов [54].

Оценка риска — ключ к надежному определению требуемого уровня защиты данных в облаке. Структурированный анкетный подход, разработанный как модель оценки облачных услуг (CSEM), может использоваться для определения рисков до миграции данных в облако [60]. На основе результатов оценки рисков можно выбрать подходящую модель развертывания облака, чтобы обеспечить соответствие внутренним политикам, правовым и нормативным требованиям, которые внешне различаются в разных частях мира, что может повлиять на повсеместное распространение облачных ресурсов.

Стремление к открытым биомедицинским данным мотивировало интерес к улучшению доступа к данным при сохранении безопасности и конфиденциальности. Например, открытый конкурс в масштабе всего сообщества на разработку новых методов защиты геномных данных показал возможность безопасного аутсорсинга данных и совместной работы для анализа геномных данных на основе облачных вычислений [61]. Результаты работы демонстрируют, что криптографические методы могут поддерживать сравнительный анализ геномов человека на основе общедоступного облака. Недавние исследования показали, что при использовании модели развертывания гибридного облака 50–70% задач отображения чтения могут быть выполнены точно и эффективно в общедоступном облаке [62].

Таким образом, облачная экосистема требует возможности взаимодействия между облаками, разработки инструментов, которые могут работать в нескольких облачных средах и которые могут решать проблемы защиты данных, конфиденциальности и юридических ограничений, налагаемых разными странами (см. [63] для обсуждения, поскольку это относится к геномным данным).

Преимущества и недостатки облака для биомедицинских проектов

Стоимость облака варьируется в зависимости от биомедицинских проектов и среди поставщиков, поэтому определение технических требований для предоставления ресурсов (например,g., объем памяти, дискового пространства и использование ЦП) является важным первым шагом в оценке затрат. Помните, что намерение коммерческих поставщиков общедоступного облака состоит в том, чтобы вы продолжали использовать их облачную среду. Например, данные могут быть бесплатными для загрузки, но дорогими для загрузки, что делает принятие общих подходов в облаке еще более важным для размещения крупномасштабных наборов биологических данных. Этот подход может удовлетворить потребности сообщества производителей данных, потребителей и распорядителей (рис. 1) в улучшении доступа и минимизации необходимости загрузки наборов данных в местные учреждения.Чтобы проверить этот подход, NIH инициировал пилотный проект по общему объему данных [64], поддерживая размещение трех важных наборов данных, а именно инициативы Trans-Omics Precision Medicine (TOPMed), проекта Genotype Tissue Expression (GTEx) и Alliance of Genomics Resource. link, консорциум баз данных модельных организмов (MODS) в облаке.

Многие поставщики облачных услуг предоставляют калькуляторы для оценки примерных затрат на использование соответствующих облачных сервисов [65]. Без какой-либо точки отсчета для начала оценка затрат может оказаться сложной задачей.Коммерческие поставщики общедоступного облака обычно предлагают бесплатный кредит для новых учетных записей, чего может быть достаточно для запуска процесса планирования и оценки. Плата за облачные услуги основана на точном использовании с небольшими временными интервалами, тогда как затраты на вычисления на месте обычно амортизируются в течение 3-5 лет для систем, которые можно использовать для нескольких проектов. Хотя часто проводится сравнение затрат между местной инфраструктурой и облачными подходами, на практике такие сравнения часто трудно выполнить эффективно из-за отсутствия достоверных данных о фактических местных затратах.Более того, модели финансирования облачных вычислений различаются между учреждениями, получающими средства, и самими спонсорами. Например, использование облачных ресурсов может быть связано с накладными расходами организации, в то время как аппаратное обеспечение на месте — нет. Это не лучшее использование денег налогоплательщиков, и финансирующие агентства должны пересмотреть свою политику в отношении использования облака учреждениями, взимающими накладные расходы. Учитывая растущую конкуренцию на рынке облачных вычислений, облачные ресурсы могут быть предметом переговоров или доступными по специальным соглашениям для соответствующих исследовательских и образовательных проектов [66–68].

Биомедицинским исследователям в сотрудничестве с ИТ-специалистами необходимо будет определить лучший способ использования облачных ресурсов для своих индивидуальных проектов [69]. Расчет затрат на использование локальной инфраструктуры требует определения общей стоимости владения (TCO). Как прямые, так и косвенные затраты вносят вклад в ТШО. Прямые затраты включают затраты на приобретение оборудования, сетевые услуги, центр обработки данных, электричество, лицензии на программное обеспечение и заработную плату. Косвенные затраты обычно включают услуги технической поддержки, управление данными и обучение.Косвенные институциональные затраты существенно различаются в зависимости от сложности проекта. При оценке затрат учитывается производительность. Например, весь конвейер генома в облачной среде после создания прототипа может быть расширен для обработки целых геномов с последующими минимальными человеческими затратами [70].

Использование простаивающих вычислительных узлов в облаке с возможностью вытеснения — один из способов снизить стоимость вычислений, но с риском увеличения времени для вычислений. Например, недавний отчет, в котором использовался пилотный облачный проект NCI ISB-CGC для количественной оценки уровней экспрессии транскриптов для более чем 12000 образцов РНК-секвенирования в 2 различных облачных конфигурациях, кластерном или предварительном, показал, что стоимость каждого образца при использовании вытесняемой конфигурации было меньше половины стоимости по сравнению с кластерным методом [71].

В других подходах использовались методы линейного программирования для оптимального предложения и развертывания комбинации недостаточно используемых вычислительных ресурсов в геномике для минимизации затрат на анализ данных [72].

Облачные среды оплачиваются по мере использования, тогда как финансирование исследований для вычислений обычно предоставляется в начале награды и оценивается на ежегодной основе. Это может привести к несоответствию между потребностями в вычислениях и ресурсами для их удовлетворения. NIH провел пилотный проект по облачным кредитам для оценки альтернативной модели финансирования облачных ресурсов, подробности будут полностью описаны в [73].Кредиты выдавались по мере необходимости, а не авансом, что соответствовало шаблонам использования. Простой механизм подачи заявок и проверки, доступный для финансируемого исследователя, означает, что кредиты обычно можно получить за несколько недель или меньше. Исследователь может выбрать, с каким облачным провайдером потратить кредиты, тем самым стимулируя конкуренцию на рынке и, предположительно, увеличивая объем вычислений, которые могут быть выполнены на деньги, полученные от исследований.

облачных кредитов были направлены на стимулирование использования облака; однако проблема, которую еще предстоит решить, — это долгосрочное обеспечение устойчивости данных в облачных средах.Стоимость управления данными и хранения всех данных, полученных в ходе исследовательской программы, может быть непомерно высокой, поскольку коллекции становятся большими. Один из способов проактивного решения этой проблемы — привлечение производителей, потребителей и кураторов данных с самого начала процесса жизненного цикла исследовательских данных к разработке ценностных моделей для хранения данных, которые могут быть реализованы через облачное хранилище. На основе шаблонов использования может быть адаптирована миграция данных на основе политик в наименее дорогие облачные пулы хранения данных.Наша точка зрения заключается в том, что долгосрочное хранение биомедицинских данных является отличным местом для сотрудничества государственных и частных учреждений, чтобы изучить способы совместного владения для управления затратами и политикой, которая может продолжать делать данные исследований доступными с течением времени.

Резюме и выводы

Использование облака, от крупномасштабного геномного анализа до удаленного мониторинга пациентов и работы молекулярной диагностики в клинических лабораториях, имеет преимущества, но также и потенциальные недостатки. Первым шагом является определение того, какой тип облачной среды лучше всего подходит для приложения, а затем является ли оно экономически эффективным решением.В этом введении делается попытка указать, что следует учитывать, какие есть варианты и какие приложения уже используются, которые могут служить справочными материалами для принятия наилучшего решения о дальнейших действиях.

Поставщики

Cloud предоставляют несколько услуг для вычислений, хранения, развертывания виртуальных машин и доступа к различным базам данных. Поставщики облачных услуг и третьи стороны предоставляют дополнительные услуги для картографирования пользователей, от новичков до экспертов. Повсеместное распространение облаков вызывает вопросы, касающиеся безопасности и доступности, особенно в том, что касается геополитических границ.Необходимо тщательно оценить рентабельность использования облаков по сравнению с другими вычислительными средами, поскольку они связаны с размером, сложностью и характером задачи. Облака называются эластичными, поскольку они расширяются, чтобы охватить вычислительные потребности задачи. Например, простой небольшой прототип можно протестировать в облачной среде и сразу же масштабировать для обработки очень больших данных. С другой стороны, такое использование связано с расходами, особенно с извлечением результатов вычислений. Поставщики облачных услуг ищут комплексную модель.Как только вы соглашаетесь использовать их услуги, вы продолжаете это делать или платите значительный штраф. В сочетании с распределенной моделью это имеет значение при сопоставлении с моделями авансового финансирования типичных грантов. Идея сред, в которых несколько поставщиков общедоступных облаков используются в коллективной экосистеме, все еще в основном на горизонте. Однако ясно то, что облака являются растущей частью биомедицинской вычислительной экосистемы и никуда не денутся.

Благодарности

Авторы выражают признательность за конструктивные комментарии, предоставленные Dr.Шон Дэвис, Центр исследований рака, Национальный институт рака; Г-жа Андреа Норрис, директор Центра информационных технологий; и д-р Вивьен Бонацци, офис директора Национальных институтов здравоохранения.

Заявление об ограничении ответственности

Мнения, выраженные в статье, принадлежат авторам и не обязательно отражают мнение Национальных институтов здравоохранения.

Ссылки

  1. 1. FedRAMP.gov. В: FedRAMP.gov [Интернет]. [цитировано 18 сентября 2017 г.].Доступно по ссылке: https://www.fedramp.gov/
  2. 2. Институт всеобъемлющей технологии Университета Индианы. Jetstream: Национальное научно-техническое облако [Интернет]. [цитировано 19 сентября 2017 г.]. Доступно по ссылке: https://jetstream-cloud.org/
  3. 3. Мелл П., Гранс Т. и другие. Определение облачных вычислений в NIST [Интернет]. [цитировано 18 сентября 2017 г.]. Национальный институт стандартов и технологий; 2011. Отчет №: Специальная публикация 800–145. Доступно по адресу: http: // nvlpubs.nist.gov/nistpubs/Legacy/SP/nistspecialpublication800-145.pdf
  4. 4. Палиан Дж. Внедрение облачных вычислений в различных отраслях. В: Экспедиент [Интернет]. 19 марта 2013 г. [цитировано 18 сентября 2017 г.]. Доступно по адресу: https://www.expedient.com/blog/how-cloud-computing-adoption-varies-across-industries/
  5. 5. Amazon Web Services. Публичные наборы данных AWS. В: Общедоступные наборы данных AWS [Интернет]. [цитировано 18 сентября 2017 г.]. Доступно по ссылке: https://aws.amazon.com/datasets/
  6. 6. Amazon Web Services.Проект человеческого микробиома на Amazon Web Services. В: Общедоступные наборы данных Amazon Web Services [Интернет]. [цитировано 18 сентября 2017 г.]. Доступно по ссылке: https://aws.amazon.com/datasets/human-microbiome-project/
  7. 7. Национальные институты здоровья. Использование сервисов облачных вычислений для хранения и анализа данных с контролируемым доступом в соответствии с Политикой совместного использования геномных данных NIH [Интернет]. [цитировано 18 сентября 2017 г.]. Доступно по адресу: https://gds.nih.gov/pdf/NIH_Position_Statement_on_Cloud_Computing.pdf
  8. 8. Национальные институты здоровья. План национальных институтов здравоохранения по расширению доступа к научным публикациям и цифровым научным данным научных исследований, финансируемых NIH [Интернет]. [цитировано 18 сентября 2017 г.]. НАЦИОНАЛЬНЫЕ ИНСТИТУТЫ ЗДРАВООХРАНЕНИЯ США; 2015, февраль. Доступно по адресу: https://grants.nih.gov/grants/NIH-Public-Access-Plan.pdf
  9. 9. Дай Л., Гао X, Го И, Сяо Дж., Чжан З. Биоинформатические облака для обработки больших данных. Биол Директ. BioMed Central; 2012; 7: 43
  10. 10.Камачо С., Кулурис Дж., Авагян В., Ма Н., Пападопулос Дж., Билер К. и др. BLAST +: архитектура и приложения. BMC Bioinformatics. 2009; 10: 421. pmid: 20003500
  11. 11. NCBI. Cloud BLAST. В: Документация Cloud BLAST [Интернет]. [цитировано 18 сентября 2017 г.]. Доступно по адресу: https://blast.ncbi.nlm.nih.gov/Blast.cgi?PAGE_TYPE=BlastDocs&DOC_TYPE=CloudBlast
  12. 12. NCBI BLAST в Windows Azure. В: Центр загрузки Microsoft [Интернет]. [цитировано 18 сентября 2017 г.].Доступно по адресу: https://www.microsoft.com/en-us/download/details.aspx?id=52513
  13. 13. Нгуен Т., Ши В., Руден Д. CloudAligner: быстрый и полнофункциональный инструмент на основе MapReduce для сопоставления последовательностей. BMC Res Notes. 2011; 4: 171. pmid: 21645377
  14. 14. Schatz MC. CloudBurst: высокочувствительное отображение чтения с помощью MapReduce. Биоинформатика. Издательство Оксфордского университета; 2009. 25: 1363–1369. pmid: 19357099
  15. 15. Журдрен Л., Бернар М., Диллис М.-А, Ле Кром С.Eoulsan: платформа на основе облачных вычислений, обеспечивающая высокопроизводительный анализ последовательности. Биоинформатика. 2012; 28: 1542–1543. pmid: 224
  16. 16. Лангмид Б., Шац М.С., Лин Дж., Поп-М., Зальцберг С.Л. Поиск SNP с помощью облачных вычислений. Genome Biol. 2009; 10: R134. pmid: 19930550
  17. 17. Афган Э., Бейкер Д., Ван ден Бик М., Бланкенберг Д., Бувье Д., Чех М. и др. Платформа Galaxy для доступных, воспроизводимых и совместных биомедицинских анализов: обновление 2016 г.Nucleic Acids Res. Издательство Оксфордского университета; 2016; 44: W3 – W10. pmid: 27137889
  18. 18. Тейлор Дж. Галактика в облаке. В: Coursera [Интернет]. [цитировано 18 сентября 2017 г.]. Доступно по ссылке: https://www.coursera.org/learn/galaxy-project/lecture/veQKq/galaxy-on-the-cloud
  19. 19. Лю Б., Маддури Р.К., Сотомайор Б., Чард К., Лацински Л., Дэйв У. Дж. И др. Облачная платформа биоинформатики для крупномасштабных анализов секвенирования следующего поколения. Дж Биомед Информ. 2014; 49: 119–133.pmid: 24462600
  20. 20. Хит А.П., Гринуэй М., Пауэлл Р., Спринг Дж., Суарес Р., Хэнли Д. и др. Bionimbus: облако для управления, анализа и обмена большими наборами геномных данных. J Am Med Inform Assoc. 2014; 21: 969–975. pmid: 24464852
  21. 21. Домашняя страница — ПО OpenStack для облачных вычислений с открытым исходным кодом. В: OpenStack [Интернет]. [цитировано 16 октября 2017 г.]. Доступно по ссылке: https://www.openstack.org/
  22. 22. McNerney ME, Brown CD, Wang X, Bartom ET, Karmakar S, Bandlamudi C, et al.CUX1 является гаплонедостаточным геном-супрессором опухоли на хромосоме 7, часто инактивируемым при остром миелоидном лейкозе. Кровь. 2013; 121: 975–983. pmid: 23212519
  23. 23. Афган Э., Бейкер Д., Кораор Н., Чепмен Б., Некрутенко А., Тейлор Дж. Galaxy CloudMan: предоставление кластеров облачных вычислений. BMC Bioinformatics. 2010; 11 Приложение 12: S4.
  24. 24. Онсонго Дж., Эрдманн Дж., Спирс М.Д., Чилтон Дж., Бекман К.Б., Хауге А. и др. Внедрение облачного анализа данных секвенирования нового поколения в клинической лаборатории.BMC Res Notes. 2014; 7: 314. pmid: 24885806
  25. 25. Рабочая группа по анализу PanCancer. В: Портал данных ICGC [Интернет]. [цитировано 19 сентября 2017 г.]. Доступно по ссылке: https://dcc.icgc.org/pcawg
  26. 26. Международный консорциум по геному рака. Сотрудничество по раку. В: Сотрудничество по раку [Интернет]. [цитировано 19 сентября 2017 г.]. Доступно по адресу: https://dcc.icgc.org/icgc-in-the-cloud/collaboratory
  27. 27. Штейн Л.Д., Кнопперс Б.М., Кэмпбелл П., Гетц Г., Корбель Дж.Анализ данных: создайте общее облако. Природа. 2015; 523: 149–151. pmid: 26156357
  28. 28. Национальный институт рака. Пилоты по облачной геномике рака Национального института рака [Интернет]. [цитировано 18 сентября 2017 г.]. Доступно по ссылке: https://cbiit.cancer.gov/sites/nci-cbiit/files/Cloud_Pilot_Handout_508compliant.pdf
  29. 29. Гроссман Р.Л., Хит А.П., Ферретти В., Вармус Х.Э., Лоуи Д.Р., Киббе В.А. и др. К общему видению геномных данных рака. N Engl J Med. 2016; 375: 1109–1112.pmid: 27653561
  30. 30. Широкий институт. FIRECLOUD. В: FireCloud [Интернет]. [цитировано 18 сентября 2017 г.]. Доступно по адресу: https://software.broadinstitute.org/firecloud/
  31. 31. Широкий институт. Язык описания рабочего процесса [Интернет]. [цитировано 19 сентября 2017 г.]. Доступно по ссылке: https://software.broadinstitute.org/wdl/
  32. 32. Институт системной биологии. Институт системной биологии: облако геномики рака [Интернет]. [цитировано 19 сентября 2017 г.]. Доступно по адресу: http: // cgc.systemsbiology.net/
  33. 33. SevenBridges Genomics. Облако онкологической геномики. В: Облако геномики рака [Интернет]. [цитировано 19 сентября 2017 г.]. Доступно по адресу: http://www.cancergenomicscloud.org/
  34. 34. Амстутц П., Крузо М.Р., Тиянич Н., Чепмен Б., Чилтон Дж., Хойер М. и др. Common Workflow Language, v1.0. фигшер. 2016; https://doi.org/10.6084/m9.figshare.3115156.v2
  35. 35. Sinha S, Song J, Weinshilboum R, Jongeneel V, Han J. KnowEnG: двигатель знаний для геномики.J Am Med Inform Assoc. Американская ассоциация медицинской информатики; 2015; 22: 1115. pmid: 26205246
  36. 36. Андерсон К. А.З. является партнером DNAnexus для проекта секвенирования 2 миллионов пациентов. Клинические ОМИЦ. Мэри Энн Либерт, Инк., Издатели; 2017; 4: 32–32.
  37. 37. Платформа DNAnexus предлагает DeepVariant, разработанный Google | GEN. В: GEN [Интернет]. 13 декабря 2017 г. [цитировано 26 января 2018 г.]. Доступно по адресу: https://www.genengnews.com/gen-news-highlights/dnanexus-platform-offers-google-developed-deepvariant/81255267
  38. 38.Стек ДНК — простая геномика [Интернет]. [цитировано 28 января 2018 г.]. Доступно по ссылке: https://dnastack.com/#/team/mission
  39. 39. Панди С., Вурслуйс В., Ниу С., Хандокер А., Буйя Р. Автономная облачная среда для размещения служб анализа данных ЭКГ. Future Gener Comput Syst. 2012; 28: 147–154.
  40. 40. Hsieh J-C, Hsu M-W. Телемедицинская служба ЭКГ в 12 отведениях на основе облачных вычислений. BMC Med Inform Decis Mak. 2012; 12:77 pmid: 22838382
  41. 41.Silva LAB, Costa C, Oliveira JL. Архитектура архива PACS, поддерживаемая облачными службами. Int J Comput Assist Radiol Surg. 2012; 7: 349–358. pmid: 21678039
  42. 42. Griebel L, Prokosch H-U, Köpcke F, Toddenroth D, Christoph J, Leb I, et al. Обзорный обзор облачных вычислений в здравоохранении. BMC Med Inform Decis Mak. 2015; 15:17. Pmid: 25888747
  43. 43. Ангиуоли С.В., Маталка М., Гуссман А., Галенс К., Вангала М., Райли Д.Р. и др. CloVR: виртуальная машина для автоматизированного и портативного анализа последовательностей с настольного компьютера с использованием облачных вычислений.BMC Bioinformatics. 2011; 12: 356. pmid: 21878105
  44. 44. Krampis K, Booth T, Chapman B, Tiwari B, Bicak M, Field D и др. Cloud BioLinux: предварительно настроенные биоинформатические вычисления по запросу для сообщества геномиков. BMC Bioinformatics. 2012; 13:42 pmid: 22429538
  45. 45. Google. Взгляд изнутри на Google BigQuery [Интернет]. [цитировано 19 сентября 2017 г.]. Google; 2012. Доступно по адресу: https://cloud.google.com/files/BigQueryTechnicalWP.pdf
  46. 46. AWS.Корпоративное хранилище данных на Amazon Web Services [Интернет]. [цитировано 19 сентября 2017 г.]. 2016 г. Доступно по адресу: https://d0.awsstatic.com/whitepapers/enterprise-data-warehousing-on-aws.pdf
  47. 47. Ло Дж, Ву М., Гопукумар Д., Чжао Ю. Применение больших данных в биомедицинских исследованиях и здравоохранении: обзор литературы. Биомед Информ Инсайтс. Публикации SAGE; 2016; 8: 1.
  48. 48. Wilkinson MD, Dumontier M, Aalbersberg IJJ, Appleton G, Axton M, Baak A и др. Руководящие принципы FAIR для управления научными данными и их рационального использования.Научные данные. 2016; 3: 160018. pmid: 26978244
  49. 49. Ягодник К.М., Коплев С., Дженкинс С.Л., Оно-Мачадо Л., Патен Б., Шурер С.К. и др. Разработка основы для цифровых объектов в сообществе от больших данных к знаниям (BD2K): отчет с семинара пилотных проектов Commons Framework. Дж Биомед Информ. 2017; 71: 49–57. pmid: 28501646
  50. 50. Гроссман Р.Л., Хит А., Мерфи М., Паттерсон М., Уэллс В. Дело в пользу общего доступа к данным: к науке о данных как услуге. Comput Sci Eng. 2016; 18: 10–20.pmid: 293
  51. 51. Оно-Мачадо Л., Сансоне С.-А, Альтер Г, Форе I, Грете Дж., Сюй Х и др. Поиск полезных данных в нескольких репозиториях биомедицинских данных с помощью DataMed. Нат Жене. 2017; 49: 816–819. pmid: 28546571
  52. 52. Вукичевич М., Радованович С., Милованович М., Минович М. Облачная система метаобучения для прогнозного моделирования биомедицинских данных. Научный мировой журнал. Хиндави; 2014; 2014. pmid: 248

  53. 53. Szczerba M, Wiewiórka MS, Okoniewski MJ, Rybiński H.Масштабируемые облачные программные системы анализа данных для больших данных секвенирования следующего поколения. Анализ больших данных: новые алгоритмы для нового общества. Спрингер, Чам; 2016. С. 263–283.
  54. 54. Фостер I, Гэннон Д.Б. Облачные вычисления для науки и техники. MIT Press; 2017.
  55. 55. Data4Cure I. Data4Cure :: Биомедицинский интеллект [Интернет]. [цитировано 2 февраля 2018 г.]. Доступно по адресу: https://www.data4cure.com/solutions.html
  56. 56. O’Reilly PD.Проект внедрения Федерального закона об управлении информационной безопасностью (FISMA). 2009; [Интернет]. [цитировано 7 февраля 2018 г.]. Доступно по адресу: https://www.nist.gov/programs-projects/federal-information-security-management-act-fisma-implementation-project
  57. 57. Росс RS. Контроль безопасности и конфиденциальности для федеральных информационных систем и организаций [включает обновления от 07.05.13] [Интернет]. [Цитируется 7 февраля 2018 г.]. 2013. Доступно по адресу: https://www.nist.gov/publications/security-and-privacy-controls-federal-information-systems-and-organizations-includes
  58. 58.Автор: Национальный институт стандартов и технологий. FIPS 200, Минимальные требования безопасности для федеральных информационных и информационных систем | CSRC [Интернет]. [цитировано 7 февраля 2018 г.]. Доступно по адресу: http://csrc.nist.gov/publications/fips/fips200/
  59. 59. Малин Б.А., Эмам К.Е., О’Киф CM. Конфиденциальность биомедицинских данных: проблемы, перспективы и последние достижения. J Am Med Inform Assoc. 2013; 20: 2–6. pmid: 23221359
  60. 60. Шефер Т., CISA, CISM, CISSP, CEH, Hofmann M и др.Выбор правильной модели работы в облаке: конфиденциальность и безопасность данных в облаке. ISACA. 2014; 3. [Интернет]. [цитировано 7 февраля 2018 г.]. Доступно по адресу: https://www.isaca.org/Journal/archives/2014/Volume-3/Pages/Selecting-the-Right-Cloud-Operating-Model-Privacy-and-Data-Security-in-the-Cloud .aspx
  61. 61. Тан Х, Цзян Х, Ван Х, Ван С., София Х, Фокс Д. и др. Защита аналитики геномных данных в облаке: состояние дел и возможности. BMC Med Genomics. 2016; 9: 63. pmid: 27733153
  62. 62.Popic V, Batzoglou S. Гибридный облачный выравниватель чтения на основе MinHash и kmer-голосования, сохраняющий конфиденциальность. Nat Commun. 2017; 8: 15311. pmid: 28508884
  63. 63. Мольнар-Габор Ф, Люк Р., Якнин С., Корбель Й. Вычисление данных о пациентах в облаке: практические и юридические аспекты генетических и геномных исследований в Европе и за рубежом. Genome Med. 2017; 9: 58. pmid: 28633659
  64. 64. Наука о данных в NIH [Интернет]. [цитировано 1 февраля 2018 г.]. Доступно по адресу: https: // datascience.nih.gov/DataCommonsPilotPhaseAwards
  65. 65. Калькулятор цен на Google Cloud Platform -. В: Google Cloud Platform [Интернет]. [цитировано 22 сентября 2017 г.]. Доступно по адресу: https://cloud.google.com/products/calculator/
  66. 66. Amazon Web Services. Программы AWS для исследований и образования. В: Программы AWS для исследований и образования [Интернет]. [цитировано 22 сентября 2017 г.]. Доступно по ссылке: https://aws.amazon.com/grants/
  67. 67. Google. Образовательные гранты — бесплатные кредиты для университетских занятий по информатике | Облачная платформа Google.В: Google Cloud Platform [Интернет]. [цитировано 22 сентября 2017 г.]. Доступно по ссылке: https://cloud.google.com/edu/
  68. 68. Microsoft. Microsoft Azure для исследований — Microsoft Research. В: Microsoft Research [Интернет]. [цитировано 22 сентября 2017 г.]. Доступно по адресу: https://www.microsoft.com/en-us/research/academic-program/microsoft-azure-for-research/
  69. 69. Knaus J, Hieke S, Binder H, Schwarzer G, Others. Затраты на облачные вычисления для отдела биометрии. Методы Inf Med.Schattauer Publishers; 2013; 52: 72–79. pmid: 23188548
  70. 70. Фусаро В.А., Патил П., Гафни Э., Уолл Д.П., Тонеллато П.Дж. Биомедицинские облачные вычисления с помощью Amazon Web Services. PLoS Comput Biol. 2011; 7: e1002147. pmid: 215
  71. 71. Tatlow PJ, Piccolo SR. Облачный рабочий процесс для количественной оценки уровней экспрессии транскриптов в общедоступных справочниках по раку. Научный доклад 2016; 6: 39259. pmid: 27982081
  72. 72. Любер Дж. М., Тирни Б. Т., Кофер Е. М., Патель К. Дж., Костич А. Д..Эфир: использование линейного программирования для оптимальных облачных вычислений в геномике. Биоинформатика. 2017; pmid: 2

    86
  73. 73. Комацулис Г.А., Вебер Н., Тененбаум Д., Борн П.Е. Модель кредита Commons: новый подход к финансированию с потенциалом улучшения вычислительной биомедицины. PLoS Biol. Поданный.

GEOquery: мост между Омнибусом экспрессии генов (GEO) и BioConductor | Биоинформатика

Абстрактные

Технология микрочипов стала стандартным инструментом молекулярной биологии.Были получены экспериментальные данные по огромному количеству организмов, типов тканей, условий лечения и болезненных состояний. Омнибус экспрессии генов (Barrett et al. , 2005), разработанный Национальным центром биоинформатики (NCBI) при Национальном институте здравоохранения, является хранилищем почти 140 000 экспериментов по экспрессии генов. Проект BioConductor (Gentleman et al. , 2004) — это проект программного обеспечения с открытым исходным кодом и открытой разработки, созданный в среде статистического программирования R (R Development core Team, 2005) для анализа и понимания геномных данных.Инструменты, содержащиеся в проекте BioConductor, представляют собой множество современных методов анализа микрочипов и данных геномики. Мы разработали программный инструмент, который позволяет получить доступ к огромному количеству информации в GEO непосредственно из BioConductor, устраняя многие проблемы форматирования и синтаксического анализа, которые делали такой анализ трудоемким в прошлом. Программное обеспечение под названием GEOquery эффективно устанавливает мост между GEO и BioConductor. Легкий доступ к данным GEO от BioConductor, вероятно, приведет к новому анализу данных GEO с использованием новых и строгих статистических и биоинформатических инструментов.Содействие анализу и метаанализу данных микрочипов повысит эффективность, с которой биологически важные выводы могут быть сделаны на основе опубликованных геномных данных.

Доступность: GEOquery доступен как часть проекта BioConductor.

Контактное лицо: [email protected]

1 ОБЗОР GEO И GEOQUERY

NCBI Gene Expression Omnibus (GEO) служит общедоступным репозиторием для широкого спектра высокопроизводительных экспериментальных данных.Эти данные включают одно- и двухканальные эксперименты на основе микрочипов, измеряющие мРНК, геномную ДНК и содержание белка, а также методы без использования массивов, такие как серийный анализ экспрессии генов (SAGE) и протеомные данные масс-спектрометрии. В настоящее время в GEO представлено около 140 000 образцов и более 3000 различных платформ микрочипов. На самом базовом уровне организации GEO есть четыре основных объекта. Первые три (образец, платформа и серия) предоставляются пользователями; четвертый, набор данных, составляется и курируется персоналом GEO на основе данных, представленных пользователями. 1 Файлы платформы GEO (присоединения, такие как GPLxxxx, где «x» — это число) описывают структуру массива и содержимое, в то время как образцы GEO (присоединения, такие как GSMxxxx) описывают фактические результаты одиночной гибридизации. Полный эксперимент, включая информацию обо всех гибридизациях и описания связанных с ними платформ, можно получить как серию GEO (GSExxxx). Наконец, сотрудники GEO выборочно преобразовали ряды GEO в более компактный формат, набор данных GEO (GDSxxxx), который включает единую электронную таблицу «окончательных» значений и сопровождающую их обширную аннотацию с примерами.Доступ к данным можно получить из GEO в собственном формате, который они называют SOFT. Каждый из этих типов сущностей имеет соответствующее представление класса, определенное GEOquery. Методы доступа к различным частям объекта GEO доступны из GEOquery, что делает доступ к данным простым и быстрым после того, как данные из GEO были проанализированы в структурах данных GEOquery.

2 ИСПОЛЬЗОВАНИЕ GEOQUERY

Основная цель GEOquery — загрузить и проанализировать файлы формата SOFT из GEO, сохраняя всю информацию, содержащуюся в записях GEO.Дизайн GEOquery делает доступ к данным из GEO очень простым. Требуется только одна команда — getGEO. В качестве примера здесь используется GEOquery, чтобы продемонстрировать, как можно получить данные, связанные с GDS1, набором данных GEO.

> библиотека (GEOquery)

Эта команда загружает библиотеку GEOquery в R.

> gds <- getGEO ('GDS1')

Файл хранится по адресу:

/tmp/RtmpitNEHc/GDS .gz

анализ геоданных

подмножества синтаксического анализа

готов к возврату

Теперь переменная gds R содержит структуру данных GEOquery (класса GDS ), которая представляет запись GDS1 из GEO.Обратите внимание, что имя файла, используемое для сохранения загрузки, выводилось на экран для последующего использования при вызове getGEO (filename =…). Эта же команда получит любое другое присоединение GEO, такое как GSM3, образец GEO.

> gsm <- getGEO (‘GSM3’)

Файл хранится по адресу:

/tmp/RtmpitNEHc/GSM3.soft

2.1 Структуры данных GEOquery

Две из самых мощных функций GEOquery — это настраиваемые структуры данных и связанные с ними методы, которые организуют данные из загрузки GEO.Структуры данных GEOquery можно описать в двух широких группах, которые аналогичны структуре, используемой GEO для доставки данных. Первая группа, включающая GDS, GPL и GSM , все имеют аналогичную структуру формата GEO SOFT, и соответствующие методы GEOquery оказывают одинаковое влияние на каждый из них. Каждый из этих классов состоит из заголовка метаданных, почти дословно взятого из заголовка формата SOFT и включающего информацию, относящуюся ко всему объекту GEO, и таблицы GEODataTable.GEODataTable состоит из двух простых частей: части столбцов, которая описывает заголовки столбцов, и части таблицы, которая обычно содержит двухмерную таблицу информации. Вот усеченный вывод некоторых аксессоров, примененных к семплу GEO, который был сохранен в предыдущем разделе.

> Мета (GSM) [1: 3]

$ channel_count

[1] ‘1’

$ contact_address

[1] ‘6 Center Drive’

$ contact_city

[1] ‘ Bethesda ‘

> Таблица ( г / м2, ) [ 1: 3, c ( 2, 6, 7 )]

Signal_Raw Norm_Value Const

1 138392.6 395070.1 39542

2 100973.5 395070.1 39542

3 118994.0 395070.1 39542

> Столбцы (г / м2) [c (2, 6, 7),]

Описание столбца

2 SIGNALORM_RA значение

7 CONST постоянное значение

GPL ведет себя точно так же, как класс GSM , хотя класс GSM содержит данные экспрессии генов в своей таблице GEODataTable, а класс GPL содержит информацию о свойствах микрочипов.Однако класс GDS имеет немного больше информации, связанной с методом Columns, поскольку он содержит аннотацию, связанную с каждым массивом:

> Columns (gds) [1: 3, 1: 3]

sample gendertissue

1 GSM3maletestis

2 GSM4maletestis

3 GSM5 мужской гонадэктомированный мужчина

GSE является композитным классом. Запись GSE из GEO может представлять произвольное количество образцов, гибридизированных на произвольном количестве платформ. GSE имеет раздел метаданных, как и другие классы. Однако у него нет таблицы GEODataTable. Вместо этого он содержит два списка, доступные с помощью GPLList и GSMList, которые представляют собой списки объектов GPL и GSM соответственно. Использование методов доступа к классам в сочетании с мощными возможностями R по манипулированию данными позволяет быстро и легко получить доступ и преобразовать данные GSE в любую форму, подходящую для дальнейшего анализа.

2.2 Преобразование в структуры данных BioConductor

Наборы данных

GEO очень похожи на структуру данных MAList пакета limma (Smyth, 2005) и на структуру данных ExpressionSet пакета Biobase (Gentleman et al. , 2004). Следовательно, есть две функции, GDS2MA и GDS2eSet, которые преобразуют GDS в любую из двух структур данных.

В качестве простого примера преобразовать объект gds сверху в ExpressionSet очень просто:

> eset <- GDS2eSet (gds, do.log2 = TRUE)

Файл хранится по адресу:

/tmp/RtmpitNEHc/GPL5.soft

Теперь eset — это ExpressionSet , который содержит ту же информацию, что и в наборе данных GEO, включая информацию об образце, преобразованную в журнал. аннотацию данных и зонда из соответствующей лицензии GPL. Также доступны функции для преобразования в другие структуры данных BioConductor.

3 ЗАКЛЮЧЕНИЕ

Пакет GEOquery обеспечивает мост между инструментами анализа BioConductor и обширными общедоступными ресурсами данных, содержащихся в репозиториях NCBI GEO.Поддерживая полное богатство данных GEO, а не сосредотачиваясь на получении только «чисел», можно интегрировать данные GEO в текущие структуры данных Bioconductor и довольно быстро и легко выполнять анализ этих данных или экспортировать данные в любой количество форматов для использования другими инструментами или для локального хранения и интеллектуального анализа данных. Мы надеемся, что GEOquery откроет данные GEO более полно для биоинформатического сообщества в целом.

БЛАГОДАРНОСТИ

Мы хотели бы поблагодарить сотрудников NCBI GEO за ценный вклад и поддержку в процессе разработки.

Конфликт интересов : не объявлен.

ССЫЛКИ

, и другие.

Ncbi geo: добыча миллионов профилей экспрессии — база данных и инструменты

,

Nucleic Acids Res.

,

2005

, т.

33

(стр.

562

566

) и др.

Bioconductor: разработка открытого программного обеспечения для вычислительной биологии и биоинформатики

,

Genome Biol.

,

2004

, т.

5

Основная группа разработчиков R

,

R: язык и среда для статистических вычислений. R Фонд статистических вычислений

,

2005

. , и другие.

Limma: линейные модели для данных микрочипов

,

Решения для биоинформатики и вычислительной биологии с использованием R и Bioconductor

,

2005

Нью-Йорк

Springer

(стр.

397

420

)

Заметки автора

Опубликовано Oxford University Press 2007

Об эффективности обогащения пути de novo

Современные высокопроизводительные технологии OMICS (геномика, транскриптомика, протеомика, метаболомика и др.)) приводят к экспоненциальному росту биологических данных. При постоянном снижении затрат теперь можно определять активность генов, белков и метаболитов, их химическую модификацию (фосфорилирование, метилирование и т. Д.), А также мутации в масштабе генома. Например, один только комплексный анализ экспрессии генов (GEO) содержит> 51 000 записей исследований, полученных от> 1600 организмов. 1 Более того, многие международные консорциумы собрали данные из тысяч образцов, например, Международный консорциум по геному рака 2 собрал данные о 50 типах рака, полученных с помощью нескольких технологий OMICS.Чтобы получить целостное представление о таких огромных наборах данных, сетевой анализ стал многообещающей альтернативой традиционным подходам к обогащению, таким как обогащение онтологии генов 3 или анализ обогащения набора генов. 4 Цель состоит в том, чтобы изучить системные изменения, связанные с конкретным состоянием, путем проецирования экспериментальных данных на сетевые модули, представляющие условно нарушенные биологические процессы. Несмотря на собственный шум и неполноту имеющихся в настоящее время сетей, сетевой анализ имеет неоспоримые преимущества.Он может фиксировать модульное взаимодействие биологических объектов и процессов, упускаемых из виду в традиционных методах обогащения 5 , и может дополнительно раскрывать молекулярные взаимодействия, не охваченные четко определенными путями. 6 Кроме того, сетевые методы обогащения путей могут распутать перекрестные помехи между путями или суб-механизмами, которые остаются необнаруженными в традиционных методах обогащения путей с известными путями, такими как KEGG или Reactome. 7

Обогащение пути De novo

За прошедшие годы было предложено несколько подходов для сетевого анализа экспериментальных данных.В то время как некоторые методы используют топологию сети для увеличения оценок известных путей 4, 8,9,10,11,12,13,14,15,16 , другие полагаются на экспериментальные данные для восстановления сети взаимодействия для конкретных условий 17, 18,19,20 . Здесь мы сосредоточимся на методах, которые выполняют обогащение пути de novo. Эти методы объединяют экспериментальные данные с крупномасштабной сетью взаимодействия для извлечения подсетей, обогащенных биологическими объектами, активными в данном наборе экспериментальных данных. Определение активного зависит от типа набора данных, например, от дифференциальной экспрессии в случае данных экспрессии генов.

Были разработаны разнообразные стратегии для методов обогащения de novo пути. Подводя итог современному уровню техники, мы классифицируем существующие методы по четырем категориям (дополнительный рисунок 1): (1) методы оптимизации совокупных оценок, (2) подходы, охватывающие модули, (3) подходы распространения оценок и (4) кластеризация. основанные подходы. Подробное описание этих классов приведено в дополнительном материале. Хотя существует несколько таких методов (см. Таблицу 1), нет никаких рекомендаций, которые могли бы помочь потенциальным пользователям в выборе подходящего инструмента.Чтобы восполнить этот пробел, мы представляем сравнительный анализ выбранных инструментов по разным наборам данных и настройкам параметров, а также предлагаем первый золотой стандарт для количественной оценки методов обогащения путей de novo (рис. 1).

Таблица 1 Список общедоступных методов пополнения сети de novo в алфавитном порядке (7 февраля 2016 г.) Рис. 1

Типичный рабочий процесс для обогащения пути de novo. Основная гипотеза заключается в том, что гены, специфичные для фенотипа (передний план, FG), по-разному экспрессируются во многих выборках случаев по сравнению с контрольной группой ( 1 , 2 ). Используя статистические тесты, можно определить, на какие гены влияет фенотип. ( 3 ) и наложить эту информацию на сеть взаимодействия ( 4 ) Инструменты обогащения пути de novo нацелены на извлечение подсетей, обогащенных фенотип-специфичными генами FG ( 5 ) Сравнение нескольких таких методов — открытый вопрос

Проблемы при оценке инструментов de novo обогащения пути

Методы обогащения пути относятся к семейству неконтролируемых статистических алгоритмов обучения.В этом контексте неконтролируемый означает, что качество потенциальных решений не может быть оценено объективно, если оптимальное решение не известно априори, т. Е. Необходим золотой стандарт.

В случае обогащения пути de novo такой золотой стандарт состоит из генов, которые, как известно, имеют отношение (или не имеют отношения к условиям), измеренным в экспериментальных данных. Другими словами, необходим набор генов переднего плана (FG) и набор фоновых генов (BG), чтобы можно было использовать долю генов FG (релевантных) по сравнению с генами BG (несущественными) в извлеченных подсетях. как показатель эффективности.Ниже мы обсудим, почему такой золотой стандарт в настоящее время недоступен.

Специфические для болезней пути из базы данных KEGG 21 можно рассматривать как потенциальный золотой стандарт, поскольку они охватывают многие известные гены (и их взаимодействие), связанные с определенным заболеванием или биологической функцией. Однако эти гены составляют неполный набор генов FG, поскольку маловероятно, что известны все гены, связанные с заболеванием. Кроме того, нет различий между потенциальными генами FG и наборами генов BG.Это смещение препятствует справедливой и надежной оценке инструментов обогащения путей de novo с использованием таких баз данных.

Чтобы решить эту проблему, мы предлагаем протокол для создания искусственных, беспристрастных наборов данных FG и BG золотого стандарта. Наш подход основан на двух основных предположениях:

Уровень сигнала

Уровень сигнала, также известный как отношение сигнал / шум, он описывает несходство значений экспрессии для данного набора генов FG по сравнению с остальными генами BG. Чем выше сила сигнала, тем более разнообразны профили экспрессии генов FG по сравнению с генами BG.Таким образом, мы можем ожидать, что методы обогащения путей более легко их идентифицируют.

Разреженность

Моделирует среднее расстояние между генами FG на графике. Чем ниже разреженность, тем более плотно гены FG распределены по сети, так что ожидается, что методы обогащения пути их легче найти.

Стратегия анализа

Мы систематически генерировали наборы данных тестовой экспрессии с предварительно выбранными (синтетически) наборами генов FG и BG. Впоследствии репрезентативные инструменты расширения сети de novo были применены для идентификации модулей с высоким содержанием FG (и с низким уровнем BG) по наборам параметров для каждого инструмента и для различных сложностей проблем, т.е.е. разные уровни мощности и разреженности сигнала. Мы использовали две общие сети белок-белковых взаимодействий, а именно базу данных эталонных белков человека (HPRD) 22 и базу данных межлоготипных взаимодействий (I2D). 23

Решение для обработки данных, расширяющее возможности исследований в области популяционной геномики

Абстрактные

В этой статье рассказывается, как Illumina Платформа Connected Analytics ® (ICA) используется в качестве фундамент, на котором строится настраиваемая среда анализа геномики построен.Среда управляет и обрабатывает большие объемы разнородные наборы данных, включая геномные и фенотипические данные.

Все необходимые функции построены поверх ICA. компоненты платформы. Некоторые из предлагаемых функций включают: извлечение, преобразование и загрузка (ETL) и масштабируемое хранилище данных в данных склад; как высокоуровневые, так и низкоуровневые запросы данных, что позволяет гибко и эффективное использование системы; предварительно упакованный, расширенный анализ, который включает спецификацию рабочего процесса, распределенную обработку данных и визуализация результата.

В заключение мы расскажем, как реализовать различные необходимые функциональные возможности использовали преимущества работы на согласованной платформе и обсудить преимущества и извлеченные уроки.

Введение

Пейзаж анализа геномных данных становится все более сложным из-за богатства и большого объема доступных данных. Включение генетической информации в здравоохранение будет иметь большое влияние в различных областях, таких как понимание роли, которую гены играют в заболевании, как генетика влияет на существующие реакции на лекарства или разработка новых лекарств.

Чтобы полностью реализовать потенциал геномики в здравоохранении, исследователям нужны как данные, которые становятся более доступными, так и современные системы, в которых они могут легко анализировать данные.

В этой статье мы описываем работу, проделанную для создания сложной среды анализа геномики, основанной на платформе Illumina Connected Analytics ® (ICA). Мы начнем с краткого представления платформы и дадим более подробную информацию о целях среды.Затем мы обсуждаем улучшения и сборки компонентов. Мы комментируем использование среды геномного анализа во время исследовательской деятельности по открытию мишеней для лекарств. В заключение мы приводим извлеченные уроки.

Платформа ICA

Платформа ICA — это фундамент, на котором мы построили среду анализа геномики. ICA — это современная облачная платформа, которая позволяет решать сложные задачи, и которую мы дополнительно усовершенствовали с помощью расширений, ориентированных на исследования. Платформа предоставляет всю необходимую инфраструктуру и функции, необходимые для создания решения, и имеет дело «из коробки» со многими необходимыми нефункциональными аспектами, такими как шифрование, резервное копирование, выделение облачных экземпляров, аудит и т. Д.

Наиболее важными для нашей работы компонентами ICA являются:

  • Bench — интерактивная среда обработки данных, которую можно использовать как для исследований, так и для пользовательских сложных визуализаций
  • Base — эффективное и масштабируемое решение для хранилища данных, которое может хранить разнородные данные
  • Flow — расширяемый механизм выполнения рабочего процесса, поддерживающий «из коробки» инструменты биоинформатики.
  • Genomic Data Storage (GDS) — служба управления файлами и хранения, используемая всеми другими модулями

Обзор платформы можно увидеть на Рисунке 1.

Рисунок 1. Обзор ICA

Среда анализа геномики (GAE)

Целью среды анализа является обеспечение возможности анализа генетических маркеров, данных фенотипа, данных электронных медицинских карт (EMR) и любых других необходимых справочных баз данных. Такой анализ позволяет использовать различные варианты использования, которые могут помочь, например, в идентификации и открытии мишеней лекарств.

Создание GAE поверх ICA использует все компоненты платформы и влечет за собой множество результатов:

  • Подход к управлению хранилищем данных, в том числе, какой тип данных хранится в каком формате, какая схема используется для структурированных данных, и как к данным можно получить доступ, выполнить резервное копирование и защиту.Эта часть опирается на GDS и Base .
  • Рабочие процессы для быстрого и экономичного выполнения больших сложных вычислений. Они дополняют существующий набор рабочих процессов, предлагаемых платформой ICA (например, вызов вариантов с помощью Dragen, анализ РНК и т. Д.), С учетом требований конкретного проекта. Эта часть основана на модуле Flow ICA.
  • Научные записные книжки и шаблоны и примеры исходного кода, используемые в части исследования данных. Некоторые примеры представляют собой оболочки, которые скрывают детали при взаимодействии с компонентами платформы, что повышает эффективность исследователей и позволяет им сосредоточиться на реальном анализе.Эта часть основана на модуле Bench ICA.
  • Дополнительные визуализации, интегрированные в систему. Приложение визуализации управляет приемом данных и любой предварительной обработкой, необходимой для визуализации, путем интеграции сторонних приложений визуализации в рабочие пространства Bench для обеспечения бесперебойной работы.

Важной целью GAE является предоставление удобного доступа к различным уровням абстракции для анализа, запросов и визуализаций.Исследователи могут легко разработать (или просто изучить) любой компонент на разном уровне абстракции. Это дает системе большую гибкость и позволяет исследователям, если необходимо, адаптировать систему к своим потребностям. Выгоды:

  • Гибкость — исследователи могут создавать / изменять существующие активы
  • Открытость — исследователи могут использовать разные методы / алгоритмы
  • Контроль — результаты можно детально проверить
  • Эффективность — исследователи работают с тем уровнем абстракции, который им наиболее удобен.

Обзор уровней абстракции представлен на рисунке 2.

Чтобы подробно описать, как работает система, мы будем использовать синтетический и упрощенный вариант использования. Этот вариант использования следует рассматривать не как основную цель системы, а как дидактический пример, который позволяет представить систему.

Рисунок 2. Различные уровни абстракции

Пример использования

Для целей этого сообщения в блоге мы будем использовать следующий гипотетический вариант использования; Исследование пытается найти область в геноме, где варианты коррелируют в когорте молодых (ish) пациентов (родившихся после 1965 года) с диагнозом диабет, и используют их индекс массы тела в качестве коварианты.

Чтобы такой анализ был возможен, нам нужны генотипические, фенотипические данные и данные ЭМИ, и мы обсуждаем, как они попадают в организм и обрабатываются. Хотя включение не является строго частью варианта использования, во многих проектах это важный шаг. В качестве источников данных были выбраны UK Bio Bank и FinnGen.

Компоненты

Мы представим некоторые компоненты, необходимые для примера использования. В ходе обсуждения мы укажем на преимущества использования платформы ICA для этого типа проектов и на то, как использование ICA может ускорить аналогичные проекты, основываясь на существующем коде, опыте и модулях.

Компоненты, описанные далее, можно грубо разделить на компоненты ETL и хранилища, которые используются во время настройки проекта и в заранее определенные моменты времени для приема / удаления данных. Компоненты запросов и анализа, которые используются в повседневной исследовательской деятельности. А пользовательские компоненты визуализации использовали визуализацию результатов анализа.

ETL — данные фенотипа биобанка Великобритании

Получение фенотипических данных UK Bio Bank представляет собой проблему из-за размера и неоднородности данных. Данные имеют (на данный момент) 7774 независимых поля с различными типами данных (целые, категориальные, непрерывные, даты и т. Д.).) и специальные характеристики (например, разные кодировки, разное время сбора, разные размеры и т. д.).

Структурированные данные предоставляются UK Bio Bank в текстовом (зашифрованном) формате, который не подходит для запросов и интеграции с другими типами данных.

Помимо структурированных данных, некоторые поля связаны с необработанной информацией, такой как изображения и генетическая информация (например, вмененные генотипы, экзом и т. Д.), Которую необходимо обрабатывать другим способом.

Мы выбрали следующие варианты загрузки данных:

  • Простые структурированные данные были загружены в систему хранилища данных (модуль Base ICA), разделены на несколько таблиц и с сохранением достаточного количества информации для прямого взаимодействия с базой данных при необходимости (например: сохранение и имени поля, и идентификатора в столбце имя)
  • Необработанные специфические данные были загружены отдельно в систему хранения ICA и были преобразованы в наиболее подходящий формат с учетом используемых инструментов, сохраняя при этом все данные доступными

В системе предусмотрены удобные способы (библиотечные функции, принимающие в качестве параметра файл необработанных данных) для выполнения следующих задач управления:

  • Добавление новых данных (например: новые измерения для некоторых фенотипов)
  • Удаление данных (например, пациент, отозвавший свое согласие)

Каждое поле данных подробно описано на веб-сайте демонстрации данных UK Bio Bank.Например, поле с идентификатором 2443 (представлено 4 столбцами (по одному столбцу для каждого экземпляра):

Значение значения в столбцах определяется кодировкой данных, в этом случае 0 представляет «Нет», 1 представляет «Да», -1 представляет «Не знаю» и -3 представляет «Предпочитаю не отвечать. ».

Вся необходимая информация (необработанные данные и кодировки) загружается в виде таблиц SQL, а имена таблиц и полей дополняются фактическими именами для удобства чтения. В приведенном выше примере все экземпляры хранятся в одном столбце, например:

В следующем разделе мы покажем, как это упрощает запросы.

Важно отметить, что, хотя мы показали здесь пример простых категориальных данных, UK Bio Bank имеет несколько типов данных (целые числа, числа с плавающей запятой, дата, время и т. Д.) С различными характеристиками (например, экземпляры — которые — момент времени сбора данных; значения массива — множественные измерения и т. д.)

ETL — Другие исследования GWAS

FinnGen — это финский проект персонализированной медицины, который периодически публикует свои данные. Данные содержат результаты исследования GWAS, проведенного для 176 тыс. Образцов и 17 млн ​​вариантов, проанализированных на 2444 фенотипа.FinnGen использует версию генома GRCh48.

Pan UK BioBank — это набор анализов множественного происхождения фенотипов UK BioBank в 6 группах происхождения. Это приводит к 16 119 сводным статистическим данным общегеномных ассоциативных исследований, которые передаются сообществу.

Преобразование позиции из одной геномной сборки в другую и сохранение только одного набора позиций приведет к потере информации, потому что не все позиции могут быть преобразованы. Было решено сохранить исходные координаты каждого набора данных (GRCh48 и GRCh47), а также выполнить преобразование в недостающую сборку (например: преобразовать позиции FinnGen также в GRCh47).Это позволяет полностью контролировать решение, которое может привести к игнорированию части информации при выполнении анализа. В схеме есть поле (EXTRA), в котором может храниться дополнительная, изученная конкретная информация в виде JSON, которую также можно запросить при необходимости. Например, для Pan UK Biobank поле EXTRA содержит:

{«pval_heterogenity»: 2.11e-01}


Пример сохраненных данных (некоторые столбцы / значения были опущены для краткости):

Анализ

— компонент запроса

Одним из важных аспектов системы является обеспечение легкого взаимодействия с данными.Для этой цели был построен уровень абстракции, чтобы скрыть детали хранилища данных, но при необходимости предоставляя полный контроль.

Лучшим примером этого являются данные фенотипа UK Bio Bank. Эти данные распределены по нескольким таблицам в хранилище данных и имеют несколько особенностей:

  • Кодировки (например, как кодируется мужчина / женщина? Как кодируется диагностика? И т. Д.)
  • Некоторые данные были собраны в разные моменты времени (например, в 2005 году, затем снова в 2010 году), концепция называется экземпляром.
  • Некоторые данные представлены в виде временных рядов (например, эпизоды в больнице)

Вы можете увидеть пример API на рис. 3.

Рис. 3. API высокого уровня для доступа к данным UK Bio Bank (Примечание: значения данных показанные здесь случайным образом сгенерированы для демонстрационных целей, а не на основе фактические данные).

Этот запрос показывает некоторые особенности абстракции:

  • Для диагностики используется другой тип кодирования. В примере показаны фекоды из PheWasCatalog, но также поддерживаются коды ICD9 и ICD10.
  • Использование заголовков полей или кодов полей. В этом примере большинство из них — заголовки полей, но для «Год рождения» поле кода 34 находится в предложении «где».
  • Проведение тестов по всем экземплярам. В этом примере используется любой случай, когда «Диабет, диагностированный врачом» — «Да».
  • Использование значений вместо закодированных значений. В примере «Да» вместо числовой кодировки, используемой для «Диабет, диагностированный врачом»
  • Имена столбцов результирующего фрейма данных могут быть переименованы по желанию
  • Несколько полей могут быть объединены в условиях, как в предложениях «select», так и в «where».
  • Можно запросить прием в стационар (укбб.PhenoHesin)

Назначение API — дать возможность исследователю упростить запрос данных на высоком уровне. Если API не может предоставить конкретный тип запроса, пользователь может использовать его в качестве отправной точки, а затем может адаптировать SQL-запрос нижнего уровня для получения желаемого результата. Для запроса на рисунке 3 полный SQL-запрос показан на рисунке 4. Можно увидеть, что, хотя вся информация все еще присутствует (коды и заголовки полей, найденные значения, условия и т. Д.), Ее гораздо труднее читать и понять, каковы были первоначальные намерения.Это только для сложных случаев использования, и мы постоянно пытаемся улучшить высокоуровневый API для поддержки широкого спектра случаев.

Рисунок 4. Версия SQL-запроса для запроса на основе API, показанного на рисунке 3. Анализ

— GWAS

Из-за интенсивных вычислительных требований, предъявляемых к анализу GWAS, полный анализ GWAS в масштабе генома обычно не выполняется в модуле Bench ICA, а скорее как рабочий процесс в модуле Flow . Предоставляются библиотечные функции (в Python и R), чтобы максимально упростить выполнение GWAS.

Процесс следующий:

Должна быть предоставлена ​​выборочная когорта. Это можно сделать либо с помощью PhenoQuery (как описано выше), либо другим способом, который генерирует фрейм данных, содержащий список значений фенотипа и ковариаций.

  • Установите любой GWAS и параметры фильтрации, такие как области включения / исключения, ограничения качества и т. Д.
  • Определите соответствующие фенотипы и ковариаты
  • Запустить анализ
  • Просмотрите результаты анализа и сохраните результат для дальнейшего использования

Все результаты хранятся в хранилище данных для дальнейшего анализа и хранения в тех же структурах, в которых хранятся данные FinnGen и PanUKBioBank.Это делает запросы и поиск еще более мощными, поскольку вы можете запрашивать сразу весь набор данных.

Пример исполнения:

Любой ранее выполнявшийся GWAS можно получить с помощью одного вызова функции по идентификатору, имени или другим полям, например:

Визуализация — PheWeb

Одним из основных направлений GAE было предоставление множества возможностей для анализа и визуализации данных о населении. Для этого мы использовали приложение с открытым исходным кодом PheWeb.Визуализация интегрирована в полный поток, и новые результаты будут обрабатываться автоматически, когда они станут доступны.

Категории, в которых также настраиваются различные фенотипы, чтобы упростить навигацию. Пример можно увидеть на рисунке 5.

Рисунок 5. Визуализация результатов GWAS с помощью PheWeb.

Обсуждение и выводы

Создание сложной системы исследования может быть сложной задачей, особенно в области, в которой данные, инструменты и понимание развиваются так же быстро, как в случае с геномикой.Наличие хорошего фундамента, на котором можно строить, имеет важное значение для успеха такого проекта. Итак, мы можем спросить: «Какая часть платформы была важна для проекта?» и «Что мы узнали?»

Ответ на первый вопрос: «Какая часть платформы была важна для проекта?» — это возможность выполнять любую задачу программно (через API) с теми же результатами, что и при выполнении человеком того же действия в графическом интерфейсе пользователя. . Это позволило нам создавать все более и более сложные процессы, в то же время давая свободу исследователям работать с основными строительными блоками.Не менее важна возможность автоматического управления общими, хорошо понятными задачами, например: контроль доступа, аудит, шифрование, резервное копирование, предоставление инфраструктуры и т. Д. Хотя корректировки все еще возможны, опыт показывает, что уже могут быть предоставлены очень хорошие значения по умолчанию, такие, что фактическим бенефициарам проекта ничего менять не нужно.

В ходе этого проекта мы узнали, что вы можете эффективно управлять большими объемами данных и анализировать их в разумные сроки.Одной из проблем, особенно в случае данных о фенотипах, была гармонизация существующих стандартов — когда они доступны — и обеспечение их удобного использования в контексте исследования. Такое использование требует объединения и связывания нескольких стандартов и / или онтологий в разных версиях и для разных сценариев использования. Хотя отображение и преобразование можно выполнять в индивидуальном порядке, наличие такой системы, как GAE, которая уже предоставляет библиотеки для этого, может значительно повысить продуктивность исследований. Эволюция структуры данных и предоставляемых возможностей будет продолжаться, потому что еще предстоит сделать много улучшений для согласования всей информации и создания более продвинутых инструментов для ее обработки, но это процесс, который ни одна организация не может выполнить самостоятельно.

.

Добавить комментарий

©2021 «Детская школа искусств» Мошенского муниципального района