Аналіз выкарыстання камп'ютэрў у біяінфарматыцы
ЗМЕСТЗМЕСТ
УВОДЗІНЫ
ГЛАВА 1 АНАЛІЗ ВЫКАРЫСТАННЯ КАМП'ЮТЭРЎ У БІЯІНФАРМАТЫЦЫ
§1. Асноўныя прымяненні інфармацыйных тэхналогій
§2 Банкі даных біялагічнай інфармацыі
§3 Візуалізацыя біялагічнай інфармацыі
§4 Пашуковыя сістэмы
ГЛАВА 2 ВЫКАРЫСТАННЕ ІНФАРМАЦЫЙНЫХ ТЭХНАЛОГІЙ ДЛЯ ЗАДАЧ ПАРАЎНАННЯ Ў БІЯІНФАРМАТЫЦЫ
§1 Супастаўленне з узорам
§2 Параўнанне структур бялкоў
ГЛАВА 3
ВЫКАРЫСТАННЕ ПРАГРАМНЫХ БІБЛІЯТЭК
§1 Бібліятэка BioJava
Глава 4 ПРАКТЫЧНАЕ ВЫКАРЫСТАННЕ БІБЛІЯТЭКІ BIOJAVA
§1 Пастаноўка задачы
§2 Усталёўка бібліятэкі
§3 Выбар алгарытмаў
§4 Напісанне праграмы пошуку найбліжэйшых паслядоўнасцяў
§5 Тэсціраванне праграмы пошуку найбліжэйшых паслядоўнасцяў
ЗАКЛЮЧЭННЕ
СПІС ВЫКАРЫСТАНАЙ ЛІТАРАТУРЫ
ДАДАТАК 1
УВОДЗІНЫ
Сёння ўсё хутчэй нарастае аб'ём малекулярна-біялагічных і малекулярна-генетычных даных. Асэнсаванне гэтых каласальных па аб'ёмах даных ужо немагчыма без прыцягнення інфармацыйных тэхналогій і матэматыкі. Менавіта таму на стыку інфарматыкі, біялогіі і матэматыкі ўзнікла біяінфарматыка. Пад біяінфарматыкай зараз разумеюць прымяненне камп'ютэраў для вывучэння біялагічных аб'ектаў. У больш вузкім сэнсе яе можна разумець як прымяненне камп'ютэрных метадаў для вырашэння задач малекулярнай біялогіі. Сярод асноўных задач біяінфарматыкі вылучаюць:
l вывучэнне геномаў
l аналіз і прадказанне структуры бялкоў
l аналіз і прадказанне ўзаемадзеяння бялкоў
Біяінфарматыка ўключае ў сябе наступныя элементы:
l базы даных, у якіх захоўваецца інфармацыя пра біялагічныя аб'екты
l набор інструментаў для аналізу і апрацоўкі гэтай інфармацыі
l распрацоўку матэматычных мадэляў біялагічных аб'ектаў і алгарытмаў рашэння разнастайных біялагічных задач
Сярод банкаў даных найбольш вядомым прадстаўніком з'яўляецца Protein Data Bank (PDB) (1). Гэта сховішча трохмернай структурнай інфармацыі аб бялках і нуклеінавых кіслотах. Гэтыя даныя звычайна атрымоўваюцца з дапамогай рэнтгенавай крысталаграфіі ці спектраскапіі на аснове ядзерна-магнітнага рэзанансу. Напаўняюць банк біёлагі і біяхімікі эксперыментальнымі данымі.
На бягучы час існуе шмат пакетаў праграм, якія прыназначаны для работы з біяфізічнай і біяхімічнай інфармацыяй. Вылучаюць наступныя накірункі:
l візуалізатары інфармацыі з банкаў даных біялагічнай інфармацыі
l прадказанне другаснай ці трэцічнай структуры бялку па вядомай першаснай структуры
l прадказанне ўзаемадзеяння бялок-бялок і бялок-рэчыва
l параўнанне бялкоў з банкаў даных і ацэнка іх падабенства
l пабудова іерархічных дрэваў эвалюцыі біялагічных аб'ектаў
Варта заўважыць, што ўсе гэтыя банкі і праграмы пабудаваны з улікам існуючых алгарытмаў збору, захавання і апрацоўкі біялагічнай інфармацыі. З-за таго, што амаль усе задачы адносяцца да класу NP-поўных, то атрыманне рашэння ператвараецца ў складаную задачу. З-за медыцынскай важнасці гэтым праблемам прысвечана шмат увагі, што выклікае цеснае ўзаемадзеянне інфарматыкаў, біяхімікаў і біяфізікаў. Гэтыя праблемы і будуць асвечаны ў дадзенай працы.
ГЛАВА 1 АНАЛІЗ ВЫКАРЫСТАННЯ КАМП'ЮТЭРЎ У БІЯІНФАРМАТЫЦЫ
§1. Асноўныя прымяненні інфармацыйных тэхналогій
Як ужо было сказана, выкарыстанне камп'ютэраў для вырашэння біялагічных задач стала неабходным. Асноўныя сферы іх прымянення наступныя:
l камунікацыя
l кіраванне прыстасаваннямі
l вылічэнні
l захаванне
Камп'ютэры шырока выкарыстоўваюцца для кіравання разнастайнымі прыстасаваннямі для працы з біялагічнымі аб'ектамі: машынамі для секвенціравання ДНК, брадзільнымі чанамі, біярэактарамі і гэтак далей. Гэтыя устаноўкі кіруюцца праграмуемымі рукамі-робатамі і змяншаюць патрэбу ў людзях-аператарах. Там, дзе вельмі важны час выканання, камп'ютэры выйграюць у людзей, бо могуць працаваць без перапынкаў і з вялікай дакладнасцю.
З развіццём сеткавых тэхналогій і персанальных камп'ютэраў падрыхтоўка вучоным артыкула стала не толькі ў разы хутчэйшым, але і яго распаўсюджванне таксама паскорылася. Зараз мала хто з вучоных будзе адразу звяртацца да папяровага выдання, а хутчэй за ўсё звернецца да адной са шматлікіх баз даных біялагічных структур. Стала магчымай сумесная праца вучоных у геаграфічна аддаленых рэгіёнах.
Вылічальныя задачы ў біяінфарматыцы прадстаўлены вельмі шырока: ад візуалізацыі і пошуку падобных амінакіслотных ланцужкоў да мадэліравання ўзаемадзеяння складаных бялкоў па трохмерных іх структурах. Рашэнню такіх задач дапамагае вялікая колькасць гатовых праграмных сродкаў, а таксама наяўасць гатовых праграмных бібліятэк, якія спрашчаюць напісанне новых праграм і падтрымку старых.
Функцыі захавання шырока прадстаўлены ў выглядзе разнастайных сховішчаў інфармацыі, адрозных па сваёй эфектыўнасці, даступнасці і характары інфармацыі, для працы з якой яны прыназначаны.
§2 Банкі даных біялагічнай інфармацыі
Адной з найважнейшых частак прымянення камп’ютэраў у малекулярнай біялогіі з’яўляецца захаванне біялагічнай інфармацыі. Для гэтай мэты існуе шэраг спецыяльных сховішчаў, гэтак званых банкаў даных ці баз даных. Яны знаходзяцца ў цэнтры выкарыстання інфармацыйных тэхналогій у біяінфарматыцы. Насамрэч, большасць аперацый па вылічэннях і камунікацыі заснавана на даных, што знаходзяцца ў банках даных. Інфармацыя ў іх захоўваецца на трывалай і доўгачасовай аснове, амаль не падвяргаецца зменам, і яе форма прыстасаваная для хуткага выканання аперацый пошуку, сартыроўкі і іншых.
Існуе шэраг розных тыпаў такіх сховішчаў: банкі нуклеатыдных паслядоўнасцяў, бялковых паслядоўнасцяў, трохмерных структур, паслядоўнасных матываў (матыў – невялікі структурны элементы, які сустракаецца ў многіх пратэінах, напрыклад, α-спіраль). У табліцы 1.1 прыведзены некаторыя прадстаўнікі кожнага тыпу баз даных (2).
Табліца 1.1. Тыпы баз біялагічных даных
Тып базы даных | Прыклады | Заўвага |
Нуклеатыдныя паслядоўнасці | GenBank | Адна з найвялікшых баз даных паслядоўнасцяў |
EMBL | Еўрапейская лабараторыя малекулярнай біялогіі | |
NDB | База даных нуклеінавых кіслотаў | |
Бялковыя паслядоўнасці | SWISS-PROT | Швейцарскі і Еўрапейскі інстытуты біяінфарматыкі |
PIR | Рэсурс інфармацыі пра бялкі | |
Трохмерныя структуры | PDB | Банк пратэінавых даных |
MMDB | База даных малекулярнага мадэліравання | |
Паслядоўнасныя матывы | LIGAND | Хімічныя структуры і рэакцыі |
PROSITE | Паслядоўнасныя матывы | |
ProDOM | Бялковыя дамены |
Подобные работы: