Бидний тухай
Багш ажилтан
Сүүлийн жилүүдэд богино пептидүүдийн (2-5 амин хүчлээс тогтсон) сельфассемблинг (self-assembling) процесс, түүний үр дүнд үүссэн наноматериалын хэрэглээ судлаачдын сонирхлыг ихээр татаж байна. Богино пептидүүд орчноосоо хамааран янз бүрийн нанофибр, наносүв зэрэг бүтэц эсвэл гидрогелиүд үүсгэдэг. Пептидийг бүрдүүлж буй амин хүчлийн шинж чанарболон уусгагчийн концентраци ба шинж чанар зэрэг олон төрлийн хүчин зүйлс сельф-ассемблинг процесс болон үүсэх бүтцэд нөлөөлдөг. Пептидэд суурилсан эдгээр материалыг нанотехнологи, биотехнологи, анагаах ухаан зэрэг олон салбарт ашиглаж байна. Тухайлбал, пептидэд суурилсан гидрогелийг 2D принтерийн бэх, эсийн өсгөврийг тэжээлт орчин, эмийн молекул зөөвөрлөгч зэрэгт ашиглана. Сонирхолтой нь туйлт уусмал дахь сельф-ассемблинг процесст амин хүчлүүдийн гидрофоб харилцан үйлчлэл чухал үүрэгтэй. Тиймээс уг процесст гидрофоб амин хүчлийн үзүүлэх нөлөөг ойлгох нь чухал. Бид молекулын динамик симуляциар ароматик биш, гидрофоб амин хүчлээс тогтсон Val-Val-Ile (VVI) пептидийн уусмалаас хамаарсан сельф-ассемблинг процессыг судалж, атомын түвшинд тайлбарлав. Симуляцийн үр дүнд уг пептид нь сельф-ассемблинг болох нь термодинамикийн хувьд таатай бөгөөд усан орчин дахь чөлөөт энерги (∆G) нь ойролцоогоор -3 ккал/ моль байв. Этанол ба гексафторофорпанолын усан уусмалд чөлөөт энергийн утга буурч байсан нь сельф-ассемблинг процесс илүү таатай болж байгааг харуулав. Эдгээр чөлөөт энергийн утгууд нь өмнөх судлаачдын гүйцэтгэсэн туршилтын утгатай ойролцоо гарч байгаа нь тооцооллын үр дүн нарийвчлал сайтай болохыг харуулна. Мөн симуляцийн явцад β-ялтас хоёрдогч бүтэц үүсгэх эрмэлзлэлтэй байв. Эцэст нь Япон улсын Ёкохамагийн Их Сургуулийн профессор Изүрү Кавамүра профессортой хамтарсан туршилтаар VVI пептид уусмалаас хамааран нанофибр эсвэл гидрогель материал үүсгэж байгааг туршилтаар батлав.
Сүүлийн жилүүдэд тооцооллын биологи болон биоинформатикийн аргуудыг эмийн нээлт ба хөгжүүлэлтэд өргөн ашиглаж байна. Молекулын докинг болон виртуал скринингийн аргаар лиганд, жижиг молекулуудыг уурагтай хэрхэн харилцан үйлчлэхийг таамагладаг ба шинэ эмийн нээлт, загвар боловсруулахад хэрэглэдэг. Эм эсвэл лиганд молекулын бай уурагтай харилцан үйлчлэх боломжит байрлалыг тооцоолдог арга нь молекулын докинг бөгөөд олон тооны молекулуудыг лабораторийн туршилт хийхгүйгээр бай уурагтай харилцан үйлчлэх механизмыг тооцооллын шинэ эм болох боломжтой нэгдлүүдийг эрмбэлж өгдөг арга бол виртуал скрининг юм. Судлаачид болон эмийн компаниуд эдгээр аргыг шинэ эмийн нээлтэд ихээр ашиглах болсон. Жишээ нь ковид-19 өвчний эсрэг омипалисиб/ремдесивир, типифарниб/омипалисиб, типифарниб/ремдесивир гэсэн гурван эмийн хослол нь SARS-CoV-2-ыг дарангуйлах нөлөөтэй байж болохыг тооцоолсон үр дүнгүүдийг дурдаж болно. Дээрх аргууд нь бусад өвчний эсрэг шинэ эмийн молекулыг санал болгоход чухал ач холбогдолтой юм. Энэ ажлаар дээрх виртуал скринингийн аргыг ашиглан SARS-CoV-2 вирусын Mpro уургийн эсрэг үйлчлэх боломжит эмийг илрүүлэх жишиг ажлыг танилцуулав. ZINC нэгдлийн сангаас 1366 жижиг молекулыг бүтцийг татан авч SARSCoV-2 Mpro уурагтай харилцан үйлчлэх энергийг тооцоолон, уургийн идэвхийг дарангуйлах боломжтой молекулуудыг илрүүлэв.
Биоинформатик нь биологи болон анагаах ухааны салбарын судалгааны үр дүнд бий болсон өгөгдлийг ойлгоход зориулсан арга болон программуудыг хөгжүүлдэг биологи, компьютерийн ухаан, статистик зэрэг олон салбар дундын шинжлэх ухаан юм. Энэ салбар нь сүүлийн жилүүдэд эрчимтэй хөгжиж байгаа бөгөөд гол шалтгаануудын нэг нь салбар дундын шинж чанар мөн. Хожуу үеийн дараалал тодорхойлох аргууд, масс спектрометр зэрэг өндөр бүтээмжтэй технологийн дэвшил нь асар их хэмжээний биологийн өгөгдлийг бий болгосоор байна. Эдгээр их өгөгдлийг хадгалах, анализ хийх, ойлгох зэрэгт биоинформатикийн программ хангамж, үр бүтээмжтэй алгоритмууд зайлшгүй хэрэгтэй. Иймээс 21-р зууны биологийн судалгааг биоинформатикийн анализгүйгээр төсөөлөх аргагүй юм. Цаашлаад машин сургалт, хиймэл оюуны технологийн эрчимтэй хөгжил нь биологийн их өгөгдлийг ойлгох, дүн шинжилгээ хийх, загварчлахад ашиглагдаж байна. Тухайлбал уургийн бүтцийг таамаглах AlphaFold технологи юм. Цаашлаад уураг-уургийн харилцан үйлчлэл, бодисын солилцооны замын анализ, эмийн бай уургийг таних, өвчний механизмыг илрүүлэх зэрэг олон төрлийн судалгаанд хиймэл оюун, машин сургалтын аргуудыг ашигласан хөгжүүлэлтүүд хийгджээ. Иймээс биоинформатик нь ирээдүйтэй бөгөөд хэрэгцээ шаардлага өндөртэй салбар болохыг онцлох нь зүйтэй. МУИС-д 2005 оноос тухайн үеийн Биологийн факультетын Биофизикийн тэнхим доктор, профессор П.Энхбаярын ахалсан судалгааны баг бүтцийн биоинформатикийн чиглэлийн судалгаа гүйцэтгэж эхэлсэн. Үүний зэрэгцээ биоинформатикч хүний нөөц бэлтгэх сургалтыг 2008 оноос магистрын түвшинд хичээл заахаас эхэлж, 2009 оноос бакалаврын түвшний сургалтад албан ёсоор оруулсан. Энэ хугацаанд нийт 50 гаруй биоинформатикч бакалавр, 20 гаруй магистр боловсон хүчин бэлдэв. Эдгээр төгсөгчид ШУА-ийн Физик, технологийн хүрээлэн, Математик, тоон технологийн хүрээлэн, Биологийн хүрээлэн зэрэг судалгааны байгууллагуудад ажиллаж байгаагаас гадна, хоёр төгсөгч Тайвань Улсад докторантаар суралцаж байна. Гурван судлаач биоинформатикийн чиглэлээр судалгаа хийж докторын зэрэг хамгаалсан ба МУИС, АШУҮИС, МУБИС-д багш, судлаачаар ажиллаж байна. МУИС-ийн Биоинформатик, системийн биологийн лабораторийн гишүүд нийт 100 шахам судалгааны өгүүлэл хэвлүүлснээс 30 гаруй өгүүлэл олон улсын хянан магадлагаа хийгддэг сэтгүүлд хэвлүүлсэн ба нийт 2,700 гаруй эшлэгдээд байна. Эдгээрээс Cell, Nature Nanotechnology, ACS Physical Chemistry B, Proteins, Proteins & Proteomics BBA зэрэг олон сэтгүүлүүдэд нэгдүгээр, хамтран, холбоо баригч зохиогчоор судалгааны ажлаа хэвлүүлсэн. Энэ нь бидний судалгааны ажил Монголын болон дэлхийн шинжлэх ухаанд тодорхой хувь нэмэр оруулж байгааг харуулна. Бид цаашид биоинформатикийн сургалтыг олон улсын стандартад нийцүүлэн үргэлжлүүлэх, биологи, анагаах ухааны сургалт, судалгаатай нийцсэн агуулгаар үргэлж шинэчлэн хөгжүүлж байх нь чухал. Цаашлаад биологи болон эрүүл мэндийн салбарын дотоодын судалгааны өгөгдлийг хиймэл оюун, машин сургалтын аргуудтай хослуулсан шинэ технологиудыг хөгжүүлэх чадварлаг боловсон хүчнийг бэлтгэх шаардлагатай. Мөн дотоод, гадаадын хамтын ажиллагаагаа улам өргөжүүлж, эх орны хэрэгцээ шаардлагад нийцсэн судалгааны ажил хийж гүйцэтгэх зорилготой ажиллаж байна.
Background: Leucine-rich repeats (LRRs) occurring in tandem are 20 ⎼ 29 amino acids long. Eleven LRR types have been recognized; they include plant-specific (PS) type with the consensus of LxxLxLxxNxL SGxIPxxIxxLxx of 24 residues and SDS22-like type with the consensus of LxxLxLxxNxL xxIxxIxxLxx of 22 residues. Objective: A viral LRR protein in metagenome data indicated that most of the LRRs (5/6 = 0.83) are represented by the consensus of LxxLDLxxTxV SGKLSDLxxLTN of 23 residues. This LRR shows a dual characteristic of PS and SDS22-like LRRs (called PS/SDS22-like LRR). A comprehensive similarity search was performed under the hypothesis that many proteins contain LRR domains consisting of only or mainly PS/SDS22-like LRR. Methods: Sequence similarity search by the FASTA and BLAST programs was performed using the sequence of this PS/SDS22-like LRR domain as a query sequence. The presence of PS/SDS22-like LRR was screened within the LRR domains in known structures. Results: Over 280 LRR proteins were identified from protists, fungi, and bacteria; ~ 40% come from the SAR group (the phyla Alveolate and Stramenopiles). The secondary structure analysis of PS/SDS22-like LRRs occurring sporadically in the known structures indicates three or four type patterns of secondary structures. Conclusion: PS/SDS22-like LRR forms an LRR class with PS, SDS22-like and Leptospira-like LRRs. It appears that PS/SDS22-like LRR is a chameleon-like sequence. A duality of two LRR types brings diversity.
Цөмийн цацрагаар материалын бүтэц, шинж чанар, химийн холбоосыг өөрчлөх нь химийн боловсруулалтын аргатай харьцуулахад бага температурт явуулж болох, хэрэглэгдсэн урвалж бодисын хаягдал бага, илүү үр дүнтэй байдаг. Цацрагаар бүтэц, шинж чанарыг нь сайжруулсан бараа бүтээгдэхүүнүүд нь бидний өдөр тутмын амьдралд ихээхэн тохиромжтой байдаг. Жишээ нь: хөөс, хөөсөнцөр, хөөсөн бүтээгдэхүүнүүд мөн автомашины дугуй зэргийн чанарыг сайжруулахын тулд гамма цацрагаар шардаг. Ингэснээр материалын бат бөх чанар, уян харимхай байдал зэрэг шинж чанарыг хүссэнээрээ өөрчлөх боломжийг бий болгож байна. Урин дулаан цагийн үргэлжлэх хугацаа болон жилд унах хурд тунадасны хэмжээ бага манай улсын хувьд орсон борооны усыг хөрсөнд хадгалан тодорхой хугацаа барьж байх бүтээгдэхүүн үйлдвэрлэх технологи нэвтрүүлэх нь үр тариа, хүнсний ногооны соёололт, ургацыг нэмэгдүүлэх, цаашилбал ургац хураах хугацааг богиносгох боломж бий болгоно. Иймээс энэ төслийн хүрээнд байгалийн полимер агуулсан материалыг цөмийн цацрагаар боловсруулж үр ашиг сайтай бүтээгдэхүүн гаргаж авахыг зорилоо. Монгол улсын хэмжээнд ийм төрлийн судалгаа анх удаа хийгдэж байгаа бөгөөд зорьсон бүтээгдэхүүнээ гарган авбаас цаашид үйлдвэрлэх боломжтой юм. Энэ судалгааны хүрээнд - цөмийн цацрагаар боловсруулж ус шингээгч материалыг гарган авсан технологийн судалгаа олон улсын хэмжээнд хийх, - Монгол орны хувьд түүхий эдийг сонгох, - сонгосон түүхий эдийг цөмийн цацрагаар боловсруулан хамгийн тохиромжтой технологийн шийдлийг тогтоох, - гарган авсан бүтээгдэхүүний физик химийн шинж чанарыг судлах, - мөн бүтээгдэхүүн ургамалд үзүүлэх нөлөөг судлах зэрэг ажил хийхээр төлөвлөв.
Уургийн хеликчийн төрлүүдээс зүүн эргэлттэй ба үндсэн хэлхээний карбоксил групп ба амид группийн хооронд устөрөгчийн холбоо байдаггүйгээрээ онцлог. Энэ ажлаар өгөгдлийн сангаас өндөр нарийвчлалтай тодорхойлогдсон утгуудыг сонгон авч HELFIT программ ашиглан хеликсийн параметрүүдийг тодорхойллоо.
Амилойд бета (A) пептид нь амилойд прекурсор уургийн хуваагдлаас үүсдэг 40-42 амин хүчлийн урттай пептидүүд юм. Альцгеймерийн өвчний үед Aβ пептидүүд нь олноороо цугларч, фибрил үүсгэдэг бөгөөд энэ нь тус өвчний молекул шинж тэмдэг болдог. Фибрил бүтэц үүсэх шалтгаан болон процесс нь одоо ч бүрэн тодорхой болоогүй байна. Уг пептидийн дараалалд хэд хэдэн гидрофоб амин хүчлээс тогтсон хэсэг байх ба 39-41 дугаар байрлал дахь Val-Val-Ile (VVI) амин хүчлүүд нь гидрофоб чанар хамгийн өндөр хэсэг бөгөөд селф-ассемблинг процессод чухал үүрэгтэй байж болох юм. Бид энэ ажлаар VVI трипептидийн сельф-ассемблинг процессыг молекулын динамик симуляцийн аргаар тооцоолов. Симуляцийн явцад VVI трипептид нь N- болон С- төгсгөлүүдээсээ хамааран ялгаатай димер бүтцийг үүсгэж байна. Үүссэн димер бүтцийн хувьд хоёр пептидийн хоорондох холбоосын энерги ойролцоогоор -3 ккал/моль байв. Энэ нь VVI трипептидийн сельф- ассемблинг процесс аяндаа явагдахыг харуулж байна. Димер бүтцийн амин хүчлийн хавтгай хоорондох өнцгүүдийн утгаас харвал бета-ялтас (β-sheet) хоёрдогч бүтэц үүсгэж байна. Энэ нь туршлагаар тодорхойлогдсон Aβ бүтэцтэй ойролцоо утгатай байна. Эдгээр үр дүн нь VVI хэсэг нь Aβ сельф-ассемблинг процессод чухал үүрэгтэй байж болохыг харуулж байна. Цаашлаад VVI богино пептид дээр суурилсан амилоид фибрил үүсэх процессыг саатуулах эмийн молекулыг загварчлахад чухал юм.
Уургийн хеликсийн α, 310, ω, π, PPII гэсэн төрлүүд байдаг ба эдгээрээс α-, 3(10)-, ω-, π- төрлийн хеликсүүд ихэвчлэн баруун эргэлттэй, үндсэн хэлхээний карбоксил групп ба амид группын хоорондын устөрөгчийн холбоогоор тогтворжиж байдаг. α-, 3(10)-, ω-, π- төрлийн хеликсүүдийн тогтворжилт, уурагт байх давтамж, хеликсийн параметрүүдийг бид өмнөх ажлуудаараа судалсан. Харин уургийн полипролин II (PPII) хеликс нь зүүн эргэлттэй ба үндсэн хэлхээний карбоксил групп ба амид группын хооронд устөрөгчийн холбоо байдаггүйгээрээ бусдаасаа онцлог юм. Уургийн зөвхөн цөөн тооны зарим PPII хеликсийн параметрүүдийг өмнө судалсан байдаг ба идеаль PPII хеликсийг тодорхойлогч φ, ψ өнгийн утгуудыг янз бүрээр тодорхойлон бичсэн байна. Бид энэ ажлаараа PDB өгөгдлийн сангаас өндөр нарийвчлалтай (Нарийвчлал ≤ 2.0Е) тодорхойлогдсон, давтагдаагүй (ялгаа ≥ 80%) нийт 6045 уургийн бүтцийг сонгон авч, DSSP-PPII програмаар PPII хеликсийн оноолт хийж, HELFIT програмаар хеликсийн параметрүүдийг тодорхойллоо. HELFIT програм нь хеликсийн нэг эргэлтэд оногдох тэнхлэгийн дагуух шилжилт (P), хеликсийн радиус (R), нэг эргэлтэд оногдох амин хүчлийн тоо (n), нэг амин хүчилд оногдох тэнхлэгийн дагуух шилжилт (Δz), хеликсийн алдаа (p=RMSD/(N-1)) гэсэн параметрүүдийг тодорхойлно. Энд, RMSD нь Root Mean Squares Deviation буюу өгөгдлийн цэгүүдээс хеликс хүртэлх стандарт хазайлт, N – хеликсийн урт юм. p ≤0.10 Е байвал регуляр хеликс, p >0.10 Е байвал иррегуляр хеликс гэж үзнэ. Мөн 5-10 амин хүчлээс тогтсон α, 310 болон PPII хеликсүүдийг тогтворжилтын молекулын динамик симуляцийн аргаар тодорхойлов. 6045 уургийн гинжнээс 1135 нь PPII хеликс агуулж байсан ба DSSP-PPII програмаар 4-23 амин хүчлийн урттай нийт 1384 PPII хеликс тодорхойлогдов. HELFIT програмаар 972 регуляр, 418 иррегуляр PPII хеликс тодорхойлогдсон ба хеликс урт болох тусам иррегуляр хеликсийн хувь өсөж байв. PPII хеликсийн дундаж P=9.05 Е, R=1.41 Е, n=3.09, Δz=2.08 Е, p=0.17 Е байлаа. Мөн хеликсийн тоо (давтамж) болон хеликсийн17 Биологи, Биотехнологийн судалгаа 80 жил эрдэм шинжилгээний хурал параметрүүд хеликсийн уртаас тодорхой зүй тогтлоор хамаарч байна. Бусад төрлийн хеликсүүд дээр Δz ба R–ийн хоорондын хамаарал шугаман хуулиар илэрхийлэгддэг бол PPII хеликсийн хувьд ерөнхий тохиолдолд шугаман хамаарал биелэхгүй байна. Эдгээр нь PPII хеликсийн илүү уян налархай шинж чанартай холбоотой байж болох юм. Мөн молекулын динамик симуляцийн тооцоогоор цөөн амин хүчлээс тогтсон PII хеликс хамгийн сайн тогтворжилттой (PPII>3(10)>α) байсан бол эсрэгээрээ урт хеликсийн хувьд α-хеликс хамгийн тогтвор сайтай (PPII<3(10)<α) байв.
Leucine rich repeats (LRRs) with 20–30 residues form a super helix arrangement. Individual LRRs are separated into a highly conserved segment with a highly conserved (HCS) and a variable segment (VS). In LRRs short β-strands in HCS stack in parallel, while VS adopts various secondary structures. Among eleven classes recognized, only RI-like, Cysteine-containing (CC), and GALA classes adopt an α-helix. However, the repeat unit lengths are usually different from each other. We performed some analyses based on the atomic coordinates in the known LRR structures. In the VS consensuses of the three classes, position 8 in the VS part is, in common, occupied by conserved aliphatic residue adopting an α-helix. This aliphatic residue is near to the two conserved hydrophobic residues at position 4 (in the center of β-strands) in two adjacent HCS parts. The conserved aliphatic residue plays a crucial role to preserve two parallel β-strands.
Leucine rich repeats (LRRs) are present in over 430 000 proteins from viruses to eukaryotes. The LRRs are 20 to 30 residues long and occur in tandem. Individual LRRs are separated into a highly conserved segment with the consensus of LxxLxLxxNxL or LxxLxLxxNxxL (HCS) and a variable segment (VS). In LRRs parallel stacking of short β‐strands (at positions 3‐5 in HCS) form a super helix arrangement called a solenoid structure. Many classes have been recognized. All three classes of Plant specific, Leptospira‐like, and SDS22‐like LRRs which are 24, 23, and 22 residues long, respectively, form a 3(10)‐helix in the VS part. To get a deeper understanding of sequence, structure correlations in LRR structures, we utilized secondary structure assignment and HELFIT analysis (calculating helix axis, pitch, radius, residues per turn, and handedness) based on the atomic coordinates in crystal structures of 43 LRR proteins. We also defined three structural parameters using the three unit vectors of the helix axes of 3(10)‐helix, β‐turn, and LRR‐domain calculated by HELFIT. The combination of the secondary structure assignment and HELFIT reveals that their LRRs adopt unique super secondary structures consisting of a 3(10)‐helix and one or two Type I β‐turns. We propose one structural parameter as a geometrical invariant of LRR solenoid structures. The common LxxLxxL sequence (where “L” is Leu, Ile, Val, Phe or Cys) in the three classes is an essential determinant for the super secondary structures providing a medium range interaction.
Уургийн хоёрдогч бүтэц нь түүний гуравдагч бүтэц, үүрэг, ангилалд чухал үүрэгтэй. Уургийн хоёрдогч бүтцийг ерөнхийд нь хеликс, β-утаслаг (β-strand) гэсэн 2 төрөлд хуваадаг. Хеликс нь дотроо 𝑃𝑃𝐼𝐼-, 3_10-, 𝛼-, 𝜔-, 𝜋-хеликс гэсэн төрлүүдтэй бөгөөд эдгээр хеликсийн параметрүүд, тогтвор, устөрөгчийн холбооны шинж чанар, 𝜑𝜓 өнцгүүдийн өөрчлөлтийн зүй тогтлын судалгаа нэлээд сайн хийгдсэн байна [1-5]. Харин β-утаслагийн хувьд эдгээр судалгаа огт хийгдээгүй байгаа юм. 1951 онд Pauling, L, Corey, R.B нар уургийн β-утаслагийг хеликс гэж үзэн каноник хеликсийн параметрүүдийг тодорхойлсон ч [6-7] уурагт агуулагдах бодит β-утаслагийн хувьд тооцоо хийгдээгүй байна. Энэ нь хеликсийн параметрыг тодорхойлох арга, програм байгаагүйтэй холбоотой. Бид зөвхөн 4 өгөгдлийн цэгээр хеликсийн параметрыг тодорхойлох HELFIT [8-10] программыг хөгжүүлсэн бөгөөд β-утаслагийн хеликсийн параметрүүдийг тодорхойлоход хэрэглэлээ. 6084 уургийн гинжнээс 4-11 амин хүчлийн урттай нийт 12143 β- утаслаг тодорхойлогдов. Нийт утаслагийн 5145 буюу 42.37% нь регуляр, 6998 буюу 57.63% нь иррегуляр утаслаг тодорхойлсон. β-утаслагийн дундаж амин хүчлийн тоо нь 5.21 байна. β-утаслагийн хеликсийн дундаж P = 7.21 Å, r = 1 Å, n = 2.29, Δz = 3.15 Å, p = 0.12 Å байна. Мөн утаслагийн урт ихсэх тусам регуляр утаслагийн хувь буурч иррегуляр утаслагийн хувь өсөж байна. Бусад хеликсүүдийн адил уургийн регуляр β-утаслагийн Δz болон r хоорондын хамаарал шугаман хуулиар илэрхийлэгдэж байна. Уургийн β-утаслаг нь бусад хеликстэй харьцуулахад илүү сунасан бүтэцтэй, өөрөөр хэлбэл Δz их, n болон r бага байна.
Leucine rich repeats (LRRs) are present in over 100,000 proteins from viruses to eukaryotes. The LRRs are 20–30 residues long and occur in tandem. LRRs form parallel stacks of short β-strands and then assume a super helical arrangement called a solenoid structure. Individual LRRs are separated into highly conserved segment (HCS) with the consensus of LxxLxLxxNxL and variable segment (VS). Eight classes have been recognized. Bacterial LRRs are short and characterized by two prolines in the VS; the consensus is xxLPxLPxx with Nine residues (N-subtype) and xxLPxxLPxx with Ten residues (T-subtype). Bacterial LRRs are contained in type III secretion system effectors such as YopM, IpaH3/9.8, SspH1/2, and SlrP from bacteria. Some LRRs in decorin, fribromodulin, TLR8/9, and FLRT2/3 from vertebrate also contain the motifs. In order to understand structural features of bacterial LRRs, we performed both secondary structures assignments using four programs – DSSP-PPII, PROSS, SEGNO, and XTLSSTR—and HELFIT analyses (calculating helix axis, pitch, radius, residues per turn, and handedness), based on the atomic coordinates of their crystal structures. The N-subtype VS adopts a left handed polyproline II helix (PPII) with four, five or six residues and a type I β-turn at the C-terminal side. Thus, the N-subtype is characterized by a super secondary structure consisting of a PPII and a β-turn. In contrast, the Tsubtype VS prefers two separate PPIIs with two or three and two residues. The HELFIT analysis indicates that the type I β-turn is a right handed helix. The HELFIT analysis determines three unit vectors of the helix axes of PPII (P), β-turn (B), and LRR domain (A). Three structural parameters using these three helix axes are suggested to characterize the super secondary structure and the LRR domain. Keywords: Bacterial leucine rich repeat family, Polyproline II helix, Type I β-turn, Super secondary structure, Helical parameters, Helix axis, Vector analysis.
Лейцин-баялаг давталтат уургийн рибонуклеаза ингибитор (К1) ангийн давталтын параметрүүд Б. Хонгор1 ,2 , П. Энхбаяр2* 1 Шинжлэх Ухааны Академи, Физик, Технологийн Хүрээлэн, Биофизикийн салбар 2 Монгол Улсын Их Сургууль, Хэрэглээний шинжлэх ухаан, инженерчлэлийн сургуулъ, Мэдээлэл компъютерийн ухааны тэнхим *епкИЬауаг.р@зеа$.пит.ес!и. тп Лейцин Баялаг Давталт (ЛБД) агуулсан дараалал нь вирус, бактери, архей, эукариотоос ялгасан 98000 гаруй уурагт агуулагддаг болох нь тогтоогдоод байна. Олонх ЛБД агуулсан уураг нь сигнал дамжуулалт, эсийн наалдалт, ДНХ-ийн засварлалт, рекомбинаци, транскрипци, РНХ процессинг, мөсний нуклеаци, эсийн програмчлагдсан үхэл, ургамлын дархлааны хариу үйлдэл, сүүгээр бойжигчийн торөлхийн дархлааны хариу үйлдэл зэрэг уураг-уураг, уураг-лиганд, уураг-РНХ- ийн харилцан үйлчлэлд оролцдог байна. ЛБД уургууд нь давталтын урт, хувьсах хэсгийн бүтэц болон дарааллаас хамааран “Ердийн”, “К1-төст”, “Цистейн- агуулсан”, “Бактерийн”, “80822-тост”, “Ургамлын”, “ТпЛБД”, “1ККЕКО” гэсэн найман ангид хуваагддаг. Ш-төст ангийн давталтын урт 28-29, хадгалагдсан дараалал нь ЬххЬхЬхх^х(1Ч/С)ххх§оххЬххоЬххххх хэвтэй, р-а хоёрдогч бүтцийн нэгжтэй байдаг. Энэхүү давталтын параметрүүдийг тогтоосноор уургийн бүтцийн ангилал, хомологи загварчлал, ЛБД уургийн давталтын онцлогийг тодорхойлоход чухал ач холбогдолтой юм. ЛБД уургийн Я1 ангийн 144 хоёрдогч бүтцийн нэгж давталтын параметрын утгыг НЕЬРГГ програмын тусламжтайгаар (3~а хоёрдогч бүтцүүдийн 1 нэгжийн хоорондын зай болон өнцгийг тоцоолсон. Нийт нэгж бүтцийн дундаж хоорондын зай, өнцгийн утгуудыг тооцоолов.
Сүүлийн жилүүдэд ШШҮХ-нд ялтны ДНХ-ийн 7000 гаруй биологийн дээж биетээр ба цаасан баримтаар хуримтлагдсан. Энэхүү судалгааны хүрээнд бид MonDIS нэртэй үндэсний хэмжээний анхны ДНХ-ийн мэдээллийн сан, хайлтын системийг үүсгэн байгуулсан ажлын үр дүнг тайлагнана. Мөн энэ чиглэлийн судалгаатай холбоотой хуримтлуулсан туршлага, цаашид гүйцэтгэх ажлыг танилцуулна.
Эукариот, бактери, архей болон вирусээс тодорхойлсон 430,000 гаруй уураг Лейцин Баялаг Давталт (ЛБД) агуулж байгаа нь тогтоогдоод байна. ЛБД-ууд нь 20-30 амин хүчлийн урттай бөгөөд зэрэгцсэн дараалалд тохиолддог. ЛБД агуулсан уураг нь тах, супер хеликс, эсвэл призм хэлбэрийн бүтэцтэй байх ба дотоод хүнхэр гадаргуудаа параллель β-утаслаг, гадаад гүдгэр гадаргуудаа ихэвчлэн хеликс бүтэц агуулна. Тухайн нэг ЛБД нь LxxLxLxxNxL консенсус дараалалтай сайн хадгалагдсан хэсэг (СХХ) болон хувьсах хэсэг (ХХ)-ээс бүрдэнэ. ЛБД-ын найман анги байна. Ургамлын ЛБД-ын хувьсах хэсэг нь 310-хеликс болон β-эргэлтээр тодорхойлогдох ба консенсус дараалал нь 13 амин хүчлийн урттай (xGxLPxxLxxLxx) байна. Ургамлын дархлааны системийн болон сигнал дамжуулах уургуудад ЛБД агуулагддаг. Ургамлын ЛБД агуулсан уургийн бүтцийн онцлогийг ойлгохын тулд бид DSSP-PPII, XTLSSTR ба STRIDE гэсэн гурван программ ашиглан хоёрдогч бүтцийн оноолт хийсэн. Уургийн 3D бүтэц дэх альфа-нүүрстөрөгч (Cα) атомын координатыг ашиглан HELFIT программаар хеликсийн (алхам Р, радиус r, нэг эргэлтэд оногдох амин хүчлийн тоо n, эргэлтийн чиглэл, тэнхлэгийн нэгж вектор) параметрүүдийг тодорхойлсон. ЛБД-ын хувьсах хэсэг нь N-терминал талдаа 5-аас 7 амин хүчлийн урттай баруун эргэлттэй 310-хеликс, C-терминал талдаа I төрлийн бета-эргэлтээс бүрдэж байна. Иймд ургамалын ЛБД-ын хувьсах хэсэг нь 310-хеликс болон β-эргэлт агуулсан супер хоёрдогч бүтцээр тодорхойлогдож байна. HELFIT-ийн үр дүнгээс харвал I төрлийн β-эргэлт нь баруун (+1) эргэлттэй хеликс байна. HELFIT программаар 310-хеликс (G), β-эргэлт (B), ЛБД домеин (A) тус бүрийн хеликс тэнхлэгийн нэгж векторыг тодорхойлсон. Эдгээр гурван нэгж вектороор тодорхойлогдох Ω1, Ω2, ба Ω3 бүтцийн параметр супер хоёрдогч бүтэц болон ЛБД домеины бүтцийн онцлогийг тодорхойлж байна.
Уургийн хоёрдогч бүтэц нь түүний 3D бүтэц, үүрэг, ангилалд чухал үүрэгтэй. Уурагт хеликс ба утаслаг (strand) гэсэн ерөнхий 2 төрлийн хоёрдогч бүтэц байна. Уургийн хеликсийн 310-, α- , ω-, π-, PPⅡ- хеликс гэсэн төрлүүд байдаг нь тогтоогдсон. Бид энэ ажлаараа 7 амин хүчлийн урттай уургийн бодит 310-, α-, ω-, π-, PPⅡ-, хеликсийн бүтцийн өөрчлөлтөд усан орчны үзүүлэх нөлөөг судлахын тулд 300 К температуртай, физиологийн концентрацтай усан уусмалд 10 нано секундийн хугацаатай молекулын динамикийн симуляци хийв. Динамик симуляцийн явцад хеликсийн үндсэн хэлхээний дараалсан устөрөгчийн холбоос тасарч, авч үзсэн бүх хеликсүүд өөрчлөгдөн, нийт 70 амин хүчлийн 6 нь эргэлт, 7 нь бэнд (bend), 57 нь койл хэлбэрт шилжсэн байна. Хеликсүүдийг тогтворжуулагч үндсэн хэлхээний устөрөгчийн холбоос тасран орчинтой үүсгэж буй устөрөгчийн холбоосын тоо ихсэж байна. Үндсэн хэлхээний устөрөгчийн холбоос тасарсан тохиолдолд карбоксил группийн хүчилтөрөгчийн атом болон амид группийн устөрөгчийн атом нь усны молекулуудын атомуудтай устөрөгчийн холбоос үүсгэх нөхцөл бүрдэх учир энэ нь үндсэн хэлхээний устөрөгчийн холбоос эргэж үүсэх боломжийг (орчин) хааж байна.
INTRODUCTION Mongolia is located in Central Asia has continental climate having low rainfall. Specially In spring season, it is very dry and has many storms and winds. Because of this, decertification in Southern Parts of Mongolia is getting very rapid. Besides, the increasing of the number mining company in that area can cause dusty places which is very harmful to human health. In this study, we have studied the composition of soil samples which were taken from the Southern parts of Mongolia using XRF and XRD analysis. EXPERIMENTAL 15 soil samples were taken from Dornogobi, Sukhbaatar prefecture in Southern area of Mongolia. Samples were sieved and divided into 3 parts depending on particle size with diameters more than 0.6 mm, between 0.075 mm and 0.6 mm, less than 0.075 mm. All prepared samples were analyses with ED XRF for elemental composition and XRD for structural analysis. RESULTS AND DISCUSSIONS Based on the elemental analysis we have studied correlation between elemental concentration using PCA method. We will discuss about the results of PCA analysis of soil samples in this conference.
Leucine rich repeats (LRRs) are present in over 100,000 proteins from viruses to eukaryotes. The LRRs are 20–30 residues long and occur in tandem. LRRs form parallel stacks of short β-strands and then assume a super helical arrangement called a solenoid structure. Individual LRRs are separated into highly conserved segment (HCS) with the consensus of LxxLx- LxxNxL and variable segment (VS). Eight classes have been recognized. Bacterial LRRs are short and characterized by two prolines in the VS; the consensus is xxLPxLPxx with Nine residues (N-subtype) and xxLPxxLPxx with Ten residues (T-subtype). Bacterial LRRs are contained in type III secretion system effectors such as YopM, IpaH3/9.8, SspH1/2, and SlrP from bacteria. Some LRRs in decorin, fribromodulin, TLR8/9, and FLRT2/3 from vertebrate also contain the motifs. In order to understand structural features of bacterial LRRs, we performed both secondary structures assignments using four programs—DSSP-PPII, PROSS, SEGNO, and XTLSSTR—and HELFIT analyses (calculating helix axis, pitch, radius, residues per turn, and handedness), based on the atomic coordinates of their crystal structures. The N-subtype VS adopts a left handed polyproline II helix (PPII) with four, five or six residues and a type I β-turn at the C-terminal side. Thus, the N-subtype is characterized by a super secondary structure consisting of a PPII and a β-turn. In contrast, the T-subtype VS prefers two separate PPIIs with two or three and two residues. The HELFIT analysis indicates that the type I β-turn is a right handed helix. The HELFIT analysis determines three unit vectors of the helix axes of PPII (P), β-turn (B), and LRR domain (A). Three structural parameters using these three helix axes are suggested to characterize the super secondary structure and the LRR domain.
Leucine rich repeats (LRRs) are present in over 20,000 proteins from viruses to eukaryotes. Most LRR units are 20-30 residues long and can be divided into a highly conserved segment and a variable segment. Eight classes have been recognized. Two to sixty-two units occur in tandem to form an LRR structure. The tertiary structures of these LRRs are helical, in which the β-strands of the highly conserved segments stack in parallel. This helix consists of a super helical arrangement of repeating structural units. We call it a coil of solenoids. We have used our program HELFIT to assign helical parameters to 642 LRRs of known structures of 114 proteins. We report these parameters and their correlations with eight classes of LRR, with the number of repeat units in the LRR, with oligomerization, and with ligand state of the LRR. The helical parameters of the eight LRR classes frequently overlap one another. However, the constant distance between parallel β-strands is the primary determinant of the helical parameters of the LRRs. When the repeat number, n, in LRRs is small, the LRR structures are more variable and, by inference, more flexible. In the LRRs with n ≥ 10, Δz (the rise per repeat unit) of the “RI-like” and “Cysteine-containing” classes is smaller than those of “SDS22-like”, and “Plant-specific” classes. This difference is ascribed mainly to the difference in the structural units. The helical parameters of the LRRs unambiguously describe both right handed and left handed helices, helical dimers, and subdomains if they exist. Moreover, the helical parameters sensitively detect structural changes induced by protein, protein interactions, glycosylation, and/or mutation.
The HELFIT program determines the helical parameters - pitch, residues per turn (n), radius, and handedness - and p = rmsd / (N - 1)1/2 estimating helical regularity, where “rmsd” is the root mean square deviation from the best fit helix or superhelix and “N” is helix/superhelix length. Helical secondary structures - -helix and 310-helix – and solenoid structures of leucine rich repeats (LRRs) in The Protein Data Bank (PDB) were analyzed by the HELFIT program. The results indicate that the definition of 310-helices in terms of average, uniform dihedral angles is not appropriate and that it is inherently unstable for a polypeptide to form an extended, regular 310-helix. The 310-helices observed in proteins are better referred to parahelices. A modification of the -helix, termed the -helix, that has four residues in one turn of a helix, has been identified only in synthetic polypeptides. The results also demonstrate that the right-handed -helix occur really in proteins. The solenoid structures of LRR domains in brasinosteroid insensitive 1 (BRI1), internalin J (InlJ), and internalin A (InlA) are well represented by a superhelix rather than by a circular arc.
A modification of the a-helix, termed the xhelix, has four residues in one turn of a helix. We searched the x-helix in proteins by the HELFIT program which determines the helical parameters—pitch, residues per turn, radius, and handedness—and p = rmsd/(N - 1)1/2 estimating helical regularity, where ‘‘rmsd’’ is the root mean square deviation from the best fit helix and ‘‘N’’ is helix length. A total of 1,496 regular a-helices 6–9 residues long with p B 0.10 A ° were identified from 866 protein chains. The statistical analysis provides a strong evidence that the frequency distribution of helices versus n indicates the bimodality of typical a-helix and x-helix. Sixty-two right handed x-helices identified (7.2% of proteins) show nonplanarity of the peptide groups. There is amino acid preference of Asp and Cys. These observations and analyses insist that the x-helices occur really in proteins.
A method is proposed to measure global bending in DNA and RNA structures. It relies on a properly defined averaging of base-fixed coordinate frames, computes mean frames of suitably chosen groups of bases and uses these mean frames to evaluate bending. The method is applied to DNA A-tracts, known to induce considerable bend to the double helix. We performed atomistic molecular dynamics simulations of sequences containing the A4T4 and T4A4 tracts, in a single copy and in two copies phased with the helical repeat. Various temperature and salt conditions were investigated. Our simulations indicate bending by roughly 10 per A4T4 tract into the minor groove, and an essentially straight structure containing T4A4, in agreement with electrophoretic mobility data. In contrast, we show that the published NMR structures of analogous sequences containing A4T4 and T4A4 tracts are significantly bent into the minor groove for both sequences, although bending is less pronounced for the T4A4 containing sequence. The bending magnitudes obtained by frame averaging are confirmed by the analysis of superhelices composed of repeated tract monomers.
The problem of fitting a helix to data arises in analysis of protein structure, in nuclear physics, and in engineering. A continuous helix is described by five parameters: helix axis, helix radius, and helix pitch. One of these helix parameters is frequently predefined in the helix fitting. Other algorithms find only the helix axis or determine separately the helix axis, the helix radius, or the helix pitch. Here we describe a total least squares method, HELFIT, for helix fitting. HELFIT enables one to calculate simultaneously all five of the helix parameters with high accuracy. The minimum number of data points required for the analysis is only four. HELFIT is very insensitive to noise even in short helices. HELFIT also calculates a parameter, p = rmsd/(N−1)1/2, which estimates the regularity of helical structures independent of the number of data points, where rmsd is the root mean square distance from the best-fit helix to data points and N is the number of data points. It should become a basic tool of structural bioinformatics.
TLR4 and MD-2 form a heterodimer that recognizes LPS (lipopolysaccharide) from Gram-negative bacteria. Eritoran is an analog of LPS that antagonizes its activity by binding to the TLR4- MD-2 complex. We determined the structure of the full-length ectodomain of the mouse TLR4 and MD-2 complex. We also produced a series of hybrids of human TLR4 and hagfish VLR and determined their structures with and without bound MD-2 and Eritoran. TLR4 is an atypical member of the LRR family and is composed of N-terminal, central, and C-terminal domains. The b sheet of the central domain shows unusually small radii and large twist angles. MD-2 binds to the concave surface of the N-terminal and central domains. The interaction with Eritoran is mediated by a hydrophobic internal pocket in MD-2. Based on structural analysis and mutagenesis experiments on MD-2 and TLR4, we propose a model of TLR4-MD-2 dimerization induced by LPS.
Toll-like receptors (TLRs) play a central role in innate immunity. TLRs are membrane glycoproteins and contain leucine rich repeat (LRR) motif in the ectodomain. TLRs recognize and respond to molecules such as lipopolysaccharide, peptidoglycan, flagellin, and RNA from bacteria or viruses. The LRR domains in TLRs have been inferred to be responsible for molecular recognition. All LRRs include the highly conserved segment, LxxLxLxxNxL, in which "L" is Leu, Ile, Val, or Phe and "N" is Asn, Thr, Ser, or Cys and "x" is any amino acid. There are seven classes of LRRs including "typical" ("T") and "bacterial" ("S"). All known domain structures adopt an arc or horseshoe shape. Vertebrate TLRs form six major families. The repeat numbers of LRRs and their "phasing" in TLRs differ with isoforms and species; they are aligned differently in various databases. We identified and aligned LRRs in TLRs by a new method described here. Results: The new method utilizes known LRR structures to recognize and align new LRR motifs in TLRs and incorporates multiple sequence alignments and secondary structure predictions. TLRs from thirtyfour vertebrate were analyzed. The repeat numbers of the LRRs ranges from 16 to 28. The LRRs found in TLRs frequently consists of LxxLxLxxNxLxxLxxxxF/LxxLxx ("T") and sometimes short motifs including LxxLxLxxNxLxxLPx(x)LPxx ("S"). The TLR7 family (TLR7, TLR8, and TLR9) contain 27 LRRs. The LRRs at the N-terminal part have a super-motif of STT with about 80 residues. The super-repeat is represented by STTSTTSTT or _TTSTTSTT. The LRRs in TLRs form one or two horseshoe domains and are mostly flanked by two cysteine clusters including two or four cysteine residue. Conclusion: Each of the six major TLR families is characterized by their constituent LRR motifs, their repeat numbers, and their patterns of cysteine clusters. The central parts of the TLR1 and TLR7 families and of TLR4 have more irregular or longer LRR motifs. These central parts are inferred to play a key role in the structure and/or function of their TLRs. Furthermore, the super-repeat in the TLR7 family suggests strongly that "bacterial" and "typical" LRRs evolved from a common precursor.
The 310-helix is characterized by having at least two consecutive hydrogen bonds between the main-chain carbonyl oxygen of residue i and the main-chain amide hydrogen of residue i 3. The helical parameters—pitch, residues per turn, radius, and root mean square deviation (rmsd) from the best-fit helix — were determined by using the HELFIT program. All 310-helices were classified as regular or irregular based on rmsd/(N 1)1/2 where N is the helix length. For both there are systematic, position-specific shifts in the backbone dihedral angles. The average , shift systematically from 58°, 32° to 90°, 4° for helices 5, 6, and 7 residues long. The same general pattern is seen for helices, N 8 and 9; however, in N 9, the trend is repeated with residues 6, 7, and 8 approximately repeating the , of residues 2, 3, and 4. The residues per turn and radius of regular 310-helices decrease with increasing length of helix, while the helix pitch and rise per residue increase. That is, regular 310-helices become thinner and longer as N increases from 5 to 8. The fraction of regular 310- helices decreases linearly with helix length. All longer helices,N>9 are irregular. Energy minimizations show that regular helices become less stable with increasing helix length. These findings indicate that the definition of 310-helices in terms of average, uniform dihedral angles is not appropriate and that it is inherently unstable for a polypeptide to form an extended, regular 310-helix. The 310- helices observed in proteins are better referred to parahelices.
A number of human diseases have been shown to be associated with mutation in the genes encoding leucine- rich-repeat (LRR)-containing proteins. They include 16 different LRR proteins. Mutations of these proteins are associated with 19 human diseases. The mutations occur frequently within the LRR domains as well as their neighboring domains, including cysteine clusters. Here, based on the sequence analysis of the LRR domains and the known structure of LRR proteins, we describe some features of different sequence variants and discuss their adverse effects. The mutations in the cysteine clusters, which preclude the formation of sulfide bridges or lead to a wrong paring of cysteines in extracellular proteins or extracellular domains, occur with high frequency. In contrast, missense mutations at some specific positions in LRRs are very rare or are not observed at all.
LRR-containing proteins are present in over 2000 proteins from viruses to eukaryotes. Most LRRs are 20–30 amino acids long, and the repeat number ranges from 2 to 42. The known structures of 14 LRR proteins, each containing 4–17 repeats, have revealed that the LRR domains fold into a horseshoe (or arc) shape with a parallel -sheet on the concave face and with various secondary structures, including -helix, 310- helix, and pII helix on the convex face. We developed simple methods to characterize quantitatively the arc shape of LRR and then applied them to all known LRR proteins. A quantity of 2Rsin( /2), in which R and are the radii of the LRR arc and the rotation angle about the central axis per repeating unit, respectively, is highly conserved in all the LRR proteins regardless of a large variety of repeat number and the radius of the LRR arc. The radii of the LRR arc with - structural units are smaller than those with -310 or -pII units. The concave face of the LRR -sheet forms a surface analogous to a part of aMo¨ bius strip.