Apakah yang anda akan lakukan apabila mendapat data jujukan bersaiz 15 juta GB? Adakah anda mengkaji dan menganalisis data tersebut satu persatu dengan menggunakan sebuah komputer peribadi ? Jawapannya adalah mustahil dan ia tidak akan selesai dalam waktu yang munasabah tanpa bantuan Komputer Berkeupayaan Tinggi (KBT) atau High Performance Computing (HPC). Komputeran Berkeupayaan Tinggi sebenarnya tidak asing bagi mereka yang terlibat dalam bidang teknologi maklumat. Tetapi tahukah anda KBT sangat penting dalam bidang penyelidikan terutamanya penyelidikan Biologi Molekul dan Bioinformatik.
Projek pemetaan genom manusia pada tahun 1999 telah memberi impak positif dalam dunia penyelidikan saintifik dari segi penghasilan maklumat genom manusia yang dapat membantu merungkai permasalahan dan misteri dalam diri manusia. Ia juga turut dijadikan sebagai penanda aras kepada penyelidikan organisma lain seperti haiwan dan mikrob. Sejak dari itu, projek genom berskala besar telah menjadi satu fenomena baru dalam dunia penyelidikan biologi molekul apabila penyelidik dan saintis berminat untuk mengkaji fungsi protein, gen dan penawar penyakit bagi organisma hidup.
Namun demikian, dengan adanya lambakan data biologi ini teknik perkomputeran diperlukan dalam pengurusan data biologi berskala besar supaya menjadi maklumat biologi yang berguna. Justeru, aplikasi KBT merupakan salah satu teknik komputeran yang sangat diperlukan dalam menyelenggara analisis data biologi berskala besar bagi menghasilkan penemuan-penemuan baru dalam tempoh masa yang singkat. KBT menggunakan super komputer atau komputer kluster yang berfungsi meningkatkan tahap kelajuan pemprosesan dan mempunyai memori yang besar bagi menyimpan dan menganalisis data-data biologi.
KBT menggunakan konsep keselarian dalam pembangunan aplikasinya. Binaan KBT terdiri daripada tiga jenis iaitu Multipemproses Simetrik (SMP), Pemprosess Vektor dan Kluster. Antara ketiga-tiga arkitektur tersebut, kluster mendominasi penyelidikan saintifik. Pemproses di dalam kluster yang dikenali sebagai nod. Ia mempunyai unit utama pemprosessan atau CPU, memori, Operating System dan Input/Output subsistem yang berkomunikasi dengan nod-nod di sekitarnya. Linux bertindak sebagai sistem pengoperasian manakala perisian sumber terbuka berfungsi sebagai nod.
Satu kajian dari Virginia Bioinformatics Institute (VBI) telah menggunakan KBT dalam mengenal pasti kehilangan gene (missing gene) dalam genom mikrob. Cabaran tertumpu kepada penghasilan peralatan peramalan yang boleh meramal gen yang tidak diketahui dan lokasi gen tersebut berpandukan data set besar yang diperolehi dari eksperimen dan pangkalan data umum. Kajian ini melibatkan 780 genom mikrobial yang memerlukan peralatan penjajaran jujukan (sequence alignment). Analisis genom microbial tersebut memerlukan lebih kurang 12 0000 pemproses utama yang meningkatkan tahap kelajuan peralatan penjajaran jujukan iaitu mpiBLAST.
Menurut saintis lagi, kajian ini melibatkan 90 tahun jika menggunakan satu komputer peribadi. Sebaliknya dengan teknologi KBT ia hanya memakan masa 12 jam. Selain itu, penjimatan masa dalam pemindahan maklumat genetik melalui aplikasi KBT turut dibuktikan oleh sebuah institut yang menfokuskan penyelidikan dalam penyakit kanser dan diabetes iaitu The Translational Genomics Research Institute (TGen). Menurut penyelidik TGen, 7000 gigabytes data dihasilkan daripada eksperimen. Dengan bantuan KBT ia dapat memindahkan 30 GB dalam masa satu jam dan secara keseluruhannya pemindahan data dari makmal ke komputer mengambil masa lebih kurang seminggu.
Dengan peningkatan kelajuan pemindahan data ini, penemuan baru dalam mencari penawar kanser dan diebetis dapat dicari. Begitu juga dalam penyelidikan 3D protein, HPC diperlukan dalam mensimulasi protein 3D yang berskala besar dan rumit menggunakan kaedah pengoptimuman Monte Carlo. Antara perisian protein 3D yang digunakan dalam KBT ialah Discovery Studio sebagai permodelan struktur protein 3D manakala Gromacs untuk tujuan simulasi protein. KBT juga turut digunakan dalam analisis filogenetik bagi mencari corak perhubungan evolusi antara spesies dan famili suatu organisma.
Data jujukan nukleotida yang terdiri daripada berjuta-juta bes berpasangan memerlukan pengendalian yang efektif dan berkelajuan tinggi bagi menghasilkan pohon filogenetik. Misalnya sepasukan penyelidik HIV dari Centre for HIV/AIDS Vaccine Immunology (CHAVI) telah menggunakan Roadrunner, sebuah super komputer yang dibangunkan oleh IBM dalam menghasilkan pohon filogenetik HIV yang terbesar dalam masa yang pantas. Melalui phon filogenetik ini penyelidik menganalisis maklumat genetik pesakit HIV di samping melihat persamaan dan perhubungan antara populasi pesakit HIV.
Oleh itu, kerjasama antara professional teknologi maklumat dan ahli biologi molekul serta ahli bioinformatik sangat penting bagi memastikan matlamat penyelidikan menemui kejayaan. Professional teknologi maklumat mengendalikan pembangunan infrastruktur komputer yang berkemampuan menganalisis data biologi berskala besar mengikut keperluan ahli biologi molekul. Selain dari Komputer Berkeupayaan Tinggi, para saintis dan penyelidik sedikit demi sedikit beralih arah kepada aplikasi ‘Cloud Computing’ dalam bidang penyelidikan saintifik.
Projek pemetaan genom manusia pada tahun 1999 telah memberi impak positif dalam dunia penyelidikan saintifik dari segi penghasilan maklumat genom manusia yang dapat membantu merungkai permasalahan dan misteri dalam diri manusia. Ia juga turut dijadikan sebagai penanda aras kepada penyelidikan organisma lain seperti haiwan dan mikrob. Sejak dari itu, projek genom berskala besar telah menjadi satu fenomena baru dalam dunia penyelidikan biologi molekul apabila penyelidik dan saintis berminat untuk mengkaji fungsi protein, gen dan penawar penyakit bagi organisma hidup.
Namun demikian, dengan adanya lambakan data biologi ini teknik perkomputeran diperlukan dalam pengurusan data biologi berskala besar supaya menjadi maklumat biologi yang berguna. Justeru, aplikasi KBT merupakan salah satu teknik komputeran yang sangat diperlukan dalam menyelenggara analisis data biologi berskala besar bagi menghasilkan penemuan-penemuan baru dalam tempoh masa yang singkat. KBT menggunakan super komputer atau komputer kluster yang berfungsi meningkatkan tahap kelajuan pemprosesan dan mempunyai memori yang besar bagi menyimpan dan menganalisis data-data biologi.
KBT menggunakan konsep keselarian dalam pembangunan aplikasinya. Binaan KBT terdiri daripada tiga jenis iaitu Multipemproses Simetrik (SMP), Pemprosess Vektor dan Kluster. Antara ketiga-tiga arkitektur tersebut, kluster mendominasi penyelidikan saintifik. Pemproses di dalam kluster yang dikenali sebagai nod. Ia mempunyai unit utama pemprosessan atau CPU, memori, Operating System dan Input/Output subsistem yang berkomunikasi dengan nod-nod di sekitarnya. Linux bertindak sebagai sistem pengoperasian manakala perisian sumber terbuka berfungsi sebagai nod.
Satu kajian dari Virginia Bioinformatics Institute (VBI) telah menggunakan KBT dalam mengenal pasti kehilangan gene (missing gene) dalam genom mikrob. Cabaran tertumpu kepada penghasilan peralatan peramalan yang boleh meramal gen yang tidak diketahui dan lokasi gen tersebut berpandukan data set besar yang diperolehi dari eksperimen dan pangkalan data umum. Kajian ini melibatkan 780 genom mikrobial yang memerlukan peralatan penjajaran jujukan (sequence alignment). Analisis genom microbial tersebut memerlukan lebih kurang 12 0000 pemproses utama yang meningkatkan tahap kelajuan peralatan penjajaran jujukan iaitu mpiBLAST.
Menurut saintis lagi, kajian ini melibatkan 90 tahun jika menggunakan satu komputer peribadi. Sebaliknya dengan teknologi KBT ia hanya memakan masa 12 jam. Selain itu, penjimatan masa dalam pemindahan maklumat genetik melalui aplikasi KBT turut dibuktikan oleh sebuah institut yang menfokuskan penyelidikan dalam penyakit kanser dan diabetes iaitu The Translational Genomics Research Institute (TGen). Menurut penyelidik TGen, 7000 gigabytes data dihasilkan daripada eksperimen. Dengan bantuan KBT ia dapat memindahkan 30 GB dalam masa satu jam dan secara keseluruhannya pemindahan data dari makmal ke komputer mengambil masa lebih kurang seminggu.
Dengan peningkatan kelajuan pemindahan data ini, penemuan baru dalam mencari penawar kanser dan diebetis dapat dicari. Begitu juga dalam penyelidikan 3D protein, HPC diperlukan dalam mensimulasi protein 3D yang berskala besar dan rumit menggunakan kaedah pengoptimuman Monte Carlo. Antara perisian protein 3D yang digunakan dalam KBT ialah Discovery Studio sebagai permodelan struktur protein 3D manakala Gromacs untuk tujuan simulasi protein. KBT juga turut digunakan dalam analisis filogenetik bagi mencari corak perhubungan evolusi antara spesies dan famili suatu organisma.
Data jujukan nukleotida yang terdiri daripada berjuta-juta bes berpasangan memerlukan pengendalian yang efektif dan berkelajuan tinggi bagi menghasilkan pohon filogenetik. Misalnya sepasukan penyelidik HIV dari Centre for HIV/AIDS Vaccine Immunology (CHAVI) telah menggunakan Roadrunner, sebuah super komputer yang dibangunkan oleh IBM dalam menghasilkan pohon filogenetik HIV yang terbesar dalam masa yang pantas. Melalui phon filogenetik ini penyelidik menganalisis maklumat genetik pesakit HIV di samping melihat persamaan dan perhubungan antara populasi pesakit HIV.
Oleh itu, kerjasama antara professional teknologi maklumat dan ahli biologi molekul serta ahli bioinformatik sangat penting bagi memastikan matlamat penyelidikan menemui kejayaan. Professional teknologi maklumat mengendalikan pembangunan infrastruktur komputer yang berkemampuan menganalisis data biologi berskala besar mengikut keperluan ahli biologi molekul. Selain dari Komputer Berkeupayaan Tinggi, para saintis dan penyelidik sedikit demi sedikit beralih arah kepada aplikasi ‘Cloud Computing’ dalam bidang penyelidikan saintifik.







No comments:
Post a Comment