Bioconductor: Open Software Development for Computational Biology and Bioinformatics
i. Abstrak
Proyek Bioconductor adalah sebuah inisiatif untuk penciptaan kolaboratif extensible software untuk biologi komputasi dan bioinformatika. Tujuan dari proyek mencakup: mendorong pengembangan kolaboratif dan meluasnya penggunaan software inovatif, mengurangi hambatan untuk masuk ke penelitian ilmiah interdisipliner, dan mempromosikan pencapaian terpencil reproduktibilitas hasil penelitian. Kami menjelaskan rincian kami bertujuan dan metode, mengidentifikasi tantangan saat ini, membandingkan Bioconductor proyek-proyek bioinformatika terbuka lainnya, dan menyediakan contoh kerja.
ii. Background
Proyek Bioconductor [1] adalah sebuah inisiatif untuk penciptaan kolaboratif extensible software untuk biologi komputasi dan bioinformatika (CBB). Biologi, biologi molekuler khususnya, sedang mengalami transformasi terkait dua. Pertama, ada kesadaran dari sifat komputasi banyak proses-proses biologis dan bahwa komputasi dan model Statistik dapat digunakan untuk keuntungan besar. Kedua, perkembangan dalam tinggi-throughput data akuisisi menghasilkan persyaratan untuk kecanggihan komputasi dan statistik pada setiap tahap penelitian biologi pipa. Tujuan utama dari proyek Bioconductor adalah ciptaan tahan lama dan fleksibel perangkat lunak pengembangan dan penyebaran lingkungan yang memenuhi tantangan konseptual, komputasi, dan inferential ini baru. Kami berusaha untuk mengurangi hambatan untuk masuk ke penelitian CBB. Tujuan utama adalah penyederhanaan proses oleh peneliti statistik yang dapat mengeksplorasi dan berinteraksi bermanfaat dengan sumber-sumber data dan algoritma CBB, dan biologi kerja yang mendapatkan akses ke dan penggunaan metode statistik negara-of-the-art untuk akurat kesimpulan di CBB. Di antara banyak tantangan yang muncul untuk Statistik dan ahli biologi adalah tugas akuisisi data, manajemen data, transformasi data, pemodelan data, menggabungkan sumber data yang berbeda, membuat penggunaan berkembang mesin metode pembelajaran, dan mengembangkan strategi pemodelan baru cocok untuk CBB. Kami telah menekankan transparansi, reproduktifitas dan efisiensi pengembangan kami menanggapi tantangan ini. Fundamental untuk semua tugas ini adalah kebutuhan untuk perangkat lunak; ide-ide sendiri tidak dapat memecahkan masalah-masalah besar yang timbul. Motivasi utama untuk lingkungan komputasi open source untuk genomics. Statistik adalah transparansi, mengejar reproduktifitas dan efisiensi pembangunan.
iii. Metodelogi
Strategi pengembangan perangkat lunak kami telah mengadopsi memiliki beberapa preseden. Di pertengahan 1980-an Richard Stallman memulai Free Software Foundation dan proyek GNU
sebagai upaya untuk menyediakan implementasi sistem operasi Unix yang bebas dan terbuka. Salah satu motivasi utama untuk proyek adalah gagasan bahwa bagi para peneliti dalam ilmu-ilmu komputasi "kreasi/penemuan (perangkat lunak) harus tersedia bagi semua orang untuk menguji, membenarkan, mereplikasi dan bekerja untuk meningkatkan lebih lanjut inovasi ilmiah" bersama-sama dengan Linux kernel, kombinasi GNU/Linux yang memicu gerakan open source besar yang kita kenal sekarang. Perangkat lunak open source tidak lagi melihat dengan prasangka, telah diadopsi oleh perusahaan teknologi informasi utama dan telah mengubah cara kita berpikir tentang ilmu komputasi. Tubuh besar sastra ada pada bagaimana mengelola proyek perangkat lunak untuk pengenalan yang baik dan komprehensif bibliografi. Salah satu faktor kunci sukses dari Linux kernel adalah desain modular, yang memungkinkan untuk pengembangan independen dan paralel kode di jaringan desentralisasi virtual. Pengembang tidak dikelola dalam hirarki perusahaan, tetapi langsung bertanggung jawab untuk bagian dari proyek dan berinteraksi secara langsung (di mana perlu) untuk membangun sistem yang kompleks. Model kami organisasi dan pengembangan telah berusaha untuk mengikuti prinsip-prinsip ini, serta mereka yang telah berevolusi dari proyek R. Dalam bagian ini, kami meninjau tujuh topik penting untuk pembentukan sebuah proyek perangkat lunak sumber terbuka yang ilmiah dan mendiskusikan mereka dari sudut pandang CBB: pilihan bahasa, prasarana sumber daya, desain strategi dan komitmen, didistribusikan pengembangan dan perekrutan pengembang, penggunaan kembali sumber daya eksogen, publikasi dan lisensi kode, dan dokumentasi.
SUMBER :
https://genomebiology.biomedcentral.com/articles/10.1186/gb-2004-5-10-r80
Tidak ada komentar:
Posting Komentar