ANALISIS CART DAN BAGGING CART PADA BIG DATA DALAM IDENTIFIKASI SINGLE NUCLEOTIDE POLYMORPHISM (SNP)

NURUL, HUDACHAIR (2017) ANALISIS CART DAN BAGGING CART PADA BIG DATA DALAM IDENTIFIKASI SINGLE NUCLEOTIDE POLYMORPHISM (SNP). Other thesis, INSTITUT PERTANIAN BOGOR.

[img]
Preview
Text (ANALISIS CART DAN BAGGING CART PADA BIG DATA DALAM IDENTIFIKASI SINGLE NUCLEOTIDE POLYMORPHISM (SNP))
46.pdf - Published Version
Available under License Creative Commons Attribution Non-commercial Share Alike.

Download (10MB) | Preview

Abstract

Big data merupakan istilah untuk data dan informasi yang tumbuh secara signifikan dari ukuran jumlah, baik pada data yang terstruktur maupun yang tidak terstruktur. Bioinformatika merupakan disiplin ilmu yang mengalami pertumbuhan data secara eksponensial dalam bebearpa tahun belakangan ini, yaitu sejak ditemukannya teknologi Next-Generation Sequencing (NGS). Salah satu kajian yang menarik di bidang bioinformatika adalah identifikasi polimorfisme nukleotida atau dikenal Single Nucleotide Polymorphism (SNP). Penelitian ini mengembangkan model dan menganalisis fitur-fitur terbaik yang dapat digunakan dalam identifikasi SNP. Metode yang digunakan adalah classification and regression trees (CART) dan bootstrap aggregating (bagging) CART dengan skema 11, 21, 31, 41, 51, 61, 71, 81 dan 91 pohon klasifikasi. Data yang digunakan adalah data whole-genome dari kedelai budidaya (Glycine max [L.] Merr.) yang disekuen menggunakan teknologi NGS, Genome Analyzer II Illumina. Pelatihan model menggunakan kandidat SNP pada kromosom 11, sementara pengujian menggunakan kandidat SNP pada kromosom 16. Hasil penelitian menunjukkan bahwa bagging CART dengan skema 51 pohon mampu membangun model klasifikasi SNP yang paling baik dibandingkan CART dan skema-skema lainnya berdasarkan metrik Fmeasure yaitu 0.63. Berdasarkan frekuensi kemunculan yang paling tinggi dari masing-masing skema pada bagging CART, fitur yang paling berperan dalam identifikasi SNP adalah max qual minor, freq minor dan mismatch alt. Kata kunci: big data, classification and regression trees, next generation sequencing, single nucleotide polymorphisms

Item Type: Thesis (Other)
Subjects: A General Works > AS Academies and learned societies (General)
Divisions: Fakultas Matematika dan Komputer > Prodi Teknik Informatika
Depositing User: Rizki Handayani S.I.Pust
Date Deposited: 31 Jul 2019 07:24
Last Modified: 31 Jul 2019 07:24
URI: http://repository.unugha.ac.id/id/eprint/726

Actions (login required)

View Item View Item