INFOCPNS Tutorial Pemrograman R dirancang untuk pemula - Rista Bola

Tutorial Pemrograman R dirancang untuk pemula

Tutorial Pemrograman R

Tutorial Pemrograman R dirancang untuk pemula dan profesional. Tutorial kami menyediakan semua konsep dasar dan lanjutan dari analisis dan visualisasi data.

R adalah lingkungan perangkat lunak yang digunakan untuk menganalisis informasi statistik dan representasi grafis. R memungkinkan kita melakukan pemrograman modular menggunakan fungsi.

Tutorial R kami mencakup semua topik R seperti pengenalan, fitur, instalasi, ide rstudio, variabel, tipe data, operator, pernyataan if, vektor, penyerahan data, grafik, pemodelan statistik, dll. Bahasa pemrograman ini diberi nama R, berdasarkan huruf nama depan kedua penulis (Robert Gentleman dan Ross Ihaka).

Apa itu Pemrograman R

"R adalah bahasa pemrograman komputer yang ditafsirkan yang diciptakan oleh Ross Ihaka dan Robert Gentleman di University of Auckland, Selandia Baru." Tim Inti Pengembangan R saat ini mengembangkan R. Ini juga merupakan lingkungan perangkat lunak yang digunakan untuk menganalisis informasi statistik, representasi grafis, pelaporan, dan pemodelan data. R adalah implementasi dari bahasa pemrograman S, yang digabungkan dengan semantik pelingkupan leksikal.

R tidak hanya memungkinkan kita untuk melakukan percabangan dan perulangan tetapi juga memungkinkan untuk melakukan pemrograman modular menggunakan fungsi. R memungkinkan integrasi dengan prosedur yang ditulis dalam bahasa C, C++, .Net, Python, dan FORTRAN untuk meningkatkan efisiensi.

Di era sekarang, R adalah salah satu alat terpenting yang digunakan oleh para peneliti, analis data, ahli statistik, dan pemasar untuk mengambil, membersihkan, menganalisis, memvisualisasikan, dan menyajikan data.


Sejarah Pemrograman R

Sejarah R kembali sekitar 20-30 tahun yang lalu. R dikembangkan oleh Ross lhaka dan Robert Gentleman di Universitas Auckland, Selandia Baru, dan Tim Inti Pengembangan R saat ini sedang mengembangkannya. Nama bahasa pemrograman ini diambil dari nama kedua developer tersebut. Proyek pertama dipertimbangkan pada tahun 1992. Versi awal dirilis pada tahun 1995, dan pada tahun 2000, versi beta yang stabil dirilis.


Tabel berikut menunjukkan tanggal rilis, versi, dan deskripsi bahasa R:

Version-ReleaseDateDescription
0.491997-04-23Pertama kali sumber R dirilis, dan CRAN (Comprehensive R Archive Network) dimulai.
0.601997-12-05R secara resmi mendapatkan lisensi GNU.
0.65.11999-10-07update.packages dan install.packages keduanya disertakan.
1.02000-02-29Versi siap produksi pertama dirilis.
1.42001-12-19Versi pertama untuk Mac OS telah tersedia.
2.02004-10-04Versi pertama untuk Mac OS telah tersedia.
2.12005-04-18Tambahkan dukungan untuk pengkodean UTF-8, internasionalisasi, lokalisasi, dll.
2.112010-04-22Tambahkan dukungan untuk sistem Windows 64-bit.
2.132011-04-14Menambahkan fungsi yang mengubah kode menjadi kode byte dengan cepat.
2.142011-10-31Menambahkan beberapa paket baru.
2.152012-03-30Peningkatan kecepatan serialisasi untuk vektor panjang.
3.02013-04-03Dukungan untuk nilai numerik yang lebih besar pada sistem 64-bit.
3.42017-04-21Kompilasi just-in-time (JIT) diaktifkan secara default.
3.52018-04-23Menambahkan fitur baru seperti representasi internal yang ringkas dari urutan bilangan bulat, format serialisasi, dll.

Fitur pemrograman R

R adalah bahasa pemrograman khusus domain yang bertujuan untuk melakukan analisis data. Ini memiliki beberapa fitur unik yang membuatnya sangat kuat. Bisa dibilang yang paling penting adalah notasi vektor. Vektor ini memungkinkan kita untuk melakukan operasi kompleks pada sekumpulan nilai dalam satu perintah. Ada beberapa fitur pemrograman R berikut:
  1. Ini adalah bahasa pemrograman yang sederhana dan efektif yang telah dikembangkan dengan baik.
  2. Ini adalah perangkat lunak analisis data.
  3. Ini adalah bahasa yang dirancang dengan baik, mudah, dan efektif yang memiliki konsep user-defined, looping, conditional, dan berbagai fasilitas I/O.
  4. Ini memiliki seperangkat alat yang konsisten dan tergabung yang digunakan untuk analisis data.
  5. Untuk berbagai jenis kalkulasi pada array, daftar, dan vektor, R berisi sekumpulan operator.
  6. Ini menyediakan fasilitas penanganan dan penyimpanan data yang efektif.
  7. Ini adalah perangkat lunak sumber terbuka, kuat, dan sangat dapat dikembangkan.
  8. Ini memberikan teknik grafis yang sangat dapat dikembangkan.
  9. Ini memungkinkan kita untuk melakukan banyak perhitungan menggunakan vektor.
  10. R adalah bahasa yang ditafsirkan.

Mengapa menggunakan Pemrograman R?

Ada beberapa alat yang tersedia di pasar untuk melakukan analisis data. Mempelajari bahasa baru membutuhkan waktu. Ilmuwan data dapat menggunakan dua alat yang sangat baik, yaitu R dan Python. Kami mungkin tidak punya waktu untuk mempelajari keduanya pada saat kami mulai mempelajari ilmu data. Mempelajari pemodelan statistik dan algoritma lebih penting daripada mempelajari bahasa pemrograman. Bahasa pemrograman digunakan untuk menghitung dan mengkomunikasikan penemuan kami.

Tugas penting dalam ilmu data adalah cara kita menangani data: bersih, rekayasa fitur, pemilihan fitur, dan impor. Itu harus menjadi fokus utama kita. Tugas data scientist adalah memahami data, memanipulasinya, dan memaparkan pendekatan terbaik. Untuk pembelajaran mesin, algoritme terbaik dapat diimplementasikan dengan R. Keras dan TensorFlow memungkinkan kami membuat teknik pembelajaran mesin kelas atas. R memiliki paket untuk melakukan Xgboost. Xgboost adalah salah satu algoritma terbaik untuk kompetisi Kaggle.

R berkomunikasi dengan bahasa lain dan mungkin memanggil Python, Java, C++. Dunia big data juga dapat diakses oleh R. Kita dapat menghubungkan R dengan database yang berbeda seperti Spark atau Hadoop.

Singkatnya, R adalah alat yang hebat untuk menyelidiki dan mengeksplorasi data. Analisis rumit seperti pengelompokan, korelasi, dan reduksi data dilakukan dengan R.

Perbandingan antara R dan Python

Ilmu data berurusan dengan mengidentifikasi, mengekstraksi, dan merepresentasikan informasi yang bermakna dari sumber data. R, Python, SAS, SQL, Tableau, MATLAB, dll. Adalah alat yang paling berguna untuk ilmu data. R dan Python adalah yang paling banyak digunakan. Tapi tetap saja, menjadi bingung untuk memilih yang lebih baik atau paling cocok di antara keduanya, R dan Python.

Comparison IndexRPython
Overview"R adalah bahasa pemrograman komputer yang ditafsirkan yang diciptakan oleh Ross Ihaka dan Robert Gentleman di University of Auckland, Selandia Baru." Tim Inti Pengembangan R saat ini mengembangkan R.R juga merupakan lingkungan perangkat lunak yang digunakan untuk menganalisis informasi statistik, representasi grafis, pelaporan, dan pemodelan data.Python adalah bahasa pemrograman tingkat tinggi yang ditafsirkan yang digunakan untuk pemrograman tujuan umum. Guido Van Rossum membuatnya, dan pertama kali dirilis pada tahun 1991. Python memiliki sintaks kode yang sangat sederhana dan bersih. Ini menekankan keterbacaan kode dan debugging juga sederhana dan lebih mudah dengan Python.
Specialties for data sciencePaket R memiliki teknik canggih yang sangat berguna untuk pekerjaan statistik. Tampilan teks CRAN disediakan oleh banyak paket R yang berguna. Paket-paket ini mencakup semuanya, mulai dari Psikometri hingga Genetika hingga Keuangan.Untuk menemukan outlier dalam kumpulan data, baik R dan Python sama-sama bagus. Tetapi untuk mengembangkan layanan web agar orang dapat mengunggah kumpulan data dan menemukan outlier, Python lebih baik.
FunctionalitiesUntuk analisis data, R memiliki fungsionalitas bawaanSebagian besar fungsi analisis data tidak terpasang. Mereka tersedia melalui paket seperti Numpy dan Pandas
Key domains of applicationVisualisasi data adalah aspek kunci dari analisis. Paket R seperti ggplot2, ggvis, lattice, dll. Membuat visualisasi data lebih mudah.Python lebih baik untuk pembelajaran mendalam karena paket Python seperti Caffe, Keras, OpenNN, dll. Memungkinkan pengembangan jaringan saraf dalam dengan cara yang sangat sederhana.
Availability of packagesAda ratusan paket dan cara untuk menyelesaikan tugas ilmu data yang diperlukan.Python memiliki beberapa paket utama seperti viz, Sccikit learn, dan Pandas untuk analisis data pembelajaran mesin.

Aplikasi R

Ada beberapa aplikasi yang tersedia secara real-time. Beberapa aplikasi yang populer adalah sebagai berikut:

  • Facebook
  • Google
  • Twitter
  • HRDAG
  • Sunshine Foundation
  • RealClimate
  • NDAA
  • XBOX
  • ANZ
  • FDA

Persyaratan 

Pemrograman R digunakan untuk informasi statistik dan representasi data. Sehingga diperlukan bahwa kita harus memiliki pengetahuan tentang teori statistik dalam matematika. Memahami berbagai jenis grafik untuk representasi data dan yang terpenting adalah kita harus memiliki pengetahuan sebelumnya tentang pemrograman apa pun.