GPT: Apa Itu Chat GPT?


ChatGPT
 adalah sebuah aplikasi chatbot yang dibangun dengan menggunakan model GPT (Generative Pre-trained Transformer) dan dilatih pada korpus teks yang berisi berbagai percakapan manusia. ChatGPT dapat menirukan percakapan manusia dan memahami bahasa alami dengan baik, sehingga dapat digunakan untuk berkomunikasi dengan pengguna dengan cara yang sangat mirip dengan manusia.

GPT dijelaskan oleh ChatGPT

Bagaimana ChatGPT Bekerja?

Pada dasarnya, ChatGPT bekerja dengan cara memproses masukan pengguna dan menghasilkan respon berdasarkan konteks percakapan sebelumnya. Model GPT yang digunakan oleh ChatGPT telah dilatih pada corpus teks besar yang mencakup jutaan kata dan kalimat, sehingga dapat memahami konteks dan nuansa dalam percakapan.

Continue reading “GPT: Apa Itu Chat GPT?”

LibreOffice Calc, Alternatif Belajar Analisis Data

Dalam pengolahan data sehari-hari, banyak orang lebih familier dengan perangkat spreadsheet semacam Microsoft Excel. Versi gratis-nya memang tersedia, namun kami lebih suka menggunakan versi free/open source-nya, yaitu LibreOffice Calc. Spreadsheet berkembang sampai saat ini karena kemudahan dan kesederhanaan dalam pengelolaan data, sehingga kami rasa perlu untuk menulis dan mencatat mengenai pengolahan atau analisis menggunakannya sebagai alternatif.

Meskipun kami menggunakan LibreOffice Calc, semua perintah di dalam artikel ini kemungkinan besar berlaku di Excel. Sebagian besar perintah memang saling mengadopsi untuk interoperabilitas berkas.

Ukuran Baku

  • Mean, adalah rata-rata hitung. Dapat diperoleh dengan fungsi AVERAGE. Penggunaanya bisa dengan mengisi cell dengan =AVERAGE(A1:A10), yaitu menghitung rata-rata dari cell A1 sampai dengan A10.
  • Modus, adalah bilangan yang paling sering muncul. Dapat diperoleh dengan fungsi MODE. Penggunaanya bisa dengan mengisi cell dengan =MODE(A1:A10), yaitu menampilkan angka yang paling sering muncul dalam cell A1 sampai dengan A10.
Continue reading “LibreOffice Calc, Alternatif Belajar Analisis Data”

Neo4j: Mulai Belajar

Setelah membaca cerita sekilas, apakah sudah mulai tertarik dengan Neo4J? Mungkin Anda masih bingung mulai dari mana, artikel ini kami coba buat untuk memandu Anda mulai mempelajari dan menerapkannya.

Pasang atau Gunakan Sandbox

Bila memang ingin pengalaman lebih silakan unduh Neo4J dari halaman unduhannya sesuai dengan platform yang Anda miliki. Kami sendiri menggunakan platform Docker yang tidak terdapat pada unduhan tersebut namun sudah tersedia dalam Docker Hub dan siap dipakai.

Bila tidak ingin memasang di mesin pribadi bisa gunakan sandbox yang disediakan oleh pengembang.

Pelajari Chyper GQL

Chyper adalah Graph Query Language yang digunakan oleh Neo4J sebagai antar muka pengguna dalam berkomunikasi dengan mesin. Untuk menggunakan Neo4J, adalah mutlak menguasai bahasa ini.

Continue reading “Neo4j: Mulai Belajar”

Data Mining: Pengenalan

Aktivitas yang dilakukan organisasi menghasilkan model bisnis yang bervariasi. Dalam mendukung model bisnis yang dikembangkan, organisasi akan mengumpulkan data perihal aktivitas dan transaksi yang dikelolanya. Data yang terkumpul tersebut diharapkan dapat membantu dalam melihat kesehatan organisasi dan pengambilan keputusan dikemudian hari. Aktivitas yang dilakukan tersebut lebih dikenal dengan data mining.

Data

Data yang dikelola oleh organisasi akan sangat berbeda bergantung kepada skala usahanya. Skala usaha yang kecil tentu saja cukup dengan berkas spreadsheet yang dengan mudahnya dapat diolah dengan perangkat lunak di desktop PC. Skala usaha menengah tentu saja memerlukan sistem basis data dan dashboard real-time yang dengan mudah dapat dilihat oleh manajemen. Dan skala usaha besar tentu saja butuh pendekatan yang lebih dalam tata kelola datanya. Dengan skenario yang berbeda-beda ini pendekatan pengelolaan data dan metode analisis data saja yang mungkin berbeda.

Data yang tersimpan oleh organisasi akan tersimpan sepanjang hayat organisasi berdiri, mulai dari awal berdiri hingga saat ini. Namun seringkali untuk melihat kesehatan organisasi dan pengambilan keputusan, data yang digunakan tidaklah dari awal, mungkin hanya tahun lalu dan tahun sebelumnya serta tentu saja data tahun berjalan. Data yang sebelum itu bisa dikatakan hanya memenuhi ruang kosong media penyimpanan.

Perusahaan skala menengah dan besar yang sudah berdiri bertahun-tahun tentunya memiliki skala data yang lumayan cukup mengisi media penyimpanan. Sebagian besar hanya akan tertumpuk sebagai arsip dan bukti sejarah perkembangan perusahaan, tidak terpakai, dan menghabiskan sumber daya basis data yang telah dibangun. Namun apakah harus dibuang? Mungkin yang perlu dilakukan adalah melihat data dari metode yang berbeda, salah satu yang sedang hype adalah data mining.

Continue reading “Data Mining: Pengenalan”

KMeans untuk Pengklasteran dengan R

Metode pengklasteran merupakan salah satu metode pembelajaran mesin yang cukup matang dan paling umum digunakan dalam melakukan eksplorasi data. Tanpa mengetahui apapun mengenai data, kita dapat mengelompokkan data berdasarkan nilai masing-masing variabel. Salah satu algoritma yang digunakan adalah KMeans yang dalam R ada dalam paket stats.

Untuk menerapkan K-Means, ada beberapa hal yang perlu diperhatikan dalam menggunakan algoritma ini dengan R.

Argumen Fungsi KMeans

Berikut argumen yang diperlukan dalam menjalankan fungsi ini.

kmeans(x, centers, iter.max = 10, nstart = 1,
       algorithm = c("Hartigan-Wong", "Lloyd", "Forgy",
                     "MacQueen"), trace=FALSE)
## S3 method for class 'kmeans'
fitted(object, method = c("centers", "classes"), ...)

Dimana x adalah data yang ingin diklaster, centers adalah jumlah titik pusat, iter.max adalah jumlah maksimum pengulangan/iterasi, nstart adalah jumlah titik awal acak yang dibuat, algorithm adalah algoritma yang ingin dipakai, trace adalah opsi untuk informasi proses penghitungan.

Algoritma KMeans

Algoritma dasar kmeans adalah:

Continue reading “KMeans untuk Pengklasteran dengan R”