2017 in Review: Menggali Data Teks Jurnal Harian

07 January 2018 · 901 words
DataGue - Yearly
Period: 2016-2017

Kodingan dan R Markdown bisa dilihat di sini

Gue sudah memulai menulis jurnal harian sejak tahun 2015 setelah membaca sebuah sebuah buku yang mendorong gue untuk menginisiasi kebiasaan tersebut. Kala itu jurnal harian yang gue bikin dimulai dari sebuah dokumen MS Word bertajuk “Free Writing” (~60 ribu kata), dilanjutkan dengan “Tulis Bebas” (~14 ribu kata), “Knowledge Writing” (~30 ribu kata) dan beberapa canel kecil lainnya (~28 ribu kata). Barulah pada tahun 2016, gue migrasi dan hanya fokus ke dokumen MS Word bertajuk “New Scratch” (~130 ribu kata) sebagai wadah bagi gue untuk menulis jurnal harian mengenai hal-hal yang ada di dalam benak gue.

Hingga akhir tahun 2017, gue sudah menulis sekitar 270 ribu kata di berbagai canel tersebut yang berada dalam haluan “Life Architecture”, belum termasuk kata-kata yang ada di blog, artikel, sosial media dan lain-lain.

Di sini, gue akan menggali lebih dalam mengenai kata-kata yang gue tulis di jurnal harian gue bertajuk “New Scratch” yang mencakup sekitar 50% kata-kata yang ada di “Life Architecture”.

Overview

Dari tahun 2016, tepatnya tanggal 21 Mei 2016 hingga tahun 2017, tepatnya tanggal 27 Desember 2017, gue sudah menulis di “New Scratch” sebanyak 292 tulisan yang terdiri dari 136392 kata. Secara rinci, di tahun 2016, gue sudah menulis sebanyak 43330 kata, di tahun 2017 sebanyak 87573 kata dan sisanya sebanyak 5489 kata tanpa keterangan waktu. Kenaikan mencapai 2 kali dari tahun 2016 ke tahun 2017, namun perlu digarisbawahi bahwa pada tahun 2016, tulisan dimulai pada bulan kelima yaitu bulan Mei.

Harian

Dari 292 tulisan yang gue bikin di “New Scratch”, gue aktif menulis sebanyak 227 hari aktif (38,74%) dari 586 hari yang ada antara 21 Mei 2016 hingga 27 Desember 2017. Intensitas menulis pun meningkat di tahun 2017 yang awalnya hanya sebanyak 68 hari aktif (30,22%) di tahun 2016 menjadi 159 hari aktif (44,04%) di tahun 2017, kenaikan sebesar 45.73% dilihat dari rasio hari aktif dalam satu tahun. Rekor menulis beruntun terbanyak adalah 9 hari yang terjadi dari 10 September 2017 sampai dengan 18 September 2017.

Bulanan

Sepanjang 2016 hingga 2017, gue menulis minimum 2780 kata per bulan dan maksimum 11480 kata per bulan. Pasca lebaran tahun 2017, intensitas gue dalam menulis melambung tinggi. Peningkatanya bisa mencapai lebih dari dua kali dilihat dari banyaknya kata maupun banyaknya tulisan yang gue bikin.

The Words

Kata-kata apa saja yang tertuang di “New Scratch”? Bagaimanakah perkembangannya dari waktu ke waktu? The words will tell the truth

Awan Kata

“Data” menjadi kata favorit gue! Entahlah, karena gue bekerja sebagai tukang data, gue pun sering sekali menuliskan kata “data” di berbagai coretan tulisan gue sehingga intensitasnya pun mengalahkan kata-kata lainnya. Perlu digarisbawahi bahwa gue sudah menghilangkan beberapa kata setop (stopwords) baik dalam bahasa Indonesia baku maupun tidak baku dan juga bahasa Inggris.

Lantas dari 292 tulisan yang gue bikin, berapa persen tulisan yang mengandung kata “data”? Setelah gue telusuri lebih lanjut, 64% dari tulisan yang gue bikin mengandung kata “data” di dalamnya.

2016 ke 2017

“game” dan “win” adalah kata yang mengalami peningkatan yang sangat tinggi dibandingkan kata-kata lainnya. Ada apa gerangan? Tahun 2017, apakah gue berhasrat untuk memenangkan permainan? Permainan apa? Kata lain yang mengalami peningkatan di tahun 2017 adalah “time”, “juta” dan “kudu”. Apakah waktu dan uang adalah merupakan keharusan bagi gue di tahun 2017? Di sisi lain, sangat disayangkan di tahun 2017 gue mengalami penurunan penggunaan kata dalam dunia pembelajaran seperti “belajar”, “s2” dan “ilmu”.

Kata-kata per Bulan

Dari awan kata yang sudah tersaji sebelumnya, gue bisa tau kata-kata favorit apa yang sering gue pake di “New Scratch”. Dari plot di atas, gue bisa tau kata-kata favorit apa yang sering gue pake dari bulan ke bulan. Kata-kata seperti “data”, “2017”, “game” dan “win” merupakan kata-kata yang memang masuk dalam jajaran 10 besar kata-kata yang sering gue pake. namun ada kata-kata tertentu yang muncul sesekali dalam satu bulan tertentu saja. Contohnya, pada bulan Juni 2017, gue berkali-kali menyebutkan hal-hal yang berkaitan dengan pengembangan laman pribadi seperti “rasyidridha.com”, “website”, “plan”, “build” dan “personal”. Di bulan Juni 2017, gue memang dalam tahap pengembangan blog ini secara lebih mendalam.

Hubungan Kata

Sebuah kata tidak bisa berdiri dengan kokoh tanpa ada kata lainnya. Plot di atas menunjukkan hubungan kata di “New Scratch” dipisah per paragraf dengan frekuensi kata minimal 20 kali. Semakin tebal garis antar kata menunjukkan bahwa frekuensi kemunculan kata-kata tersebut secara bersamaan dalam satu paragraf juga semakin tinggi. Kata “data” menjadi pusat perhatian dan sering muncul bersamaan dengan pasangan kata lain seperti “science”, “scientist”, “visualization”, “kemampuan” dan lain-lain.

2018

Banyak hal lain yang bisa digali dari kata-kata yang gue hasilkan dari tahun 2016 sampai dengan 2017 di lembaran bernama “New Scratch”. Dari kata-kata yang gue tulis, gue bisa mengetahui perkembangan dan perjalanan hidup gue dari waktu ke waktu.

Bagaimana dengan tahun 2018? Berapa banyak kata yang akan gue hasilkan di lembaran “New Scratch” yang baru? Apakah kata “data” akan terus mendominasi?

Welcome 2018! Enjoy the words journey!

comments powered by Disqus