Home  »  News   »  
News

GitHub Merilis 2,8 Juta Data Open Source Repository Melalui Google BigQuery

[Foto: Maskot GitHub | GitHub Shop]
[Foto: Maskot GitHub | GitHub Shop]
Hari ini (30 Juni 16), GitHub mengumumkan bahwa pihaknya telah merilis activity data yang berjumlah 2,8 juta open source code repository. Dengan ini, kode-kode tersebut kini bisa diakses oleh siapapun dengan menggunakan Google BigQuery, tooldata warehouse yang berbasis cloud.

Data-data yang telah dirilis ini bisa diakses secara bebas. Dengan menggunakan BitQuery, Anda juga bisa memproses satu terabyte data tanpa dikenakan bayaran.

Menurut Arfon Smith, program manager untuk data open source GitHub, kumpulan data yang berukuran 3 TB ini mencakup informasi mengenai “lebih dari 145 juta unique activity, lebih dari 2 miliar path file yang berbeda dan revisi konten terbaru untuk 163 juta file. Semua data ini bisa dicari dengan menggunakan regular expression.”


Untuk mendorong agar orang-orang memanfaatkan data-data ini, Smith sudah menampilkan sebuah postingan yang merangkum pertanyaan-pertanyaan yang biasa diutarakan seputar hal ini. Selain itu, Felipe Hoffa selaku advokat Google developer juga telah menulis beberapa tips untuk memproses data ini dalam sebuah postingan Medium.

Data ini berguna bagi siapapun yang ingin mengetahui tren dalam software open source yang digunakan dalam GitHub. Tentunya akan lebih mudah bagi Anda untuk menggunakan software ini dibandingkan harus mengotak-atik application programming interface (API) pada GitHub. Memang, GitHub bukanlah satu-satunya portal yang bisa digunakan untuk mencari software open source di internet. Tapi program yang sudah memiliki lebih dari 15 juta pengguna ini adalah merupakan portal yang paling populer dari semua portal yang ada.

Menurut keterangan dari sebuah sumber, GitHub akan mengupdate datanya setiap minggu.