Googleplex di California (sumber:https://inhabitat.com/big-and-heatherwick-studio-to-design-googles-new-mountain-view-hq/)

Apakah makna Google? Bukannya ‘Goggles’ yang digunakan untuk berenang. Sebenarnya ‘Google’ adalah ejaan lain bagi satu nombor yang sangat besar iaitu 10100 yang dipanggil Googol (sebutannya sama dengan Google). Syarikat yang ditubuhkan oleh Larry Page and Sergey Brin pada tahun 1998 ini mempunyai ibu pejabat di Mountain View, California. Nama manja bagi Google HQ ini adalah Googleplex yang juga sama sebutannya dengan nombor Googolplex, 10googol. Sebenarnya, Google dan matematik juga mempunyai hubungan yang jauh lebih mendalam.

Langkah pencarian secara ringkas bagi suatu enjin carian seperti Google adalah

  1. Menggelintar internet bagi mencari semua laman web yang terbuka kepada umum
  2. Mengindeks semua laman-laman web itu agar dapat dicapai dengan kata kunci berkaitan
  3. Beri pangkat (ranking) pada semua laman web berdasarkan kata carian

Antara kelebihan utama Google adalah pada langkah ke-3, dengan menggunakan algoritma Pagerank yang sangat efektif untuk memberikan hasil carian Google. Satu cara mudah untuk menggambarkan matematik di sebalik algoritma Pagerank adalah dengan menggunakan rangkaian (networks).

Dalam bentuk rangkaian, setiap laman web boleh di anggap sebagai satu verteks (vertex) dan hubungan pautan (link/hyperlink) di antara laman web ini dipanggil penghubung (edges). Jadi dalam gambarajah berikut laman web A, B, C dan D diwakili oleh verteks masing-masing. Perhatikan bahawa laman web A dan B terhubung dalam kedua-dua arah, ini bermaksud, di laman web A ada pautan (link) kepada laman web B dan di laman web B juga ada pautan ke laman web A.

Contoh rangkaian laman web A, B, C dan D.

Manakala, arah penghubung dari laman web D kepada laman web A membawa maksud laman web D ada memberikan pautan (link) kepada laman web A tetapi tidak sebaliknya. Setiap verteks dalam gambarajah di atas mempunyai dua penghubung tetapi mana satu yang paling penting? Bagi menentukan pangkatnya (ranking), kita perlu fahami jenis-jenis penghubung. Ada jenis penghubung-ke-dalam (in-edge) dan penghubung-ke-luar (out-edge) serta penghubung-tak-berarah (non-directional edge) yang mewakili kedua-dua arah.

Contoh penghubung yang mewakili kedua-dua arah adalah penghubung di antara A dan B. Penghubung sebegini boleh dianggap mewakili dua penghubung sekaligus iaitu satu penghubung-ke-dalam dan satu penghubung-ke-luar. Jadi verteks A mempunyai 2 penghubung-ke-dalam dan satu penghubung-ke-luar manakala B pula mempunyai 1 penghubung-ke-dalam dan 2 penghubung-ke-luar.

Soalan yang perlu dijawab bagi setiap laman web adalah, berapa banyak pautan yang ia terima dari website lain? Atau dalam bentuk rangkaian, berapa banyak penghubung-ke-dalam bagi setiap verteks? Kita hanya perlu mengira anak panah yang menuju ke sesuatu verteks dalam gambar rajah di atas bagi menjawab soalan ini.
Bilangan penghubung-ke-dalam bagi verteks (juga sejenis ‘ranking’) adalah:

  1. A adalah 2 (dari B dan D)
  2. B dan D adalah 1 (masing-masing dari A dan C)
  3. C adalah 0

Ranking ini dipanggil pengiraan darjah terkedalam (in-degree). Jadi menurut ‘ranking’ ini, A adalah laman web paling penting, B dan D sama pentingnya dan C adalah laman web yang paling tak penting. (Bayangkan ini susunannya dalam hasil carian Google anda). Tetapi ini baru ranking tahap pertama. Bukan itu sahaja yang perlu di ambil kira dalam proses memberi ‘ranking’ ini. Kita juga perlu pertimbangkan betapa pentingnya verteks lain yang terhubung kepada sesuatu verteks itu.

Bayangkan keadaan ini, jika di Facebook pengguna F mempunyai 10 orang kawan sahaja tentu kita akan anggap orang ini tidak penting tetapi jika 2 daripada 10 kawannya adalah Perdana Menteri dan Dato’ Siti Nurhaliza (malahan mereka yang hantar ‘friend request’ kepada pengguna F ini), maka tentunya kita akan rasakan pengguna F ni agak penting kerana mendapat ‘friend request’ dari mereka (andaikan F tidak menggodam Feacebook dan menghantar ‘friend request’ itu kepada dirinya sendiri).

Perhatikan bahawa verteks A yang mempunyai ranking tertinggi mempunyai satu penghubung-ke-luar yang terarah kepada B, maka kepentingan A ini akan menaikkan kepentingan B berbanding D yang hanya mempunyai penghubung-ke-dalam daripada C (ranking C adalah yang tercorot dan dianggap kurang penting). Maka ranking terbaru adalah seperti berikut:

  1. A
  2. B
  3. D
  4. C

Pemeringkatan (ranking) sebegini menggunakan pengiraan pemusatan eigen (eigenvector centrality) dalam bidang sains rangkaian (network sains). Pemusatan eigen inilah yang menjadi asas algoritma Pagerank (walaupun algoritma selengkapnya adalah rahsia) yang digunakan dalam enjin carian Google pada hari ini.

Jadi setiap kali anda gunakan Google, ingatlah bahawa ianya merujuk kepada suatu nombor yang sangat besar dan disebalik enjin carian ini terdapat satu formula matematik yang digunakan untuk mencari laman web yang sesuai untuk anda.

Sumber dan Bacaan lanjut:

  1. https://www.google.com/intl/en/about/our-story/
  2. https://www.analyticsvidhya.com/blog/2015/04/pagerank-explained-simple/
  3. http://epubs.siam.org/doi/abs/10.1137/050623280?journalCode=siread
  4. http://www.math.cornell.edu/~mec/Winter2009/RalucaRemus/Lecture3/lecture3.html
  5. https://inhabitat.com/big-and-heatherwick-studio-to-design-googles-new-mountain-view-hq/
Shares