গুগল কিভাবে কাজ করে | How Google Works.

 



গুগল কিভাবে কাজ করে | How Google Works.


গুগল হলো একটি ওয়েবসাইট এটির কাজ হলো তথ্য প্রদান করা এবং ওই তথ্য গুগলের ওয়েবসাইটে না থাকলে অন্যান্য ওয়েবসাইটকে খুঁজে বের করা যে ওয়েবসাইটের মধ্যে ওই প্রশ্নের উত্তর আছে। এবং ওই উত্তর কে খুঁজে পেতে সাহায্য করা।


গুগল একটি ওয়েবসাইট এবং এই ওয়েবসাইটের কাজ হলো ইন্টারনেটের মধ্যে সর্বজনীন অ্যাকসেস যোগ্য ওয়েবসাইট গুলির তথ্যকে পড়া এবং সেই ওয়েবসাইটকে গুগলের সার্ভারের মধ্যে সঞ্চিত করে রাখা।


যখনই কোনো user গুগলের ওয়েবসাইটে কোনো প্রশ্নের উত্তর সার্চ করবে তখন ওই উত্তর যে ওয়েবসাইটে পাওয়া যেতে পারে ওই ওয়েবসাইট গুলিকে সার্চ রেজাল্ট এর মধ্যে দেখিয়ে থাকে। যার ফলে আপনি সহজেই কি ওয়েবসাইটগুলোর ভেতরে গিয়ে উত্তরটি খুঁজে বের করতে পারবেন ।

গুগল না থাকলে আপনি জানতেই পারতেন না কোন ওয়েবসাইটের মধ্যে আপনার প্রশ্নের উত্তর লেখা আছে। এছাড়াও আপনি ওই ওয়েবসাইটকে খুঁজেও পেতেন না।

গুগোল কি ( What Is Google ) ? 

আমি জানিনা গুগোল কে, আপনি কোন চোখে দেখেন কিন্তু গুগোল আসলে একটি মিডিয়া পার্টনার যা অন্যের খবরকে আপনার কাছে আর আপনার প্রশ্নকে অন্যের কাছ পর্যন্ত নিয়ে যেতে সাহায্য করে। এবং একসময় দুই প্রান্তের আমি ও যা জানতে চাই সেই তথ্য দুটোকে মিলিয়ে দেয় তাই অবশ্যই আমি গুগলকে একটি মিডিয়া হিসাবে মনে করি।


কিন্তু এটাতে আমাদের প্রশ্নের যথাযথ উত্তর পাবো না কারন প্রযুক্তিগত ভাষায় বা টেকনিক্যাল দিক থেকে গুগোল হলো একটি সার্চ ইঞ্জিন। সার্চ ইঞ্জিন হলো এমন একটি ইঞ্জিন যেখানে আমরা কিছু সার্চ করি সঙ্গে সঙ্গে সেই ইঞ্জিনটি আমাদের হয়ে কোন কিছু সার্চ করতে থাকে। গুগোল এই কাজটি করে আমাদের বিভিন্ন তথ্য কে তার কাছে দিলে সঙ্গে সঙ্গে সে খোজ শুরু করে।


   কিন্তু সেই তথ্যগুলিকে সে কোথায় খোজ করে ? কোথায় থাকে সেই তথ্য কিভাবে শে তথ্যগুলোকে আমাদের সামনে নিয়ে আসে এই বিষয়গুলো জানলে গুগোল কি তা আরো ভালোভাবে পরিষ্কার হয়ে যাবে। তবুও মোটামুটি মনে করি গুগল কি সে বিষয়ে কিছুটা ধারণা পেলেন।

গুগল কিভাবে কাজ করে?

গুগলের সার্ভারএর মধ্যে প্রোগাম লেখা আছে যার ফলে সার্ভার কম্পিউটার ইন্টানেটের মধ্যে মজুত সমস্ত ওয়েবসাইটকে visit করে এবং ওই সমস্ত ওয়েবসাইটকে চেক করে কোন বিষয়ে ওই ওয়েবসাইটটি বানানো হয়েছে।


এরপর গুগলের কম্পিউটারে ওই সমস্ত ওয়েবসাইটের ওয়েব পেজগুলোর লেখাকে বোঝার ফলে বুঝতে পারে এটি কোন প্রশ্নের উত্তর।

এভাবেই বিভিন্ন ওয়েবসাইটএর পেজকে বিভিন্ন প্রশ্নের উত্তর হিসেবে গুগলের কম্পিউটারে save করে রাখে।

পরবর্তীকালে যখন কোনো ব্যাক্তি গুগলের ওয়েবসাইটে গিয়ে সার্চ করে ওই প্রশ্নগুলি তখন গুগল ওই প্রশ্নের উত্তর যেসব ওয়েবসাইট গুলিতে আছে ওই সমস্ত ওয়েবসাইট গুলিকে ইউজারের সামনে প্রস্তুত করে।


১। ওয়েব ক্রলিং (web crawling)

ওয়েব ক্রলিং কে web spider ও বলা হয়। প্রতিদিন, প্রতি সেকেন্ডে অসংখ্য ওয়েবসাইট তৈরি হচ্ছে। নতুন নতুন অসংখ্য কন্টেন্ট পাবলিশ হচ্ছে। এতো এতো কন্টেন্ট এবং ওয়েবসাইটের মধ্যে, কোনটি আপনি সার্চ করছেন, তা কিন্তু গুগল তৎক্ষণাৎ বের করেনা।


নতুন ওয়েবসাইট তৈরি করার পর, সেটিকে গুগলের কনসোল সাইটে এন্ট্রি দিতে হয়। আপনি যদি একটি ওয়েবসাইট এর ওনার হয়ে থাকেন, আপনার সাইট টি ইউজার দের কাছে ভিজিবল হবে না। যদি না এটি গুগলের কনসোল সাইটে এন্ট্রি দেয়া হয়।


এবার আসি ক্রলিং এর ব্যাপারে। গুগলের একটি রোবট সফটওয়্যার রয়েছে, যার নাম গুগল বট। এই রোবট টি,  তার কনসোলে লিস্ট কৃত সকল ওয়েবসাইট স্ক্যান করে। বা ক্রলিং করতে থাকে।


Google Bot প্রথমে একটি ওয়েবসাইটের একটি লিঙ্কে প্রবেশ করে। এরপর সেখানে যতো link, hyperlink রয়েছে, সবগুলোতে ভিজিট করে। সাথে ক্রমাগত ক্রলিং এর কাজ চলতেই থাকে। এভাবে, ইন্টারনেটের সকল লিঙ্ক সংগ্রহ করে গুগল। এক্ষেত্রে, কিছু লিঙ্ক হয়তো রিপিট হতে থাকে। তখন রিপিট লিঙ্ক গুলোকে বাদ দিয়ে দেয়া হয়। তার মানে , একটি লিঙ্ক শুধু একবারই সংগ্রহ করে গুগল বট।


আবার, এই ক্রলিং এর কাজটি কিন্তু অনেকটা পেইজ রিফ্রেশ করার মত। অর্থ্যাৎ, একবার ক্রলিং করা শেষ হলে, কিছুক্ষন পর গুগল বট আবারো সবগুলো ওয়েবসাইটে ঘুরে আসে। নতুন কোনো কন্টেন্ট পাবলিশ হল কিনা, বা কোনো লিঙ্ক পরিবর্তন হলো কিনা, তা সবসময়ই মনিটর করা হচ্ছে।


২। ওয়েব ইনডেক্সিং (web indexing)

Index শব্দের অর্থ সূচিপত্র। অর্থ্যাৎ, ক্রলিং করে যেই লিঙ্ক গুলো সংগ্রহ করেছিলো, গুগল বট এবার সেগুলোকে সাজিয়ে রাখে। আমরা যখন কোনো কিছু সার্চ করি, গুগল তখন, এই ইনডেক্স থেকে রিলেটেড keyword খুঁজতে থাকে। এবং সেগুলোই রেজাল্ট হিসেবে শো করে। এই খুঁজে বের করাটাই হলো সার্চিং।


৩। পেইজ রেঙ্ক (page rank)

এবার আসি সবচেয়ে গুরুত্বপূর্ণ বিষয়ে। যেই অ্যালগরিদম এর মাধ্যমে, গুগল আজ সার্চ ইঞ্জিন হিসেবে এতটা সফলতা পেয়েছে, সেটি হল পেইজ রেঙ্ক (page rank).

গুগলের সার্চ বার এ কোনো শব্দ লিখে সার্চ করলে, অসংখ্য রেজাল্ট শো করে। এর মধ্যে কিছু রেজাল্ট একেবারে প্রথম পেইজে শো করে। কোনোটি আবার দ্বিতীয় বা তৃতীয় পেইজে। অনেক লিঙ্কে তো আমরা কখনো প্রবেশই করিনা। কারণ সেগুলো rank করেনা।


এই রেঙ্কিং শব্দটির সাথে তো সবারই পরিচিতি থাকার কথা। বিশেষ করে ব্লগার দের এই বিষয় নিয়ে অনেক বেশি ভাবতে হয়।


গুগল তার ইনডেক্স থেকে লিঙ্ক তো খুঁজে বের করলো। কিন্তু কোন লিঙ্কটি আপনাকে সবার আগে শো করবে? যেই লিঙ্কটি rank করবে। অর্থ্যাৎ, আমরা গুগলে তথ্য খুঁজি। এই তথ্য গুলো থাকে বিভিন্ন ওয়েবসাইটে পাবলিশ হওয়া কন্টেন্টের মধ্যে।


যেই কন্টেন্টে, আমাদের সার্চ করা ওয়ার্ডটি সম্পর্কে সবচেয়ে ভালোভাবে উত্তর দেওয়া হয়েছে, সবচেয়ে বেশি বার শেয়ার করা হয়েছে, যেটিতে ভিজিটর অনেক বেশি এবং সবচেয়ে বেশি সময় ধরে পড়া হবে, সেটির থাকবে ranking এর সবার প্রথমে। গুগল প্রায় ২০০টিরও বেশি বিষয়কে র্যাঙ্কিং ফ্যাক্টর হিসেবে ধরে থাকে।


যেমন, আমার এই কন্টেন্ট টি গুগল সম্পর্কিত। এখন, কেউ যদি, গুগল সম্পর্কে জানতে আগ্রহী হয়, তিনি নিশ্চয়ই “what is google” বা “গুগল কি“, এটি লিখেই সার্চ করবেন। এই আর্টিকেলে যদি গুগল’ শব্দটি, অন্য লিঙ্ক গুলোর তুলনায় বেশি থাকে তবে এটি rank করবে । আবার, আমার আর্টিকেল থেকে যদি অনেক মানুষ, তার প্রয়োজনীয় সকল তথ্য পেয়ে যান, তাহলে পুরো লেখাটিই তারা পড়বেন। সেক্ষেত্রে, এই লিঙ্কের view time বেশি হবে। তাহলে এই লিঙ্কটি ranking এ প্রথম পেইজে থাকবে।


রেংকিং কিভাবে হয় ?

গুগল সার্চ ইঞ্জিনের বিভিন্ন ওয়েব সাইটগুলি রেংকিং হওয়ার বিভিন্ন পদ্ধতি আছে। কোন একটি নির্দিষ্ট কারণ এর উপর নির্ভর করে ওয়েবসাইটগুলি গুগলের কাছে Rank / রাঙ্ক করে না। যেমন - যে শব্দ বা যে প্রশ্ন আমরা গুগলের কাছে খুঁজতে চাই সেই সম্পর্কিত যতগুলি ওয়েবসাইট গুগলের ইনডেক্সে থাকে ততগুলি কে আমাদের সামনে হাজির করে।


কিন্তু এই হাজির হওয়া কয়েকশো পেজ এর মধ্যে কোন নির্দিষ্ট পেজ গুলি কে গুগল প্রথমদিকে রাখে কারণ ওই প্রশ্নের উত্তর গুলি ঐসকল পেজে খুব সুন্দর ভাবে লেখা থাকে যেখানে মানুষ কয়েকবার প্রবেশ করে সুন্দর উত্তরগুলো পেয়েছে এবং তারা অনেকটা সময় ধরে সেই উত্তরগুলো পড়েছে।


এই সকল কারণে গুগোল বুঝে ফেলে যে এই সকল ওয়েবসাইটের পেজগুলি অনেক গুরুত্বপূর্ণ ভাবে ওই প্রশ্নের উত্তর লেখা আছে, এই কারণে গুগোল এদেরকে প্রথমদিকে রাখার চিন্তা ভাবনা করে ও প্রথম দিকেই রাখে।


যদিও গুগোল নিজে থেকে কখনো আজ পর্যন্ত স্বীকার করেনি যে কিভাবে এই রেংকিং গুলি করা হয় যদি তারা স্বীকার করত তাহলে আমাদের মত অনেক ব্লগার বা যারা ওয়েবসাইট তৈরি করে তারা খুব সহজেই গুগল সার্চ রেজাল্টের প্রথম দিকে অবস্থান করতে পারত।


সার্চ ইঞ্জিনের ভিন্ন, ইনডেক্স তৈরির কৌশলও ভিন্ন

সার্চ ইঞ্জিনের ভাষায় এদের “স্পাইডার” বলা হয়। এরা  ইন্টারনেটে যত ওয়েবসাইট রয়েছে সেগুলির প্রত্যেকটি লিংক প্রতিনিয়ত ভিজিট করে। প্রতিবার একটি সাইট ভিজিট করার সময় সাইটটির নতুন লিংকগুলি সংগ্রহ করে এবং নষ্ট বা ডেড লিঙ্কগুলো সার্ভার থেকে মুছে দেয়।


প্রথমে স্পাইডার বিভিন্ন জনপ্রিয় পেইজ থেকে শব্দ বা কি-ওয়ার্ড সংগ্রহ করে। তারপর ঐ সাইটে অন্যান্য যেসব পেইজের লিংক রয়েছে সেগুলো অনুসরণ করে। ঐসব পেজে গিয়ে সেখানে থাকা অন্যান্য লিংকও অনুসরণ করে। এভাবে প্রতিনিয়ত চলতে থাকে স্পাইডারের ভ্রমণ। স্পাইডার একটা নির্দিষ্ট সময় পরপর সাইটগুলোতে ঢুকে দেখে নতুন কোন পরিবর্তন এসেছে কিনা।


যেমন টেন মিনিট স্কুল ব্লগে প্রতিদিন যে নতুন নতুন লেখা প্রকাশিত হচ্ছে তা কিন্তু কেউ গুগলের স্পাইডারকে জানায়নি। কিন্তু লেখাগুলোর শিরোনাম দিয়ে গুগলে সার্চ করলে দেখা যাবে ঠিকঠাক টেন মিনিট স্কুলের লেখাগুলোই চলে এসেছে ফলাফলে! কারণ স্পাইডার নতুন লেখাগুলোর ব্যপারে না জানলেও টেন মিনিট স্কুলকে কিন্তু ঠিকই চেনে! তাই সে প্রতিনিয়ত টেন মিনিট স্কুলের ওয়েবসাইটে ঢুকে সবগুলো লিংক অনুসরণ করে তার তথ্য ভাণ্ডার সমৃদ্ধ করে, আর সেই ফাঁকে এই নতুন লেখাগুলোকেও ক্রল (Crawl) করে নিয়েছে।


আরো পড়ুন:

  1. আই ফোন সারা পৃথিবীতে বিখ্যাত কোনো 
  2. প্রসেসর কি 
  3. বাংলাদেশে dslr ক্যামেরার দাম 
  4. সফ্টওয়্যার ইঞ্জিনিয়ারিং কি ?
  5. বিশ্বের সেরা 11টি জনপ্রিয় অনলাইন মোবাইল গেম
  6. নতুন গেমিং ল্যাপটপ 2022
  7. নতুন গেমিং পিসি 2022 |
  8. ২০ থেকে ৩০ হাজার টাকা দামের মধ্যে ভালো ফোন 
  9. কম্পিউটার ভাইরাস কি ? কম্পিউটারে ভাইরাস থেকে রক্ষা পাওয়ার উপায় কি ?
  10. 10000-এর নীচে সেরা ফোন |


0/পোস্ট এ কমেন্ট/Comments