শনিবার, ৮ আগস্ট, ২০২০

র‍্যানসমওয়্যার এট্যাক কি ?

র‍্যানসমওয়্যার এট্যাক কি ?

 

র‍্যানসমওয়্যার এট্যাক কি ? 

- এর প্রতিকার!


প্রতিনিয়তই শুনতে পাই কারো না কারো কম্পউটারে র‍্যানসমওয়্যার এট্যাক  দিয়েছে। অনেক পোস্টও দেখেছি বিভিন্ন গ্রুপে, ফোরাম সাইটে আরো অনেকেই ইনবক্সে মেসেজও করেন । কিভাবে র‍্যানসমওয়্যার এট্যাক বাঁচা যাবে ।আপনারা হয়তো রিসেন্টলি কিছু প্রোজেক্টে বিড করলে ক্লায়েন্ট এসেই বড় একটা মেসেজ দিয়ে আপনাদেরকে “এন ডি এ (নন ডিসক্লোজার এগ্রিমেন্ট)” বা এই টাইপের কথা বলে ফাইলটা ওপেন করতে বলেন । ক্লায়েন্ট এটাও বলে দেয়, “আপনার এন্টিভাইরাস এই ফাইল্টাকে ডিটেক্ট করতে পারে এর জন্য আপনার এন্টিভাইরাস কে ডিজেবল করে রাখবেন” । সাব্বাস হকার সব্বাস। :p


তাহলে কি আছে এই ফাইলের মধ্যে?

তাহলে বলি এর মধ্যে কি আছে। ফাইলটার মধ্যে আছে ম্যালওয়্যার আছে । এখন বলতে পারেন ম্যালওয়্যার আবার কি জিনিস? তালে চলুন জেনে আসিঃ


 ম্যালওয়্যার কি?

ম্যালওয়্যার একটি ক্ষতিকারক সফটওয়্যার যেটি থার্ড পার্টির সুবিধার জন্য ইউজারের অনুমতি ছাড়া সংবেদনশীল তথ্য হস্তান্তর করতে পারে। এটি আপনার কম্পিউটারকে এট্যাক করে ও আপনার পিসিকে অকার্যকর করে মারাত্মক ক্ষতি করতে পারে। যদি আপনি কোনো ম্যালওয়্যার সনাক্ত করেন তৎক্ষনাৎ আপনাকে এন্টিম্যালওয়ার ডাউনলোড করতে হবে। অনেক ধরনের ম্যালওয়্যার আছে । চলুন জেনে আসি সেগুলোর ব্যাপারে।


বিভিন্ন ধরণের ম্যালওয়্যারঃ

যদিও প্রত্যেক বছর মিলিওন রকমের ক্ষতিকারক সফটওয়্যার হাজির হয়, এদেরকে কিছু শ্রেণীতে শেয়ার করা হয়। বিভিন্ন ধরণের ম্যালওয়্যারগুলো হলো ভাইরাস, ট্রোজান হর্স, ওর্মস, স্কেয়ারওয়্যার, রুটকিট ও স্পাইওয়্যার। ম্যালওয়্যার এর ব্যাপারে একটু বিস্তারিত জেনে আসি।


কম্পিউটার ভাইরাসঃ

কম্পিউটার ভাইরাস একটি প্রচলিত সাইবার থ্রেট । যেটা নিজেকে রেপ্লিকেট করে এবং ফাইল ও ফোল্ডার সমূহকে ডিলিট করে ছড়িয়ে পড়ে। কোনো ফ্রী বা পাইরেটেড সফটওয়্যার ডাউনলোড করার সময় ভাইরাস স্বয়ংক্রিয়ভাবে ডিভাইসটিতে ডাউনলোডেড হয় যার । এর পরে ইউজার এর পিসি থেকে কার্যক্রম শুরু করে দেয়।


ট্রোজান হর্সঃ

ট্রোজান হর্স একটি ক্ষতিকারক সফটওয়্যার যেটি স্বাভাবিক সফটওয়্যারের রূপ ধারণ করে অলক্ষিত অবস্থায় থাকে। এটি আপনার ডিভাইসকে স্লো বা অকার্যকর করে দিতে পারে।


ওর্মসঃ

ওর্মস হচ্ছে ক্ষতিকারক প্রোগ্রাম যেটি লোকাল ডিভাইসে, নেটওয়ার্ক শেয়ার এবং অনুরূপ জায়গায় নিজের কপি করে। এটি ইমেইল এটাচমেন্টের মাধ্যমে ডিভাইসে ঢুকতে পারে।


স্কেয়ারওয়্যারঃ

এটি ইউজারকে অনাকাঙ্খিত সফটওয়্যার কিনতে বা ডাউনলোড করতে প্রলোভন দেখায়। সাবধান! অপ্রয়োজনীয় সফটওয়্যার আপনার ডিভাইসের ক্ষতির কারণ হতে পারে।


এডওয়্যারঃ

এটি প্রোগ্রাম চলার সময় এডভার্টাইসিং ব্যানার প্রদর্শন করে। ওয়েবসাইট ব্রাউজ করার সময় এটি স্বয়ংক্রিয়ভাবে ইন্সটল হতে পারে। অনেক কোম্পানি মার্কেটিং এর জন্য এটিকে ব্যবহার করে।


স্পাইওয়্যারঃ

ইউজারের পারমিশন ছাড়া স্পাইওয়্যার প্রোগ্রাম ডিভাইসে ইন্সটল হতে পারে। ইন্টারনেটে ইউজারের কার্যক্রম মনিটর করা এবং থার্ড পার্টির কাছে সংবেদনশীল তথ্য পাচার করা এটির কাজ।


কিভাবে এটি একটি পিসিতে প্রবেশ করে?

ম্যালওয়্যার বিভিন্ন উপায়ে পিসিতে প্রবেশ করে যেমন স্প্যাম ইমেল, সংক্রামিত অপসারণযোগ্য ড্রাইভ এবং অনিরাপদ ওয়েব পেইজগুলির মাধ্যমে। সুতরাং আপনি যদি কোনও অনির্ভরযোগ্য সাইট থেকে কোনও সফটওয়্যার ডাউনলোড করেন, তবে এটি আপনার পিসিকে় সংক্রামিত করতে পারে যা খুবই ঝুঁকিপূর্ণ।

এটি একটি পিসিকে কিভাবে প্রভাবিত করে?


একবার যখন একটি ম্যালওয়ার কোনো ডিভাইসে ঢোকে, এটি অনেক অযাচিত কাজ করে। যেমন:

• পিসির গতি হ্রাস করে।

• একটি ওয়েব ব্রাউজারে যেসব ট্যাব খোলা থাকে সেগুলো বন্ধ করে দেয়।

• ওয়েবসাইট ব্লক করে দেয়

• ওয়েবসাইটগুলির উইন্ডোতে অপ্রয়োজনীয় পপ-আপ দেখায়।


ম্যালওয়্যার রিমুভ করবেন কিভাবে?

একটি ম্যালওয়্যার অপসারণ করার জন্য, আপনার পিসিতে ক্লিনার ইনস্টল থাকা উচিত। উন্নত ম্যালওয়্যার ক্লিনার ফিচারযুক্ত একটি অ্যান্টিভাইরাস আপনাকে স্ক্যান করতে এবং আপনার কম্পিউটারে লুকানো সংক্রমিত প্রোগ্রামগুলি সনাক্ত করতে সহায়তা করবে। যদি আপনি আপনার পিসির জন্য সম্পূর্ণ সুরক্ষা চান তবে ফ্রি সংস্করণের পরিবর্তে অ্যান্টিভাইরাসগুলির একটি প্রিমিয়াম সংস্করণ নিন। অ্যান্টিভাইরাসের প্রিমিয়াম সংস্করণগুলি ম্যালওয়্যার দ্রুত সনাক্তকরণের জন্য অনেক উন্নত ফিচার-সমৃদ্ধ ম্যালওয়্যার স্ক্যানার বা অ্যান্টি-ম্যালওয়্যার সহ আসে।


স্ক্যানওয়্যার বনাম র‍্যানসমওয়্যারঃ

স্কেয়ারওয়্যার এবং রেনসওয়ওয়ারের মধ্যে মূল পার্থক্য হ’ল স্কেয়ারওয়্যারটি ম্যালওয়্যার ডাউনলোড করবে যা ডেটা চুরি করতে ব্যবহৃত হবে যখন বিটকয়েনের মতো মুদ্রায় দাবি করা মুক্তিপণের পরিমাণের জন্য আপনার ডেটা এনক্রিপ্ট করতে এবং লক করে রাখতে ব্যবহার করা হয় ransomware। স্ক্যামাররা কঠোর উপার্জনযোগ্য নগদ এবং ব্যক্তিগত তথ্য থেকে ইন্টারনেট ব্যবহারকারীদের চেষ্টা করার জন্য বিভিন্ন কৌশল অবলম্বন করে। স্কেরওয়্যার এবং ransomware যেমন উদ্দেশ্যে ব্যবহৃত হয়। তবে এর মধ্যে একটির অপরটির চেয়ে গুরুতর বিষয়। তারা কীভাবে ব্যবহারকারীদের হুমকি দেয় তা দেখার জন্য উভয় সফ্টওয়্যার ঘনিষ্ঠভাবে দেখে নেওয়া যাক।


স্কয়ারওয়্যার কী?

স্কয়ারওয়্যারটি মূলত প্রতারণার জন্য ব্যবহৃত হয়। এটি দুর্বৃত্ত স্ক্যানার হিসাবেও পরিচিত। এই সফ্টওয়্যারটির মূল উদ্দেশ্য হ’ল এই সফ্টওয়্যারটি কেনার বা ইনস্টল করার ক্ষেত্রে লোকজনকে ভীতি প্রদর্শন করা। একটি ট্রোজান সফ্টওয়্যার একই পদ্ধতিতে, স্কয়ারওয়্যার ব্যবহারকারীদের পণ্য ডাবল-ক্লিক এবং ইনস্টল করতে প্রতারিত করতে ব্যবহৃত হয়। ভয়ঙ্কর পর্দা প্রদর্শন করার মতো কেলেঙ্কারী কৌশলগুলি আপনাকে দেখায় যে আপনার কম্পিউটারের আক্রমণ চলছে। স্কয়ারওয়্যার সিস্টেমের সমস্যার বার্তা এবং ভাইরাস সতর্কতার নকল সংস্করণ ব্যবহার করে। এই পর্দাগুলি নকল এবং বেশিরভাগ লোককে বোকা বানাবে। এই প্রদর্শনগুলির পরে, স্কয়ারওয়্যারটি নিজেকে কম্পিউটার অ্যাটাকের সমাধান হিসাবে একটি অ্যান্টিভাইরাস বলে দাবি করবে। রুজ স্ক্যানার এবং স্কয়ারওয়্যার বহু মিলিয়ন ডলারের কেলেঙ্কারী ব্যবসায়ের একটি অংশে পরিণত হয়েছে। কোনও ব্যক্তি তার স্ক্রিনে প্রদর্শিত বোগাস ভাইরাস আক্রমণের কারণে স্কয়ারওয়্যার কেনার ক্ষেত্রে কেলেঙ্কারী হতে পারে। হাজার হাজার ব্যবহারকারী এই কেলেঙ্কারীর জন্য প্রতিমাসে পড়ে। তারা মানুষের ভয় এবং প্রযুক্তিগত জ্ঞানের অভাবকে ব্যবহার করে।


ব্যক্তিগত এবং ব্যাংকিং তথ্যের কীস্ট্রোক রেকর্ড করার প্রয়াসে স্কেরওয়্যার আপনার কম্পিউটারে আক্রমণ করতে পারে। স্কয়ারওয়্যার আপনার কম্পিউটারটিকে স্প্যাম-প্রেরণকারী রোবট হিসাবে পরিবেশন করতে দূরবর্তীভাবে নিয়ন্ত্রণ করার চেষ্টা করতে পারে।


স্কয়ারওয়্যার কীভাবে এড়ানো যায়?

সন্দিহান এবং সচেতন হওয়া আপনাকে অনলাইন কেলেঙ্কারীগুলি এড়াতে সহায়তা করতে পারে। যখনই কোনও উইন্ডো আপনাকে ডাউনলোড এবং ইনস্টল করতে জিজ্ঞাসা করে তখনই সর্বদা বিনামূল্যে অফারগুলির প্রশ্ন করুন। বৈধ অ্যান্টিভাইরাস পণ্য ব্যবহার আপনাকে স্কয়ারওয়্যার এড়াতে সহায়তা করবে। সাধারণ পাঠ্যে ইমেল পড়াও সহায়তা করবে। যদিও এ জাতীয় উপায়ে পড়া সমস্ত গ্রাফিকগুলি অপসারণের সাথে প্রসাধনীভাবে সন্তুষ্ট নয় তবে এটি সন্দেহজনক লিঙ্কগুলি প্রদর্শন করতে সহায়তা করবে।


এছাড়াও, অপরিচিতদের কাছ থেকে ফাইল সংযুক্তিগুলি খোলার বিষয়টি এড়িয়ে চলুন। সন্দেহজনক সফ্টওয়্যার পরিষেবা খুলবেন না। সংযুক্তিগুলির সাথে আসা যে কোনও ইমেল অফারগুলিকে অবিশ্বাস করুন যেহেতু এই ইমেলগুলিতে সাধারণত স্প্যাম থাকে। এই জাতীয় বার্তাগুলি কম্পিউটারে সংক্রামিত হওয়ার আগে আপনার তাদের মুছে ফেলা উচিত। আপনার ব্রাউজারটি বন্ধ করতে এবং অনলাইন অফার সম্পর্কিত সন্দেহজনক হতে প্রস্তুত হন। আপনি যদি অ্যালার্মের কোনও ধারণা অনুভব করেন, তবে Alt এবং F4 বোতাম টিপলে আপনার ব্রাউজারটি বন্ধ হয়ে যাবে এবং কোনও স্কয়ারওয়্যার ডাউনলোড হতে দেওয়া বন্ধ হবে stop


র‍্যানসমওয়্যার কী?

র‍্যানসমওয়্যার একটি দূষিত কোড ব্যবহার করে যা লক স্ক্রিন এবং ডেটা অপহরণ আক্রমণ চালানোর জন্য অপরাধীদের দ্বারা ব্যবহৃত হয়। এই ধরনের আক্রমণগুলির উদ্দেশ্যটি অন্যান্য আক্রমণের মতো নয়, আর্থিক। ক্ষতিগ্রস্থকে শোষণের বিষয়ে অবহিত করা হবে এবং আক্রমণ থেকে কীভাবে পুনরুদ্ধার করা যায় সে সম্পর্কে নির্দেশনা দেওয়া হবে। অপরাধীর পরিচয় রক্ষার জন্য ভার্চুয়াল মুদ্রার আকারে অর্থ দাবি করা হবে।


ইমেল সংযুক্তি, সংক্রামিত বাহ্যিক স্টোরেজ, সংক্রামিত সফ্টওয়্যার এবং আপোসযুক্ত ওয়েবসাইটগুলির মাধ্যমে র‍্যানসমওয়্যার ম্যালওয়্যার ছড়িয়ে পড়ে। লক স্ক্রিন আক্রমণে, ভুক্তভোগীর শংসাপত্রগুলি কম্পিউটার ডিভাইসে পরিবর্তিত হতে পারে। অপহরণকারী আক্রমণে, ম্যালওয়্যারটি সংক্রামিত ডিভাইস এবং সংযুক্ত নেটওয়ার্ক ডিভাইসগুলিতে ফাইলগুলি এনক্রিপ্ট করতে ব্যবহৃত হবে। ডিপ ওয়েবে উপলভ্য র‍্যানসমওয়্যার কিটগুলি মুক্তিপণ প্রোগ্রামগুলি ক্রয় করতে খুব কম চেষ্টা করে এবং আক্রমণ চালাতে সামান্য বা কোনও প্রযুক্তিগত জ্ঞানসম্পন্ন অপরাধীদের সক্ষম করেছে। আক্রমণকারীরা এই পদ্ধতিগুলি ডিজিটাল মুদ্রা আমদানি করতে এবং তাদের ক্ষতিগ্রস্থদের কাছে ডিজিটাল ডেটা রফতানি করতে ব্যবহার করবে।


ক্ষতিগ্রস্থরা একটি পপ-আপ স্ক্রিন বা ইমেল সতর্কতা গ্রহণ করবে যে ডিভাইসটি আনলক করতে বা ফাইলগুলি ডিক্রিপ্ট করার জন্য প্রাইভেট কীটি মুক্তিপণ প্রদান করা না হলে ধ্বংস হয়ে যাবে। ভুক্তভোগীকে ভেবেও বোকা বানানো যেতে পারে যে সে অফিসিয়াল তদন্তের বিষয়। ভুক্তভোগীকে জানানো হবে যে ভুক্তভোগীর কম্পিউটারে অবৈধ ওয়েব বা লাইসেন্সবিহীন সফ্টওয়্যার পাওয়া গেছে। এটি কীভাবে বৈদ্যুতিন জরিমানা পরিশোধ করতে হবে তার নির্দেশনা অনুসরণ করা হবে।


কীভাবে র‍্যানসমওয়্যার থেকে রক্ষা করবেন?

র‌্যানসমওয়্যার এবং সাইবার চাঁদাবাজির মতো আক্রমণ থেকে নিজেকে রক্ষা করতে বিশেষজ্ঞরা নিয়মিতভাবে অ্যান্টিভাইরাস জাতীয় সফ্টওয়্যার আপডেট করতে এবং আপনার কম্পিউটারকে ব্যাকআপ করার আহ্বান জানান। অপরিচিতদের ইমেলগুলি ক্লিক করার সময় এবং সংযুক্তিগুলি খোলার সময় শেষ ব্যবহারকারীদের সাবধানতা অবলম্বন করা উচিত।

র‍্যানসমওয়্যার আক্রমণ সম্পূর্ণভাবে এড়ানো যায় না। ক্ষয়ক্ষতি কমাতে এবং দ্রুত পুনরুদ্ধার করার জন্য ব্যক্তি ও সংস্থাগুলি গ্রহণ করতে পারে এমন গুরুত্বপূর্ণ ব্যবস্থা রয়েছে। মূল স্টোরেজ পুলের বাইরে স্টোরেজ স্ন্যাপশট রাখার মতো কৌশল, কঠোর সীমাবদ্ধতা প্রয়োগ করা এবং বগি প্রমাণীকরণ সিস্টেমগুলি সহায়তা করবে।


সংক্ষিপ্তসার – স্ক্যানওয়্যার বনাম র‍্যানসমওয়্যারঃ

স্কয়ারওয়্যার এবং র‍্যানসমওয়্যার ইন্টারনেট ব্যবহারকারীদের শোষণের দুটি উপায়। স্কেয়ারওয়্যার এবং র‍্যানসমওয়্যার মধ্যে পার্থক্য নির্ভর করে তারা কীভাবে আক্রমণ ব্যবহার করে; স্ক্যানওয়্যার আপনার ডেটা চুরি করে যেখানে র‍্যানসমওয়্যারটি আপনার কম্পিউটারকে লক করে এবং মুক্তিপণের জন্য আপনার ব্যক্তিগত ডেটা এনক্রিপ্ট করে। উপরের আক্রমণগুলি থেকে নিরাপদ থাকতে সন্দেহজনক সাইটগুলি থেকে দূরে থাকুন, টরেন্ট ফাইলগুলি ডাউনলোড করবেন না বা সন্দেহজনক ইমেলগুলি খুলবেন না।


গবেষণা ও লেখাঃ এম এইচ মামুন।

শুক্রবার, ৭ আগস্ট, ২০২০

Deepfake ভিডিও কি ?

Deepfake ভিডিও কি ?

 Deepfake ভিডিও কি  ?


বর্তমানে ইন্টারনেট দুনিয়ারর নতুন বিপদ হচ্ছে Deepfake ভিডিও এই Deep coder মাধ্যমে যে কাউকে যে কেউ ফাসিয়ে দিতে পারে।


সরাসরি বলেতে গেলে এক জনের চেহারা কে নকল করা এবং ভিডিও তৈরি করা।

সম্প্রতি এই ডিপ ফেক ভিতিও নিয়ে অনেক তোলপার চলছে সোশাল মিডিয়া গুলো।

সেই মানুষের নিরাপত্তার সংখ্যাও রয়েছে।

ডিপফেক ভিডিও আমি বা আপনার কাছে নতুন হলে ও এটা নিয়ে প্রযুক্তিরর দুনিয়ায় অনেক আলোচনা সমচলনা চলছে।


সে সাথে প্রযুক্তি বিদরা অনেক বেশি চিন্তায় রয়েছে এই টপিক টা নিয়ে।

আসলে এই ভিডিও টা কি?

আসলে এই ভিডিও হচ্ছে একটা কোড যা হ্যাকারা তৈরি করো ভিবিন্ন সোশাল মিডিয়ায় ছেরে দিয়েছে।

তো এই ডিপফেক ভিডিওর মাধ্যমে এক জনের চেহারে কে হুবোহু কপি করে নতুন একটা ভিডিও তৈরি করা যায়।সো আপনি বুঝতেই পারছেন আপনার ভয়ের কারণ টা কি?


এই ডিপফেক কোডটা ব্যবহার করার কারণে আপনার চেহারা নকল করে ভিডিও তৈরি করা যেতে এবং সেই ভিডিও টি যদি হয় কোন হুম মূলক বা উসকানি মূলক ও সন্ত্রাসী কথাবার্তা মূলক কোন ভিডিও তাহলে আপনার অনেক বড় ক্ষতি হয়ে যেতে পারে।অন্য সব মানুষ ভাববে যে আপনি এই ভিডিও টা করেছেন।সম্প্রতি ফেসবুক এবং টিকটক ফেকভিডিও কোডটি ছড়িয়ে পরেছে এবং অনেকের ভিডিও গুলো কিন্তু রিসেন্টলি পাবলিশ হয়েছে।

গুগোল এবং ইউটিউবে সার্চ করলে এই ভিডিও গুলো পেয়ে যাবেন।

যেমন:মার্ক জুকার বার্গ আছে, ডোনাল্ড ট্রাম্প আছে,পুতিন আছে,বারামোকা আছে আরো কত কে।

তো বুঝতে পারছেন এই ডিপফেক ভিডিও কোড এনে যে কেউের ভিডিও তৈরি করা সম্ভব।


এই কারণে আমার নিরাপত্তা দরকার কারণ আমাদের যদি নিয়ে একটা ভিডিও তৈরি করে তাহলে আমরা ও বিপদে পরে যেতে পারি।

সো ফেসবুক সম্প্রতি এই ডিপফেক ভিডিও কোডটি তাদের সার্ভার থেকে ব্যান করে দিয়েছে কিন্তু টিকটকে ডিপফেক ভিডিওটি বেশি ভাইরাল হয়ে গেছে।এছাড়াও অনন্যা ও সোশাল মিডিয়া ডিপফেক কোড টি ছড়িয়ে দেওয়ার চেষ্টা চলছে।


এই কোড টি কোথাও ছড়িয়ে দিতে পারলে এই ফেকভিডিও তৈরি করা সম্ভব।

আমাদের মতো সাধারণ মানুষ কে নিয়ে যদিও এমনি ভিডিও তৈরি হবে না তারপর ও এটা কে হেলায় ফেলায় দিতে পারি না।

এই ডিপফেক ভিডিও মূলত তৈরি হচ্চে মূলত বড় বড় সেলিব্রটি এবং রাজনিতি বিদ নিয়ে তৈরি হচ্ছে ও প্রধানমন্ত্রীদের নিয়ে।

এজন্য আমাদের কে নিয়েও যদি এমন ভিডিও তৈরি করে তাহলে আমরা ও কিন্তু ফেসে যেতে পারি।


যারা বিভিন্ন সোশাল মিডিয়া ব্যবহার করেন তারা

এদিকে অবশ্যই আমাদের খেয়াল রাখতে হবে।

বুধবার, ৫ আগস্ট, ২০২০

ইন্টারনেট সার্চ ইঞ্জিন যেভাবে কাজ করে...!

ইন্টারনেট সার্চ ইঞ্জিন যেভাবে কাজ করে...!

ইন্টারনেট সার্চ ইঞ্জিন যেভাবে কাজ করে...!



ন্টারনেটের সবচেয়ে ভালো দিক হলো যে এখানে তথ্যের কোন অভাব নেই। হাজার হাজার, লক্ষ লক্ষ থেকে শুরু করে কোটি কোটি ওয়েবপেইজ আপনি পাবেন ইন্টারনেটে যার প্রতিটিতেই রয়েছে কোন না কোন তথ্য। কিন্তু এর পাশাপাশি আরেকটি অন্যরকম দিকও রয়েছে আর যা হলো সেই তথ্যকে সঠিকভাবে খুঁজে বের করে না আনতে পারা। যখন আপনার কোন নির্দিষ্ট বিষয়ের উপরে জানার দরকার হয়ে পড়ে তখন আপনি কিভাবে সেই কাঙ্খিত বিষ্যটি বের করে আনবেন ইন্টারনেট থেকে? সেই কাজে সহায়তা করার জন্যই জন্ম নিয়েছে ইন্টারনেট সার্চ ইঞ্জিন। আসুন দেখা যাক ইন্টারনেট সার্চ ইঞ্জিন কিভাবে কাজ করে।
সবার আগে জেনে নেওয়া যাক ইন্টারনেট সার্চ ইঞ্জিন আসলে কী? ইন্টারনেট সার্চ ইঞ্জিন হলো ওয়েবে বিশেষ কিছু সাইট যা ডিজানই করা হয়েছে অন্যান্য সাইটে যে জন্য জমা আছে সেগুলোকে খুজে সেই পেইজটি আইডেন্টিফাই করা এবং ইউজারের সামনে নিয়ে আসা। সার্চ ইঞ্জিনগুলোর কাজের ধরনে বেশ কিছু তফাৎ থাকলেও প্রতিটি সার্চ ইঞ্জিনকেই বেসিক তিনটি জিনিস করতে হয়।

১. সার্চ ইঞ্জিনগুলো ইন্টারনেটে সার্চ করে থাকে – অথবা কখনো কখনো ইন্টারনেটের বিশেষ অংশে যেমন কেবলমাত্র বিশেষ কিছু ডমেইন নেমের ভিত্রে।
২. সার্চ ইঞ্জিনগুলো যেসব শব্দ খুজে পায় তার একটি ইন্ডেক্স নিজের কাছে জমা রাখে এবং কোথায় পেলো সেটিও সংরক্ষন করে থাকে।
৩. এরা ইউজারকে সেই শব্দ বা শব্দমালার কম্বিনেশনে সার্চ করার সুবিধা প্রদান করে থাকে।

আগের দিনে একটি সার্চ ইঞ্জিন হয়তো কয়েকহাজার পেইজ ও ডকুমেন্ট ইন্ডেক্স নিয়ে তৈরী হতো এবং সারা দিনে হয়তো এক কি দুই হাজার ইনকয়ারি পেতো। কিন্তু বর্তমান দিনে সার্চ ইঞ্জিনের ইন্ডেক্স সংখ্যা শত মিলিয়ন ছাড়িয়ে গেছে এবং কোয়ারির সংখ্যা প্রতিদিনের হিসাবে মিলিয়ন।

যখনই ইন্টারনেট সার্চ ইঞ্জিন শব্দটি বলা হয় তখন তার অর্থ করা হয় ওয়ার্ল্ড ওয়াইড ওয়েব সার্চ ইঞ্জিনের কথা। এমনকি যখন ইন্টারনেটে ওয়েব তত বিস্তৃতি লাভ করেনি তখনও সার্চ ইঞ্জিন ছিলো। এগুলো ছিলো প্রোগ্রামের মতো যেমন গোফার এবং আর্চি যেগুলো সার্ভারে যেসব ফাইল থাকতো তার ইন্ডেক্স জমা রাখতো যা ব্যবহার করে ইন্টারনেটে যেকোন প্রোগ্রাম ও ডকুমেন্ট খুজে বের করার সময় অনেক সাশ্রয় করা যেতো।১৯৮০ এর দশকের শেষের দিকে গোফার, আর্চি, ভেরোনিকা ইত্যাদি ব্যবহার করা খুব প্রচলিত একটি ইন্টারনেট অভ্যাসের ভিতরে ছিলো। আজকাল সার্চ করার কৌশন তখনকার দিক থেকে বেশ কিছুটা পাল্টে গেছে এবং এখন থেকে বেশ কিছুটা পাল্টে গেছে এবং এখন মূলত ওয়েব পেইজের কনটেন্ট কি তার উপরেই বেশী সার্চ করা হয়ে থাকে।

সার্চ ইঞ্জিনে সার্চ করলে আমরা কি দেখতে পাই? বেশ কিছু রেজাল্ট সম্বলিত ওয়েবপেইজের বা ওয়েব এ্যাড্রেসের ঠিকানা। কিন্তু আমরা যে বিষয়ে সার্চ করতে আগ্রহী তা পাওয়ার আগে নিশ্চয়ই সেটিকে খুজে বের করতে হয় হাজার হাজার, লক্ষ লক্ষ ওয়েব পেইজের ভিতর থেকে তথ্য খুজে বের করার জন্য সার্চ ইঞ্জিনগুলো কাজে লাগায় বিশেষ সফটওয়্যার রোবট যাদেরকে ডাকা হয় স্পাইডার নামে। এই স্পাইডারগুলো যা করে তা হচ্ছে ওয়েবসাইটে প্রাপ্ত শব্দগুলোর একটি লিস্ট তৈরি করে। যখন স্পাইডারগুলো এই লিস্ট তৈরী করে সেই প্রক্রিয়াকে বলা হয় ওয়েব ক্রলিং। কাজের একটি লিস্ট তৈরী করতে সার্চ ইঞ্জিন স্পাইডারগুলোকে প্রচুর ওয়েবপেইজে খোজার কাজটি করতে হয়।

কিভাবে একটি স্পাইডার ওয়েবে তার যাত্রা শুরু হবে? সাধারনত যেসব সার্ভার এবং যেসব পেইজ খুব বেশী মাত্রায় একসেস হয়ে থাকে সেগুলোকেই স্পাইডাররা তাদের মূল ও প্রথম টার্গেট করে। স্পাইডার প্রথমে একটি জনপ্রিয় সাইট থেকে শুরু করে এবং সেই পেইজের সব শব্দকে তার ইন্ডেক্সে এন্ট্রি করে, তার সাথে সাথে এটি যত লিঙ্ক আছে সেগুলোকেও অনুসরন করে। এভাবে আরম্ভ করে স্পাইডারগুলো সম্পূর্ণ ওয়ার্ল্ড ওয়াইড ওয়েবে তাদের সার্চ সম্পন্ন করে থাকে।

গুগল (www.google.com) নামের একটি জনপ্রিয় সার্চ ইঞ্জিনের কথা এখানে উল্লেখ করা যেতে পারে। এই সার্চ ইঞ্জিনটি মূলত যাত্রা শুরু করে একটি এ্যাকাডেমিক সার্চ ইঞ্জিন হিসাবে। তাদের স্পাইডারগুলো খুবই দুত কাজ করতে পারে। এই সার্চ ইঞ্জিনের স্রষ্টা দুইজন সার্গেই ব্রিন এবং লরেন্স পেইজ। তারা প্রথমে যে সিস্টেমটি তৈরী করে সেখানে একের অধিক স্পাইডার ব্যবহার করা হয়। প্রতিটি স্পাইডার এক সাথে ওপেন আছে এরকম ৩০০ কানেকশন ধরে রাখতে পারে। তাদের সর্বোচ্চ পারফর্মেন্সের সময়ে চারটি স্পাইডার সিস্টেমে ব্যবহার করে প্রতি সেকেন্ডে ১০০টি ওয়েব পেইজে ক্রল করে প্রতি সেকেন্ড ৬০০ কিলোবাইট ডাটা সংগ্রহ করে থাকে। সবকিছু খুব দ্রুত করার লক্ষে এমন একটি সিস্টেম ডিজাইন করা জরুরী যেটা স্পাইডারকে প্রয়োজনীয় তথ্য দ্রুত সরবরাহ করতে পারে। প্রথম দিকে গুগল সিস্টেমটিতে একটি সার্ভার থাকতো যেটি স্পাইডারগুলোকে ওয়েব ঠিকানা বা ইউআরএল প্রদান করতো। কিন্তু এতে ডিএনএস বা ডোমেইন নেম সার্ভারের জন্য নির্ভর করতে হতো কোন ইন্টারনেট সার্ভিস প্রোভাইডারের উপরে। এজন্য এখন গুগল নিজস্ব একটি ডিএনএস ব্যবহার করে সময় গ্যাপ আরো কমিয়ে এনেছে।

গুগলের স্পাইডার যখন একটি এইচটিএমএল ওয়েবপেইজ এ চোখ বোলায় তখন দুইটি জিনিসের নোট নেয়।
প্রথমত পেইজের ভিতরে যে শব্দগুলো আছে সেগুলো এবং কোথায় এই শব্দগুলো পাওয়া গেছে। একজন ইউজার যখন সার্চ করে থাকে তখন সার্চ ইঞ্জিন মূলত টাইটেল, সাবটাইটেল এবং মেটাট্যাগের মতো গুরুত্বপূর্ণ জায়াগায় প্রথমে শব্দগুলো সার্চ করে। গুগল স্পাইডারকে ডিজাইন করা হয়েছে যাতে প্রতিটি পেইজের কেবলমাত্র a, an, the, or ইত্যাদি শব্দ বাদ দিয়ে বাকি সব গুরুত্বপূর্ণ শব্দকে ইন্ডেক্স করে। তবে অন্যান্য স্পাইডার ভিন্ন পন্থায় কাজ করতে পারে।

ভিন্ন ভিন্ন সার্চ ইঞ্জিনের ভিন্ন ভিন্ন স্পাইডারের কাজের ভিন্ন পন্থার পেছনে মূল কারন হচ্ছে কত দ্রুত একটি সার্চ সম্পন্ন করা যায় সেই প্রচেষ্টা। কেউ কেউ ইউজারকে খুব নিখুত সার্চ রেজাল্ট দিতে প্রাধান্য দেয় আবার কেউ কেউ চায় দ্রুত সার্চ রেজাল্ট দেওয়া। লাইকস (www.lycos.com) ওয়েব সার্চ ইঞ্জিনটি অন্য একটি পন্থায় সার্চ করে। এগুলো হেডিং, সাবহেডিং, লিঙ্ক সহ পেইজের সবচেয়ে বেশী ব্যবহৃত ১০০টি শব্দকে গ্রহন করে এবং প্রথমে ২০ লাইন টেক্সট থেকে শব্দগুলো নেয়। আলতাভিস্তা (www.altavista.com) নামের সার্চ ইঞ্জিনটি আবার প্রতিটি পেইজের সব শব্দকেই ইন্ডেক্স করে। এমনকি a, an, the পর্যন্ত। তারপরে এগুলো মেটাট্যাগগুলোর উপরে তাদের সার্চ রেজাল্টের জোর দেয়।

মেটাট্যাগের কৌশল:
যখন একটি ওয়েবপেইজ কেউ তৈরী করে তখন মেটাট্যাগ নামের কোড অংশে ইউজার সাধারনত তার পেইজ এর কী-ওয়ার্ড বা প্রধান শব্দগুলো রেখে দেয় যার উপরে ভিত্তি করে সেগুলোকে পরে বাছাই করা যায়। মেটাট্যাগগুলোই সার্চ ইঞ্জিনকে পরিচালিত করে কোন ওয়েবপেইজটি কি সে সম্পর্কে। কখনো কখনো কোন কোন মেটাট্যাগ ওয়েব ডেভলপার এমন সব শব্দ নিয়ে দেয় যা তার কনটেন্টের সাথে সাদৃশ্যপূর্ন নয়। এক্ষেত্রে সার্চ ইঞ্জিনগুলো ওয়েবপেইজের সাথে মেটাট্যাগের শব্দগুলো মিলিয়ে দেখে থাকে। এর ফলে অপ্রয়োজনীয় মেটাট্যাগ কী-ওয়ার্ড স্পাইডার ইগনোর করে থাকে।

ইন্ডেক্স তৈরী করা:
যখনই একটি স্পাইডার কোন ওয়েবপেইজের তথ্য খুজে বের করার কাজটি সম্পন্ন করে তখন এটিকে জমা করার প্রয়োজন হয়। আসলে ইন্টারনেটের প্রকৃতি এমন যে এতে স্পাইডারগুলোর কাজ কখনোই শেষ হয় না, এগুলো সবসময়ই ক্রল করে নতুন ওয়েবপেইজ থেকে তথ্য বের করতে থাকে। তারপরেও যখন কিছু তথ্য জমা হয়ে যায় তখন তথ্যকে এমনভাবে জমা রাখতে হয় যাতে সেগুলো ভবিষ্যতে কাজের উপযোগীভাবে পাওয়া যায়। সাধারনত ইউজারকে জেনারেটেড ডাটা পাওয়ার জন্য দুইটি প্রসেস গুরুত্বপূর্ণ। এক হলো যে তথ্য জমা হয় তা, দুই হলো যে পদ্ধতিতে তথ্যকে ইন্ডেক্স করা হয় সেটি।

একদম সহজ ভাষায় চিন্তা করলে একটি সার্চ ইঞ্জিন ওয়েব ইউআরএল বা ঠিকানার সাথে শব্দগুলো জমা রাখতে পারে। কিন্তু এর ফলে সার্চ ইঞ্জিনের ব্যবহার সীমিত হয়ে যেত। এর ফলে জানা যাবে না যে শব্দগুলো বারবার খোঁজা হয়েছে কি না, সাইটটিতে আরো লিঙ্ক আছে কিনা ইত্যাদি। এর ফলে সহজেই একটি রেংকিং তৈরি করা যাবে যার ফলে সার্চ রেজাল্টগুলোকে সাজানো যায়। এ কারণে সার্চ রেজাল্টকে আরো অর্থপূর্ণ করতে এন্ট্রিগুলোকে নিজস্ব ওয়েট বা গুরুত্ব অনুসারে সাজানো হয়। যেসব শব্দগুলো ডকুমেন্টের শুরুতে থাকে বা মেটাট্যাগে থাকে তা রাখা হয় আগে। প্রতিটি কমার্সিয়াল সার্চ ইঞ্জিন তার নিজস্ব পন্থায় এই কাজটি করে থাকে। যত নিখুঁত কম্বিনেশনে এই তথ্য রাখা হোক না কেন সার্চ ইঞ্জিনগুলো সব ডাটাকেই জমা রাখার জন্য এনকোড করে থাকে যাতে জায়গা সাশ্রয় করা যায়। তথ্যকে কম্প্যাক্ট করার পরে তা ইন্ডেক্সের জন্য প্রস্তুত হয়। একটি ইন্ডেক্সের উদ্দেশ্য প্রধানত একটি, তা হলো তথ্যকে দ্রুত খুজে পাওয়া। অনেক উপায়েই ইন্ডেক্স তৈরি করা হয় যার ভিতরে একটি কার্যকর উপায় হলো হ্যাশ টেবিল তৈরি করা। হ্যাশিং পদ্ধতিতে একটি সূত্র ব্যবহার করে প্রতিটি শব্দকে সংখ্যা দিয়ে রিপ্রেজেন্ট করা হয়। এর ফলে এন্ট্রিকে নির্দিষ্ট সংখ্যক ভাগে ভাগ করা হয়। এই নিউম্যারিক্যাল ডিস্ট্রিবিউশন এ্যালফাবেটিক ডিস্ট্রিবিউশন থেকে আলাদা এবং এটাই হ্যাশ টেবিলের কার্যকরতার মূল। উদাহরণ স্বরূপ ইংরেজী ভাষায় এম অক্ষরের শব্দ সংখ্যা এক্স অক্ষরের শব্দ সংখ্যার চাইতে অনেক বেশী। এভাবে দেখা যায় কোন কোন শব্দের এন্ট্রি অনেক বেশী, আবার কোন কোন অক্ষরের এন্ট্রি অনেক কম। এই সমস্যাটিই হ্যাশ টেবিল সমাধান করে থাকে যেখানে ডিস্ট্রিবিউশন হয় সমান।

সার্চ গড়ে তোলা:
প্রথমে একজন ইউজারকে কোন বিষয়ে সার্চ করার জন্য একটি কোয়্যারি বা প্রশ্ন পাঠাতে হয় প্রশ্নটি একটি শব্দেরো হতেপারে যার মানে হলো সার্চ ইঞ্জিনকে প্রশ্ন করা সেই বিষয়ে কি জানে। আবার কোয়্যারি হতে পারে জটিল যার জন্য বুলিয়ান অপারেটর ব্যবহার করে সার্চ করা যেতে পারে। কিছু বুলিয়ান অপারেটর যেমনঃ
AND, OR, NOT, FOLLOWED BY, NEAR, Quotation Marks ইত্যাদি। এগুলো ব্যবহার করে সার্চ কোয়্যারিকে অনেক রিফাইন করা যায়। কোন কোন সার্চ ইঞ্জিনে বিল্টইন বুলিয়ান সাপোর্ট থাকে, কোন কোনটিতে আবার বুলিয়ান ইগনোর করে।

ভবিষ্যতের সার্চ:
যতই দিন যাচ্ছে ততই সার্চ ইঞ্জিন কৌশল আরো নিখুঁত হচ্ছে। এখনও অনেক সার্চ ইঞ্জিন যে সার্চ রেজাল্ট প্রদান করে থাকে তার ভিতরে প্রচুর রেজাল্ট পাবেন যা আপনার প্রয়োজনীয় বিষয়ের নয়। গবেষণা চলছে কিভাবে এই সীমাবদ্ধগুলো দূর করা যায়। একই শব্দের অনেকগুলো মানে থাকার কারনেও এই ধরনের বিপত্তি দেখা দেয় সার্চ করার সময়ে।

কনসেপ্ট বেইজড সার্চিং নামের একটি কৌশলের উপরে ভবিষ্যতে ওয়েবসার্চ জোর দেওয়া হবে বলে বিশেষজ্ঞরা মনে করছেন। এক্ষেত্রে স্ট্যাটিস্টিক্যাল এনালাইসিস প্রয়োগের কথা চিন্তা করা হচ্ছে যেসব ওয়েবপেইজ পাওয়া যাবে তার উপরে। যার ফলে সঠিক ওয়েবসাইট বের করার সম্ভাবনাকে আরো বাড়ানো যাবে। আরেকটি দল অবশ্য চেষ্টা চালাচ্ছে কিভাবে পারফর্মেন্স এবং রেজাল্ট একইসাথে বৃদ্ধি করা যায়। এছাড়া ন্যাচারাল-ল্যাঙ্গুয়েজ কোয়্যারী নামেও আরেকটি ক্ষেত্রে গবেষণা চলছে সার্চ ইঞ্জিন নিয়ে। এক্ষেত্রে আমরা সাধারনভাবে যেভাবে আরেকজনকে প্রশ্ন করি কোন বিষয় নিয়ে সেরকম কোয়্যারী দিয়ে সার্চ ইঞ্জিনকে ব্যবহার করার কথা চিন্তা করা হচ্ছে। এরকম একটি সার্চ ইঞ্জিন হলো www.askjeeves.com। ন্যাচারাল-ল্যাঙ্গুয়েজ কোয়্যারীর ফলে অনেক জটিল কোয়্যারীও সার্চ ইঞ্জিনকে দেওয়া সম্ভব।

গুরুত্বপূর্ণ কিছু সার্চ ইঞ্জিন:
Altavista www.altavista.com
Dogpile www.dogpile.com
Excite www.excite.com
Go www.go.com
Google www.google.com
HotBot www.hotbot.com
Looksmart www.looksmart.com
Lycos www.lycos.com
Mamma www.mamma.com
Web Crawler www.webcrawler.com
Yahoo www.yahoo.com


লেখকের নাম – সাদিক মোহাম্মদ আলম