ChatGPT কি গুগলের চেয়ে মানব গ্রন্থাগারিকের কাছাকাছি?

চিত্রণ: ফোনলামই ছবি (শাটারস্টক)

তথ্য অ্যাক্সেস এবং পুনরুদ্ধারের বিশিষ্ট মডেল সার্চ ইঞ্জিনের আদর্শ হয়ে ওঠার আগে – গ্রন্থাগারিক এবং বিষয় বা অনুসন্ধান বিশেষজ্ঞরা প্রাসঙ্গিক তথ্য প্রদান করে – ছিল ইন্টারেক্টিভ, ব্যক্তিগতকৃত, স্বচ্ছ এবং কর্তৃত্বপূর্ণ। সার্চ ইঞ্জিনগুলি হল প্রাথমিক উপায় যা বেশিরভাগ লোকেরা আজকাল তথ্য অ্যাক্সেস করে, তবে কয়েকটি কীওয়ার্ড প্রবেশ করানো এবং কিছু অপরিচিত ফাংশন দ্বারা সাজানো ফলাফলের তালিকা পাওয়া আদর্শ নয়।

একটি নতুন প্রজন্মের কৃত্রিম বুদ্ধিমত্তা ভিত্তিক তথ্য অ্যাক্সেস সিস্টেম, মাইক্রোসফ্ট সহ Bing/ChatGPT, গুগল/বার্ট এবং মেটা/লামা, সার্চ ইনপুট এবং আউটপুটের প্রথাগত সার্চ ইঞ্জিন মোডকে তার মাথায় ঘুরিয়ে দেয়। এই সিস্টেমগুলি সম্পূর্ণ বাক্য এবং এমনকি অনুচ্ছেদগুলিকে ইনপুট হিসাবে গ্রহণ করতে এবং প্রাকৃতিক ভাষায় ব্যক্তিগতকৃত প্রতিক্রিয়া তৈরি করতে সক্ষম।

প্রথম নজরে, এটি উভয় জগতের সেরা বলে মনে হতে পারে: ওয়েবে জ্ঞানের প্রশস্ততা এবং গভীরতার সাথে মিলিত ব্যক্তিগতকৃত এবং উপযোগী উত্তর। কিন্তু একজন গবেষক হিসেবে কে অনুসন্ধান এবং সুপারিশ সিস্টেম অধ্যয়নআমি বিশ্বাস করি ছবিটি সেরা মিশ্রিত।

চ্যাটজিপিটি এবং বার্ডের মতো এআই সিস্টেমগুলি বড় ভাষা মডেলের উপর নির্মিত। একটি ভাষা মডেল হল একটি মেশিন লার্নিং কৌশল যা প্যাটার্ন শিখতে উইকিপিডিয়া এবং পাবমেড নিবন্ধের মতো প্রচুর পরিমাণে উপলব্ধ পাঠ্য ব্যবহার করে। সহজ কথায়, এই মডেলগুলি শব্দের একটি ক্রম বা বাক্য দিয়ে, পরবর্তীতে কোন শব্দটি আসার সম্ভাবনা সবচেয়ে বেশি তা নির্ধারণ করে। তারা সেটা করতে সক্ষম বাক্য, অনুচ্ছেদ এবং এমনকি পৃষ্ঠাগুলি তৈরি করুন যেটি একটি ব্যবহারকারীর প্রশ্নের সাথে মেলে। 14 মার্চ, 2023-এ, OpenAI প্রযুক্তির পরবর্তী প্রজন্মের GPT-4 ঘোষণা করেছিল, যা টেক্সট এবং ইমেজ ইনপুট উভয়ের সাথে কাজ করেএবং মাইক্রোসফ্ট এটি ঘোষণা করেছে কথোপকথন Bing GPT-4 এর উপর ভিত্তি করে.

’60 মিনিট’ ChatGPT-এর ভালো-মন্দের দিকে নজর দিয়েছে।

প্রচুর পরিমাণে টেক্সট, ফাইন টিউনিং এবং অন্যান্য মেশিন লার্নিং ভিত্তিক পদ্ধতির প্রশিক্ষণের জন্য ধন্যবাদ, এই ধরনের তথ্য পুনরুদ্ধার কৌশল বেশ কার্যকরভাবে কাজ করে। বৃহৎ ভাষা মডেল-ভিত্তিক সিস্টেমগুলি তথ্য প্রশ্নের উত্তর দেওয়ার জন্য ব্যক্তিগতকৃত উত্তর তৈরি করে। লোকেরা ফলাফলগুলিকে এতটাই চিত্তাকর্ষক বলে মনে করেছিল যে ChatGPT সেই মাইলফলকে পৌঁছতে TikTok যত সময় নেয় তার এক তৃতীয়াংশের মধ্যে 100 মিলিয়ন ব্যবহারকারী পৌঁছেছে। মানুষ এটি শুধুমাত্র উত্তর খুঁজে না, কিন্তু ব্যবহার করেছে রোগ নির্ণয় করা, খাদ্য পরিকল্পনা করুন এবং বিনিয়োগ সুপারিশ করা.

চ্যাটজিপিটি কভারেজ এবং এআই ‘হ্যালুসিনেশন’

যাইহোক, অপূর্ণতা প্রচুর আছে. প্রথমে বিবেচনা করুন ভাষার একটি বিশাল মডেলের কেন্দ্রস্থলে কী রয়েছে – একটি প্রক্রিয়া যার মাধ্যমে এটি শব্দগুলি এবং সম্ভবত তাদের অর্থগুলিকে সংযুক্ত করে। এটি একটি আউটপুট তৈরি করে যা প্রায়শই একটি বুদ্ধিমান উত্তরের মতো মনে হয়, তবে বড় ভাষা মডেল সিস্টেমগুলি প্রায় প্যারোটেড বিবৃতি তৈরি করতে পরিচিত প্রকৃত বোঝা ছাড়া। সুতরাং যখন এই ধরনের সিস্টেম থেকে উৎপন্ন আউটপুট চতুর বলে মনে হতে পারে, এটি নিছক অন্তর্নিহিত শব্দ নিদর্শনগুলির একটি প্রতিফলন যা এআই একটি উপযুক্ত প্রসঙ্গে খুঁজে পেয়েছে।

এই সীমাবদ্ধতা বড় ভাষা মডেল সিস্টেম উদ্ভাবন বা সংবেদনশীল করে তোলে “হ্যালুসিনেটরি” উত্তর. সিস্টেমগুলি একটি প্রশ্নের ভুল ভিত্তি বুঝতে এবং এখনও ভুল প্রশ্নের উত্তর দেওয়ার জন্য যথেষ্ট স্মার্ট নয়। 100 ডলারের বিলে মার্কিন প্রেসিডেন্টের কোন মুখ রয়েছে এমন প্রশ্ন করা হলে, চ্যাটজিপিটি বেঞ্জামিন ফ্রাঙ্কলিনকে না বুঝেই উত্তর দেয় যে ফ্র্যাঙ্কলিন কখনই রাষ্ট্রপতি ছিলেন না এবং যে $100 বিলে মার্কিন রাষ্ট্রপতির চিত্র রয়েছে তা ভুল।

সমস্যা হল যে এই সিস্টেমগুলি শুধুমাত্র 10% সময় ভুল হলেও, আপনি জানেন না কোনটি 10%। সিস্টেমের প্রতিক্রিয়াগুলিকে দ্রুত যাচাই করার ক্ষমতাও মানুষের নেই। এর কারণ এই সিস্টেমগুলির স্বচ্ছতার অভাব রয়েছে—তারা প্রকাশ করে না যে তারা কোন ডেটাতে প্রশিক্ষিত হয়েছে, তারা উত্তর খুঁজে পেতে কোন সংস্থানগুলি ব্যবহার করেছে বা কীভাবে সেই উত্তরগুলি তৈরি করা হয়েছে৷

উদাহরণস্বরূপ, আপনি ChatGPT কে উদ্ধৃতি সহ একটি প্রযুক্তিগত প্রতিবেদন লিখতে বলতে পারেন। কিন্তু প্রায়ই এই উদ্ধৃতি গঠন করে – বৈজ্ঞানিক নিবন্ধ এবং লেখকদের শিরোনাম “হ্যালুসিনেটিং”। সিস্টেমগুলিও তাদের উত্তরগুলির সঠিকতা যাচাই করে না। এটি ব্যবহারকারীর কাছে বৈধতা ছেড়ে দেয় এবং ব্যবহারকারীদের এটি করার অনুপ্রেরণা বা দক্ষতা নাও থাকতে পারে বা এমনকি AI এর প্রতিক্রিয়া চেক করার প্রয়োজনীয়তা স্বীকার করতে পারে না। চ্যাটজিপিটি জানে না কখন একটি প্রশ্নের অর্থ হয় না কারণ এটি কোন তথ্য জানে না।

AIsআকর্ষণীয় বিষয়বস্তু – এবং ট্রাফিক

যদিও স্বচ্ছতার অভাব ব্যবহারকারীদের জন্য ক্ষতিকারক হতে পারে, এটি মূল বিষয়বস্তুর লেখক, শিল্পী এবং নির্মাতাদের জন্যও অন্যায্য, যাদের কাছ থেকে সিস্টেমগুলি শিখেছে কারণ সিস্টেমগুলি তাদের উত্স প্রকাশ করতে বা অপর্যাপ্ত অ্যাট্রিবিউশন প্রদান করতে ব্যর্থ হয়৷ বেশিরভাগ ক্ষেত্রেই সৃষ্টিকর্তা ক্ষতিপূরণ বা জমা দেওয়া হয় না বা তাদের সম্মতি দেওয়ার সুযোগ দেওয়া হয়েছে।

এরও একটা অর্থনৈতিক দিক আছে। একটি সাধারণ সার্চ ইঞ্জিন পরিবেশে, ফলাফলগুলি সম্পদের লিঙ্ক সহ প্রদর্শিত হয়। এটি ব্যবহারকারীকে শুধুমাত্র উত্তর যাচাই করতে এবং সেই সংস্থানগুলিতে অ্যাট্রিবিউশন প্রদান করার অনুমতি দেয় না, কিন্তু সেই সাইটগুলির জন্য ট্রাফিক তৈরি করে. এই উত্সগুলির অনেকগুলি তাদের আয়ের জন্য এই ট্র্যাফিকের উপর নির্ভর করে। যেহেতু বড় ভাষার মডেল সিস্টেমগুলি সরাসরি উত্তর দেয়, কিন্তু তারা যে উত্সগুলি থেকে আঁকে তা নয়, আমি মনে করি সেই সাইটগুলি সম্ভবত তাদের আয়ের প্রবাহ হ্রাস দেখতে পাবে৷

বড় ভাষা মডেল সময় নিতে পারে দূরে শেখার এবং serendipity

অবশেষে, তথ্য অ্যাক্সেস করার এই নতুন উপায় মানুষকে নিরুৎসাহিত করতে পারে এবং তাদের শেখার সুযোগ কেড়ে নিতে পারে। একটি সাধারণ অনুসন্ধান প্রক্রিয়া ব্যবহারকারীদের তাদের তথ্যের প্রয়োজনের জন্য সম্ভাবনার পরিসীমা অন্বেষণ করতে দেয়, প্রায়শই তারা যা খুঁজছে তা কাস্টমাইজ করার জন্য তাদের অনুরোধ করে। এটা তাদের একটি প্রস্তাব শেখার সুযোগ সেখানে কী আছে এবং কীভাবে তথ্যের বিভিন্ন অংশ তাদের কাজগুলি সম্পন্ন করতে একে অপরের সাথে সংযুক্ত হয়। এবং এটা সম্ভব করে তোলে সুযোগ এনকাউন্টার বা serendipity.

এইগুলি অনুসন্ধানের অত্যন্ত গুরুত্বপূর্ণ দিক, কিন্তু যখন একটি সিস্টেম সংস্থানগুলি না দেখিয়ে বা ব্যবহারকারীকে একটি প্রক্রিয়ার মধ্য দিয়ে হেঁটে ফলাফলগুলি তৈরি করে, তখন এটি তাদের এই সম্ভাবনাগুলি হরণ করে।

বৃহৎ ভাষার মডেলগুলি তথ্যে অ্যাক্সেসের জন্য একটি বড় পদক্ষেপ, যা মানুষকে প্রাকৃতিক ভাষা-ভিত্তিক মিথস্ক্রিয়া করার উপায় দেয়, ব্যক্তিগতকৃত উত্তর তৈরি করে এবং উত্তর এবং প্যাটার্নগুলি আবিষ্কার করে যা একজন গড় ব্যবহারকারীর পক্ষে কল্পনা করা প্রায়শই কঠিন। কিন্তু তারা যেভাবে শিখে এবং উত্তর তৈরি করে তার কারণে তাদের গুরুতর সীমাবদ্ধতা রয়েছে। তাদের উত্তর হতে পারে ভুল, বিষাক্ত বা পক্ষপাতদুষ্ট.

যদিও অন্যান্য তথ্য অ্যাক্সেস সিস্টেমগুলিও এই সমস্যাগুলি থেকে ভুগতে পারে, বৃহৎ ভাষার মডেল সহ AI সিস্টেমগুলিতেও স্বচ্ছতার অভাব রয়েছে। আরও খারাপ, তাদের স্বাভাবিক ভাষা প্রতিক্রিয়া সাহায্য করতে পারে a বিশ্বাস এবং কর্তৃত্বের মিথ্যা অনুভূতি যা অজ্ঞাত ব্যবহারকারীদের জন্য বিপজ্জনক হতে পারে।

AI, chatbots এবং মেশিন লার্নিং এর ভবিষ্যত সম্পর্কে আরও জানতে চান? আমাদের সম্পূর্ণ কভারেজ দেখুন কৃত্রিম বুদ্ধিমত্তাঅথবা আমাদের গাইড ব্রাউজ করুন সেরা ফ্রি এআই আর্ট জেনারেটর এবং OpenAI এর ChatGPT সম্পর্কে আমরা যা জানি.


চেরাগ শাহতথ্য বিজ্ঞানের অধ্যাপক, ওয়াশিংটন বিশ্ববিদ্যালয়

এই নিবন্ধটি থেকে পুনঃপ্রকাশ করা হয়েছে কথোপকথোন ক্রিয়েটিভ কমন্স লাইসেন্সের অধীনে। পর এটা মূল নিবন্ধ.

By admin