সাইকোমেট্রিক কৃত্রিম সাধারণ বুদ্ধিমত্তার পক্ষে যুক্তি

1. সূচিপত্র

2. ভূমিকা
3. মূল অন্তর্দৃষ্টি: সাইকোমেট্রিক দৃষ্টান্ত পরিবর্তন
4. যৌক্তিক প্রবাহ: সংকীর্ণ AI থেকে সাধারণ বুদ্ধিমত্তা
5. শক্তি ও ত্রুটি: AGI পরীক্ষার সমালোচনামূলক মূল্যায়ন
6. কার্যকরী অন্তর্দৃষ্টি: ভবিষ্যৎ দিকনির্দেশনা
7. প্রযুক্তিগত বিবরণ এবং গাণিতিক সূত্রায়ন
8. পরীক্ষামূলক ফলাফল এবং বেঞ্চমার্ক বিশ্লেষণ
9. বিশ্লেষণাত্মক কাঠামো: ARC-এর কেস স্টাডি
10. ভবিষ্যৎ প্রয়োগ এবং দৃষ্টিভঙ্গি
11. মূল বিশ্লেষণ এবং মন্তব্য
12. তথ্যসূত্র

2. ভূমিকা

মার্ক ম্যাকফারসন (বোর্নমাউথ বিশ্ববিদ্যালয়, 2020) রচিত "সাইকোমেট্রিক কৃত্রিম সাধারণ বুদ্ধিমত্তার পক্ষে যুক্তি" শীর্ষক গবেষণাপত্রটি কৃত্রিম সাধারণ বুদ্ধিমত্তা (AGI) পরিমাপের জন্য বিদ্যমান বেঞ্চমার্ক এবং পরীক্ষাগুলির একটি সমালোচনামূলক পর্যালোচনা উপস্থাপন করে। লেখক যুক্তি দেন যে বর্তমান AI সিস্টেমগুলি, গো, স্টারক্রাফ্ট এবং চিকিৎসা নির্ণয়ের মতো সংকীর্ণ ক্ষেত্রে অতিমানবীয় কর্মক্ষমতা অর্জন করলেও, মানব বুদ্ধিমত্তার অভিযোজনযোগ্যতা এবং সাধারণীকরণ ক্ষমতার অভাব রয়েছে। মূল প্রতিপাদ্য হল যে সাইকোমেট্রিক পদ্ধতি, বিশেষ করে চোলেটের প্রস্তাবিত অ্যাবস্ট্রাকশন অ্যান্ড রিজনিং কর্পাস (ARC), AGI সনাক্তকরণ এবং পরিমাপের জন্য সবচেয়ে প্রতিশ্রুতিশীল পথ প্রদান করে।

3. মূল অন্তর্দৃষ্টি: সাইকোমেট্রিক দৃষ্টান্ত পরিবর্তন

এই গবেষণাপত্রের মৌলিক অন্তর্দৃষ্টি হল যে AGI পরিমাপের জন্য কাজ-নির্দিষ্ট বেঞ্চমার্ক থেকে সাইকোমেট্রিক কাঠামোতে একটি দৃষ্টান্ত পরিবর্তন প্রয়োজন যা সাধারণ জ্ঞানীয় ক্ষমতা মূল্যায়ন করে। লেখক যুক্তি দেন যে ঐতিহ্যবাহী AI বেঞ্চমার্ক (যেমন, গেম খেলা, চিত্র শ্রেণীবিভাগ) অপর্যাপ্ত কারণ তারা সাধারণ বুদ্ধিমত্তার পরিবর্তে সংকীর্ণ, ডোমেইন-নির্দিষ্ট কর্মক্ষমতা পরিমাপ করে। মানব বুদ্ধিমত্তা পরীক্ষা দ্বারা অনুপ্রাণিত সাইকোমেট্রিক পদ্ধতি, কাজ-নির্দিষ্ট প্রশিক্ষণ ছাড়াই বিভিন্ন ডোমেইন জুড়ে নতুন সমস্যা সমাধানের ক্ষমতা পরিমাপের উপর দৃষ্টি নিবদ্ধ করে।

4. যৌক্তিক প্রবাহ: সংকীর্ণ AI থেকে সাধারণ বুদ্ধিমত্তা

গবেষণাপত্রটি একটি স্পষ্ট যৌক্তিক অগ্রগতি অনুসরণ করে:

সমস্যা চিহ্নিতকরণ: বর্তমান AI সিস্টেমগুলি সংকীর্ণ এবং ভঙ্গুর, পরিবেশ প্রশিক্ষণের শর্ত থেকে সামান্য বিচ্যুত হলে ব্যর্থ হয়।
AGI-এর সংজ্ঞা: সাধারণ বুদ্ধিমত্তাকে অসংখ্য ডোমেইন জুড়ে কাজ সম্পাদনের ক্ষমতা হিসাবে সংজ্ঞায়িত করা হয়, যার মধ্যে সৃষ্টির সময় অজানা কাজগুলিও অন্তর্ভুক্ত।
বিদ্যমান পরীক্ষার পর্যালোচনা: লেখক মিখাইলোভস্কির প্রস্তাবিত ছয়টি পরীক্ষা (ব্যাখ্যা, সমস্যা-নির্ধারণ, খণ্ডন, নতুন ঘটনা পূর্বাভাস, ব্যবসা সৃষ্টি, তত্ত্ব সৃষ্টি) এবং চোলেটের ARC বেঞ্চমার্ক মূল্যায়ন করেন।
সমালোচনামূলক মূল্যায়ন: প্রতিটি পরীক্ষা সাধারণতা, বস্তুনিষ্ঠতা, মাপযোগ্যতা এবং প্রতারণা প্রতিরোধের মতো মানদণ্ডের বিরুদ্ধে মূল্যায়ন করা হয়।
সুপারিশ: সাইকোমেট্রিক পদ্ধতি, বিশেষ করে ARC, সবচেয়ে প্রতিশ্রুতিশীল দিক হিসাবে চিহ্নিত করা হয়েছে।

5. শক্তি ও ত্রুটি: AGI পরীক্ষার সমালোচনামূলক মূল্যায়ন

5.1 সাইকোমেট্রিক পদ্ধতির শক্তি

সাধারণতা: ARC কাজগুলির জন্য ডোমেইন-নির্দিষ্ট জ্ঞানের পরিবর্তে বিমূর্ত প্যাটার্ন সম্পর্কে যুক্তি প্রয়োজন।
বস্তুনিষ্ঠতা: কর্মক্ষমতা অদেখা কাজের সাফল্যের দ্বারা পরিমাপ করা হয়, যা পক্ষপাত হ্রাস করে।
মাপযোগ্যতা: ARC ডেটাসেটে 800টি কাজ রয়েছে, যা শক্তিশালী পরিসংখ্যানগত বিশ্লেষণের অনুমতি দেয়।

5.2 ত্রুটি এবং সীমাবদ্ধতা

মিখাইলোভস্কির পরীক্ষা: ব্যাখ্যা, তত্ত্ব সৃষ্টি এবং ব্যবসা সৃষ্টি পরীক্ষাগুলি অত্যধিক নৃতাত্ত্বিক এবং বস্তুনিষ্ঠভাবে স্বয়ংক্রিয় করা কঠিন। এগুলির জন্য মানব-স্তরের সৃজনশীলতা এবং বাস্তব-বিশ্বের মিথস্ক্রিয়া প্রয়োজন, যা AGI-এর জন্য প্রয়োজনীয় নাও হতে পারে।
ARC-এর সীমাবদ্ধতা: প্রতিশ্রুতিশীল হলেও, ARC প্রাথমিকভাবে চাক্ষুষ যুক্তির উপর দৃষ্টি নিবদ্ধ করে এবং বুদ্ধিমত্তার অন্যান্য মাত্রা (যেমন, সামাজিক, ভাষাগত, বা শারীরিক যুক্তি) ক্যাপচার করতে পারে না।
অস্থায়ী গতিশীলতার অভাব: বেশিরভাগ পরীক্ষা স্থির এবং সময়ের সাথে সাথে শেখা বা পরিবর্তিত পরিবেশের সাথে অভিযোজন মূল্যায়ন করে না।

6. কার্যকরী অন্তর্দৃষ্টি: ভবিষ্যৎ দিকনির্দেশনা

বিশ্লেষণের ভিত্তিতে, গবেষণাপত্রটি বেশ কয়েকটি কার্যকরী দিকনির্দেশনা প্রস্তাব করে:

হাইব্রিড বেঞ্চমার্ক তৈরি করুন: যুক্তি এবং অভিযোজন উভয়ই মূল্যায়ন করতে সাইকোমেট্রিক কাজগুলিকে গতিশীল, ইন্টারেক্টিভ পরিবেশের সাথে একত্রিত করুন।
একাধিক মোডালিটি অন্তর্ভুক্ত করুন: ভাষাগত, শ্রবণীয় এবং শারীরিক যুক্তি কাজগুলি অন্তর্ভুক্ত করতে ARC প্রসারিত করুন।
গঠনমূলক সাধারণীকরণের উপর ফোকাস করুন: এমন কাজ ডিজাইন করুন যার জন্য নতুন উপায়ে শেখা ধারণাগুলি একত্রিত করা প্রয়োজন, যা মানব বুদ্ধিমত্তার একটি মূল দিক।
প্রমিত প্রতিবেদন গ্রহণ করুন: বেঞ্চমার্কগুলি বৈজ্ঞানিকভাবে কঠোর তা নিশ্চিত করতে সাইকোমেট্রিক মেট্রিক্স (যেমন, নির্ভরযোগ্যতা, বৈধতা, আইটেম প্রতিক্রিয়া তত্ত্ব) ব্যবহার করুন।

7. প্রযুক্তিগত বিবরণ এবং গাণিতিক সূত্রায়ন

AGI পরিমাপের সাইকোমেট্রিক পদ্ধতি আইটেম রেসপন্স থিওরি (IRT) ব্যবহার করে আনুষ্ঠানিকভাবে উপস্থাপন করা যেতে পারে। ধরা যাক $\theta$ একটি এজেন্টের সুপ্ত সাধারণ বুদ্ধিমত্তা প্রতিনিধিত্ব করে। অসুবিধা $b_i$ এবং বৈষম্য $a_i$ সহ কাজ $i$ সঠিকভাবে সমাধানের সম্ভাবনা লজিস্টিক মডেল দ্বারা দেওয়া হয়:

$$P(X_i = 1 | \theta) = \frac{1}{1 + e^{-a_i(\theta - b_i)}}$$

ARC বেঞ্চমার্কের জন্য, প্রতিটি কাজ ইনপুট-আউটপুট গ্রিড জোড়া নিয়ে গঠিত। এজেন্টকে কয়েকটি উদাহরণ থেকে অন্তর্নিহিত রূপান্তর $f: \mathbb{Z}^{m \times n} \rightarrow \mathbb{Z}^{p \times q}$ অনুমান করতে হবে এবং এটি একটি নতুন ইনপুটে প্রয়োগ করতে হবে। কর্মক্ষমতা মেট্রিক হল ধরে রাখা কাজের নির্ভুলতা, কাজের অসুবিধা দ্বারা ওজনযুক্ত।

8. পরীক্ষামূলক ফলাফল এবং বেঞ্চমার্ক বিশ্লেষণ

গবেষণাপত্রটি মূল পরীক্ষা উপস্থাপন করে না তবে বিদ্যমান ফলাফলগুলি পর্যালোচনা করে। সাহিত্যের মূল ফলাফলগুলির মধ্যে রয়েছে:

ARC-তে মানব কর্মক্ষমতা: মানুষ ARC কাজগুলিতে প্রায় 80-90% নির্ভুলতা অর্জন করে, যা বেঞ্চমার্কের সম্ভাব্যতা প্রদর্শন করে।
AI কর্মক্ষমতা: বর্তমান অত্যাধুনিক AI সিস্টেমগুলি (2020 অনুযায়ী) ARC-তে 30% এর কম নির্ভুলতা অর্জন করে, যা সংকীর্ণ এবং সাধারণ বুদ্ধিমত্তার মধ্যে ব্যবধান তুলে ধরে।
অন্যান্য বেঞ্চমার্কের সাথে তুলনা: ARC AI-এর জন্য ঐতিহ্যবাহী IQ পরীক্ষার চেয়ে বেশি চ্যালেঞ্জিং কারণ এটির জন্য প্যাটার্ন ম্যাচিংয়ের পরিবর্তে প্রোগ্রাম-সদৃশ যুক্তি প্রয়োজন।

চিত্র 1: অসুবিধার স্তর (সহজ, মাঝারি, কঠিন) জুড়ে ARC কাজগুলিতে মানব বনাম AI কর্মক্ষমতা তুলনা করে একটি অনুমানমূলক বার চার্ট। মানুষ ধারাবাহিকভাবে AI-কে ছাড়িয়ে যায়, কঠিন কাজগুলিতে ব্যবধান আরও প্রশস্ত হয়।

9. বিশ্লেষণাত্মক কাঠামো: ARC-এর কেস স্টাডি

সাইকোমেট্রিক পদ্ধতি ব্যাখ্যা করার জন্য, একটি ARC কাজ বিবেচনা করুন যেখানে ইনপুটটি রঙিন কোষ সহ একটি 3x3 গ্রিড এবং আউটপুটটি একটি ভিন্ন প্যাটার্ন সহ একটি 3x3 গ্রিড। এজেন্টকে দুটি উদাহরণ থেকে নিয়মটি (যেমন, "প্যাটার্নটি ঘড়ির কাঁটার দিকে 90 ডিগ্রি ঘোরান") অনুমান করতে হবে এবং এটি একটি তৃতীয় ইনপুটে প্রয়োগ করতে হবে।

উদাহরণ কাজ:

ইনপুট 1: [[0,1,0],[1,0,1],[0,1,0]] → আউটপুট 1: [[0,1,0],[1,0,1],[0,1,0]] (কোনো পরিবর্তন নেই, প্রতিসাম্য)
ইনপুট 2: [[1,0,0],[0,1,0],[0,0,1]] → আউটপুট 2: [[0,0,1],[0,1,0],[1,0,0]] (বিপরীত কর্ণ বরাবর উল্টানো)
পরীক্ষা ইনপুট: [[0,0,1],[0,1,0],[1,0,0]] → প্রত্যাশিত আউটপুট: [[1,0,0],[0,1,0],[0,0,1]]

এই কাজটির জন্য এজেন্টকে রূপান্তর নিয়ম (বিপরীত কর্ণ বরাবর উল্টানো) চিনতে হবে এবং এটি একটি নতুন প্যাটার্নে প্রয়োগ করতে হবে। সাইকোমেট্রিক মান এই সত্যের মধ্যে নিহিত যে নিয়মটি বিমূর্ত এবং কোনো নির্দিষ্ট ডোমেইনের সাথে আবদ্ধ নয়।

10. ভবিষ্যৎ প্রয়োগ এবং দৃষ্টিভঙ্গি

AGI-তে সাইকোমেট্রিক পদ্ধতির বেশ কয়েকটি প্রতিশ্রুতিশীল প্রয়োগ রয়েছে:

AI নিরাপত্তা: সাইকোমেট্রিক বেঞ্চমার্কগুলি নতুন পরিস্থিতিতে সাধারণীকরণ পরীক্ষা করে AI সিস্টেমে অপ্রত্যাশিত ব্যর্থতা সনাক্ত করতে সাহায্য করতে পারে।
মানব-AI সহযোগিতা: একটি AI-এর জ্ঞানীয় প্রোফাইল (যেমন, চাক্ষুষ বনাম ভাষাগত যুক্তিতে শক্তি) বোঝা মানুষের সাথে দলগত কাজ উন্নত করতে পারে।
শিক্ষামূলক AI: সাইকোমেট্রিক কাঠামো AI টিউটরদের বিকাশে গাইড করতে পারে যা পৃথক শেখার শৈলীর সাথে খাপ খায়।
স্নায়ুবিজ্ঞান: সাইকোমেট্রিক কাজগুলিতে মানব এবং AI কর্মক্ষমতা তুলনা করা সাধারণ বুদ্ধিমত্তার স্নায়বিক ভিত্তির উপর আলোকপাত করতে পারে।

ভবিষ্যৎ দিকনির্দেশনার মধ্যে রয়েছে শক্তিবৃদ্ধি শিক্ষার পরিবেশের সাথে সাইকোমেট্রিক বেঞ্চমার্কগুলিকে একীভূত করা, এজেন্টের দক্ষতার স্তরের সাথে খাপ খায় এমন গতিশীল পরীক্ষা তৈরি করা এবং সংবেদনশীল পদ্ধতি জুড়ে যুক্তি মূল্যায়ন করে এমন বহু-মোডাল বেঞ্চমার্ক তৈরি করা।

11. মূল বিশ্লেষণ এবং মন্তব্য

গবেষণাপত্রটি AGI-তে সাইকোমেট্রিক পদ্ধতির জন্য একটি আকর্ষণীয় যুক্তি উপস্থাপন করে, তবে বেশ কয়েকটি সমালোচনামূলক পয়েন্ট যাচাইয়ের দাবি রাখে। প্রথমত, স্বর্ণ মান হিসাবে মানব-সদৃশ বুদ্ধিমত্তার উপর নির্ভরতা দার্শনিকভাবে প্রশ্নবিদ্ধ। বোস্ট্রোম (2014) "সুপারইন্টেলিজেন্স"-এ যেমন যুক্তি দিয়েছেন, AGI মানব জ্ঞানের থেকে গুণগতভাবে ভিন্ন বুদ্ধিমত্তার রূপ প্রদর্শন করতে পারে, যা নৃতাত্ত্বিক বেঞ্চমার্ককে সম্ভাব্যভাবে বিভ্রান্তিকর করে তোলে। দ্বিতীয়ত, ARC বেঞ্চমার্ক, মার্জিত হলেও, খুব সংকীর্ণ হতে পারে। লেক এট আল. (2017) "বিল্ডিং মেশিনস দ্যাট লার্ন অ্যান্ড থিংক লাইক পিপল"-এ যেমন উল্লেখ করেছেন, মানব বুদ্ধিমত্তার মধ্যে শুধু বিমূর্ত যুক্তি নয়, স্বজ্ঞাত পদার্থবিদ্যা, সামাজিক জ্ঞান এবং ভাষা বোঝাও জড়িত। একটি সত্যিকারের সাধারণ বুদ্ধিমত্তা বেঞ্চমার্কের এই মাত্রাগুলি অন্তর্ভুক্ত করা উচিত। তৃতীয়ত, গবেষণাপত্রটি প্রতিকূল পরীক্ষার সম্ভাবনাকে উপেক্ষা করে। গুডফেলো এট আল. (2014) মূল GAN গবেষণাপত্রে যেমন প্রদর্শন করেছেন, প্রতিকূল উদাহরণগুলি AI সিস্টেমের মৌলিক দুর্বলতা প্রকাশ করতে পারে যা মানক বেঞ্চমার্ক মিস করে। সাইকোমেট্রিক পরীক্ষায় প্রতিকূল উপাদান অন্তর্ভুক্ত করা সাধারণীকরণের আরও শক্তিশালী মূল্যায়ন প্রদান করতে পারে। পরিশেষে, পরিমাপের উপর গবেষণাপত্রের ফোকাস স্থাপত্যের পরিবর্তে একটি শক্তি, তবে এটি AGI কীভাবে তৈরি করতে হয় সেই প্রশ্নকে উপেক্ষা করার ঝুঁকি তৈরি করে। ইউডকোস্কি (2008) যেমন যুক্তি দেন, সারিবদ্ধকরণ সমস্যার জন্য AI সিস্টেমের অভ্যন্তরীণ প্রক্রিয়া বোঝার প্রয়োজন, শুধু তাদের বাহ্যিক আচরণ নয়। এই সীমাবদ্ধতা সত্ত্বেও, গবেষণাপত্রটি AGI মূল্যায়ন সম্পর্কে চিন্তা করার জন্য একটি মূল্যবান কাঠামো প্রদান করে এবং সঠিকভাবে কঠোর, সাইকোমেট্রিকভাবে বৈধ বেঞ্চমার্কের প্রয়োজনীয়তার উপর জোর দেয়।

12. তথ্যসূত্র

ম্যাকার্থি, জে., এট আল. (1956). কৃত্রিম বুদ্ধিমত্তার উপর ডার্টমাউথ গ্রীষ্মকালীন গবেষণা প্রকল্পের জন্য একটি প্রস্তাব।
সিলভার, ডি., এট আল. (2016). গভীর নিউরাল নেটওয়ার্ক এবং ট্রি সার্চের মাধ্যমে গো খেলায় দক্ষতা অর্জন। নেচার, 529(7587), 484-489।
ভিনিয়ালস, ও., এট আল. (2019). মাল্টি-এজেন্ট রিইনফোর্সমেন্ট লার্নিং ব্যবহার করে স্টারক্রাফ্ট II-তে গ্র্যান্ডমাস্টার স্তর। নেচার, 575(7782), 350-354।
ক্রিজেভস্কি, এ., এট আল. (2012). গভীর কনভোলিউশনাল নিউরাল নেটওয়ার্কের সাথে ইমেজনেট শ্রেণীবিভাগ। নিউরিপস।
ভাসওয়ানি, এ., এট আল. (2017). আপনার যা দরকার তা হল মনোযোগ। নিউরিপস।
এস্টেভা, এ., এট আল. (2017). গভীর নিউরাল নেটওয়ার্কের সাথে ত্বকের ক্যান্সারের চর্মরোগ বিশেষজ্ঞ-স্তরের শ্রেণীবিভাগ। নেচার, 542(7639), 115-118।
মার্কাস, জি. (2018). গভীর শিক্ষা: একটি সমালোচনামূলক মূল্যায়ন। arXiv:1801.00631।
সিয়ার্ল, জে. (1980). মন, মস্তিষ্ক এবং প্রোগ্রাম। আচরণগত এবং মস্তিষ্ক বিজ্ঞান, 3(3), 417-424।
থমসন, ডব্লিউ. (1889). জনপ্রিয় বক্তৃতা এবং ভাষণ।
অ্যাডামস, এস., এট আল. (2012). মানব-স্তরের কৃত্রিম সাধারণ বুদ্ধিমত্তার ভূদৃশ্য ম্যাপিং। AI ম্যাগাজিন, 33(1), 25-42।
গোয়ার্টজেল, বি. (2014). কৃত্রিম সাধারণ বুদ্ধিমত্তা: ধারণা, বর্তমান অবস্থা এবং ভবিষ্যৎ সম্ভাবনা। জার্নাল অফ আর্টিফিশিয়াল জেনারেল ইন্টেলিজেন্স, 5(1), 1-48।
ব্রিংসজর্ড, এস., এবং শিমানস্কি, বি. (2003). কৃত্রিম বুদ্ধিমত্তা কী? একটি উত্তর হিসাবে সাইকোমেট্রিক AI। আইজেসিএআই।
মিখাইলোভস্কি, এন. (2020). কৃত্রিম সাধারণ বুদ্ধিমত্তার জন্য ছয়টি পরীক্ষা। arXiv:2005.05718।
চোলেট, এফ. (2019). বুদ্ধিমত্তার পরিমাপ সম্পর্কে। arXiv:1911.01547।
বোস্ট্রোম, এন. (2014). সুপারইন্টেলিজেন্স: পথ, বিপদ, কৌশল। অক্সফোর্ড ইউনিভার্সিটি প্রেস।
লেক, বি. এম., এট আল. (2017). মেশিন তৈরি করা যা মানুষের মতো শেখে এবং চিন্তা করে। আচরণগত এবং মস্তিষ্ক বিজ্ঞান, 40, e253।
গুডফেলো, আই., এট আল. (2014). জেনারেটিভ অ্যাডভারসারিয়াল নেট। নিউরিপস।
ইউডকোস্কি, ই. (2008). বিশ্বব্যাপী ঝুঁকিতে ইতিবাচক এবং নেতিবাচক কারণ হিসাবে কৃত্রিম বুদ্ধিমত্তা। গ্লোবাল ক্যাটাস্ট্রফিক রিস্কস-এ, অক্সফোর্ড ইউনিভার্সিটি প্রেস।