ওপেন এআই গবলিন গ্লিচ মডেল প্রশিক্ষণে লুকানো ঝুঁকি প্রকাশ করে

ওপেন এআই গবলিন গ্লিচ মডেল প্রশিক্ষণে লুকানো ঝুঁকি প্রকাশ করে

ভেতরে একটা কৌতূহলী প্যাটার্ন তৈরি হতে লাগল OpenAIএর সর্বশেষ মডেল, যা প্রথম নজরে একটি নিরীহ কৌতুকের মতো লাগতে পারে। GPT-5.1 দিয়ে শুরু করে, প্রতিক্রিয়াগুলি গবলিন, গ্রেমলিন এবং অন্যান্য কাল্পনিক প্রাণীর উল্লেখের দিকে প্রবাহিত হতে শুরু করে। স্থানান্তর সূক্ষ্ম ছিল না. অভ্যন্তরীণ ট্র্যাকিং “গবলিন” এর রেফারেন্স দেখিয়েছে যে মডেলটি প্রকাশের পরে 175 শতাংশ বেড়েছে।

যা মজাদার দেখাল তা দ্রুত ঘনিষ্ঠভাবে যাচাই-বাছাই করে। প্রকৌশলীরা আচরণটিকে একটি নির্দিষ্ট ব্যক্তিত্বের স্তরে সনাক্ত করেছেন যা অভ্যন্তরীণভাবে “Nerdy” নামে পরিচিত, একটি শৈলীগত সমন্বয় যা প্রতিক্রিয়াগুলিকে আরও কৌতুকপূর্ণ এবং রূপক-চালিত করার জন্য ডিজাইন করা হয়েছে। এটি আউটপুটের একটি ছোট ভগ্নাংশের জন্য দায়ী, প্রায় 2.5 শতাংশ, তবুও এটি সমস্ত প্রাণীর রেফারেন্সের দুই-তৃতীয়াংশের জন্য দায়ী ছিল।

ভারসাম্যহীনতা একটি গভীর উদ্বেগ উত্থাপন. প্রশিক্ষণের সময়, সিস্টেমটি পছন্দের প্রতিক্রিয়াগুলিকে শক্তিশালী করতে পুরষ্কার সংকেতের উপর নির্ভর করে। এই ক্ষেত্রে, সেই সংকেতগুলি অনিচ্ছাকৃতভাবে ভাষাকে পছন্দ করে যা বাতিক রূপকের উপর ঝুঁকে পড়ে। একবার শক্তিশালী হয়ে গেলে, প্যাটার্নটি তার মূল সীমানার বাইরে প্রচার শুরু করে। একটি কুলুঙ্গি শৈলীগত বৈশিষ্ট্য হিসাবে যা শুরু হয়েছিল তা নিঃশব্দে বৃহত্তর মডেল আচরণের মধ্যে ছড়িয়ে পড়ে।

ওপেন এআই গবলিন গ্লিচ মডেল প্রশিক্ষণে লুকানো ঝুঁকি প্রকাশ করে

উন্নয়নের অগ্রগতির সাথে সাথে সমস্যাটি নিয়ন্ত্রণ করা কঠিন হয়ে উঠেছে। GPT-5.5 প্রশিক্ষণে প্রবেশ করার সময়, অন্তর্নিহিত ডেটা ইতিমধ্যে পক্ষপাতকে শুষে নিয়েছে। একটি সহজ অনুরোধ অপ্রত্যাশিত ফলাফল ট্রিগার করতে পারে. একটি উদাহরণ ASCII শিল্পে রেন্ডার করা একটি ইউনিকর্নের জন্য একটি প্রম্পট জড়িত, যা পরিবর্তে একটি গবলিনের মতো কিছু তৈরি করেছিল।

ওপেনএআই স্প্রেড ধারণ করতে সরানো হয়েছে। “Nerdy” ব্যক্তিত্ব মার্চ মাসে অক্ষম ছিল। প্রকৌশলীরা সমস্যাযুক্ত পুরষ্কার সংকেতটি সরিয়েছেন এবং প্রশিক্ষণের ডেটা থেকে প্রাণী-সম্পর্কিত নিদর্শনগুলি ফিল্টার করেছেন। কোডেক্সের মতো ইতিমধ্যে ব্যবহার করা সরঞ্জামগুলির জন্য, স্পষ্টভাবে প্রাসঙ্গিক না হলে গবলিন, গ্রেমলিন বা অনুরূপ চিত্রের রেফারেন্স প্রতিরোধ করার জন্য একটি সরাসরি নির্দেশ যুক্ত করা হয়েছিল।

এপিসোডটি একটি বিরল উইন্ডো অফার করে যে কীভাবে ভঙ্গুর মডেল আচরণ পৃষ্ঠের নিচে হতে পারে। ছোট প্রণোদনা, শৈলীগত কারণে প্রবর্তিত, প্রশিক্ষণের লুপে এম্বেড করা অপ্রত্যাশিত উপায়ে স্কেল করতে পারে। ব্যক্তিত্বের টিউনিং এর মতো দেখায় যদি চেক না করা হয় তবে তা কাঠামোগত পক্ষপাত হতে পারে।

ব্যবহারকারীদের জন্য, গবলিন গ্লিচটি একটি ছোটখাট বিভ্রান্তির মতো পড়তে পারে। প্রশিক্ষণ পাইপলাইনের ভিতরে, এটি আরও মৌলিক কিছু সংকেত দেয়। ভাষার মডেলের উপর নিয়ন্ত্রণ শুধুমাত্র ডেটা ভলিউম বা গণনার বিষয় নয়। এটি কীভাবে সূক্ষ্ম পছন্দগুলিকে সংজ্ঞায়িত, পুরস্কৃত করা এবং ছড়িয়ে দেওয়ার অনুমতি দেওয়া হয় তার উপর নির্ভর করে।

ঠিক এই সময় সোজা হতে পারে. পাঠ নয়।


iNews জুড়ে সর্বশেষ এবং সবচেয়ে প্রভাবশালী গল্প কভার করে
বিনোদন,
ব্যবসা,
খেলাধুলা,
রাজনীতিএবং
প্রযুক্তিএআই ব্রেকথ্রু থেকে বড় বৈশ্বিক উন্নয়ন পর্যন্ত। আমাদের বিশ্বের গঠন প্রবণতা সঙ্গে আপডেট থাকুন. সংবাদ টিপস, সম্পাদকীয় প্রতিক্রিয়া, বা পেশাদার অনুসন্ধানের জন্য, আমাদের ইমেল করুন
info@zoombangla.com.

সর্বশেষ খবর পান এবং ব্রেকিং নিউজ প্রথমে আমাদের অনুসরণ করে

গুগল সংবাদ,
টুইটার,
ফেসবুক,
টেলিগ্রাম
এবং আমাদের সদস্যতা
ইউটিউব চ্যানেল.

আপনার আছে vionix

Scroll to Top