চ্যাটজিপিটির, ছবিতে নিখুঁত লেখার নতুন সক্ষমতা অর্জন

শেয়ার করুন

ছবি:সংগৃহীত

কৃত্রিম বুদ্ধিমত্তাভিত্তিক ছবি তৈরির ক্ষেত্রে বড় পরিবর্তন এনেছে চ্যাটজিপিটির নতুন সংস্করণ। আগে যেখানে এআই তৈরি ছবিতে লেখার ভুল সহজেই চোখে পড়ত, এখন তা অনেকটাই নির্ভুল। নতুন মডেল এমনভাবে লেখা তৈরি করছে, যা সরাসরি ব্যবহারযোগ্য।
আগের সংস্করণে এই ধরনের বানান ভুল বেশি দেখা যেত। কারণ, ঐসব মডেল মূলত ডিফিউশন পদ্ধতিতে কাজ করত। এতে এলোমেলো নয়েজ থেকে ছবি পুনর্গঠন করা হয়। ফলে ছবির ভেতরের লেখা খুব ছোট অংশ হওয়ায় সেটিকে ঠিকভাবে শেখা কঠিন ছিল।
বিশেষজ্ঞদের মতে, ডিফিউশন মডেল পুরো ছবির প্যাটার্ন শেখায় বেশি গুরুত্ব দিত। লেখার মতো সূক্ষ্ম অংশ সেখানে গুরুত্ব কম পেত। তাই বানান ভুল বেশি দেখা যেত।
নতুন প্রজন্মের মডেলে গবেষকেরা অটো-রিগ্রেসিভ পদ্ধতির মতো প্রযুক্তি ব্যবহার করছেন। এই পদ্ধতিতে ছবির প্রতিটি অংশ কীভাবে হবে, তা ধাপে ধাপে অনুমান করে তৈরি করা হয়। এর কাজের ধরন অনেকটা ভাষা মডেলের মতো হওয়ায় লেখার নির্ভুলতা বেড়েছে।
তবে ‘ইমেজেস ২.০’ ঠিক কোন প্রযুক্তিতে তৈরি, সে বিষয়ে নির্মাতা প্রতিষ্ঠান বিস্তারিত জানায়নি। সাম্প্রতিক এক ব্রিফিংয়ে এ প্রশ্নের উত্তরও দেওয়া হয়নি।
আরও একটি গুরুত্বপূর্ণ অগ্রগতি হলো, এই মডেল ল্যাটিন ভাষা ছাড়াও অন্য ভাষায় লেখাও ভালোভাবে তৈরি করতে পারে। জাপানি, কোরিয়ান, হিন্দি এবং বাংলা ভাষার লেখাও আগের তুলনায় বেশি নির্ভুলভাবে তৈরি সম্ভব।
তবে মডেলের জ্ঞানভাণ্ডার ২০২৫ সালের ডিসেম্বর পর্যন্ত সীমিত। ফলে সাম্প্রতিক ঘটনাভিত্তিক ছবি তৈরিতে কিছু সীমাবদ্ধতা থাকতে পারে।
যদিও এই উন্নত সক্ষমতার কারণে ছবি তৈরি আগের তুলনায় কিছুটা সময় নেয়, তবু বহু ফ্রেমের জটিল কমিকও কয়েক মিনিটে তৈরি করা যাচ্ছে।
গতকাল (মঙ্গলবার) থেকে সব ব্যবহারকারী এই সুবিধা পাচ্ছেন। তবে অর্থপ্রদানকারী ব্যবহারকারীরা আরও উন্নত মানের ছবি তৈরি করতে পারবেন। পাশাপাশি ‘জিপিটি-ইমেজ-২’ নামে একটি প্রোগ্রামিং ইন্টারফেসও উন্মুক্ত করা হয়েছে, যেখানে খরচ নির্ভর করবে ছবির মান ও রেজল্যুশনের ওপর।