MaGGIe প্রাকৃতিক ছবিতে চুল রেন্ডারিং এবং ইনস্ট্যান্স পৃথকীকরণে দক্ষতা প্রদর্শন করে, জটিল, বহু-ইনস্ট্যান্স পরিস্থিতিতে MGM এবং InstMatt-কে ছাড়িয়ে যায়।MaGGIe প্রাকৃতিক ছবিতে চুল রেন্ডারিং এবং ইনস্ট্যান্স পৃথকীকরণে দক্ষতা প্রদর্শন করে, জটিল, বহু-ইনস্ট্যান্স পরিস্থিতিতে MGM এবং InstMatt-কে ছাড়িয়ে যায়।

শক্তিশালী মাস্ক-গাইডেড ম্যাটিং: নয়েজি ইনপুট এবং অবজেক্ট বহুমুখিতা পরিচালনা

2025/12/21 02:00
2 মিনিটে পড়া যাবে
এই বিষয়বস্তু সম্পর্কে মতামত বা উদ্বেগ জানাতে, অনুগ্রহ করে আমাদের সাথে [email protected] ঠিকানায় যোগাযোগ করুন

সারসংক্ষেপ এবং ১. ভূমিকা

  1. সম্পর্কিত কাজসমূহ

  2. MaGGIe

    ৩.১. দক্ষ মাস্কড গাইডেড ইনস্ট্যান্স ম্যাটিং

    ৩.২. ফিচার-ম্যাট টেম্পোরাল কনসিস্টেন্সি

  3. ইনস্ট্যান্স ম্যাটিং ডেটাসেট

    ৪.১. ইমেজ ইনস্ট্যান্স ম্যাটিং এবং ৪.২. ভিডিও ইনস্ট্যান্স ম্যাটিং

  4. পরীক্ষা-নিরীক্ষা

    ৫.১. ইমেজ ডেটার উপর প্রি-ট্রেনিং

    ৫.২. ভিডিও ডেটার উপর ট্রেনিং

  5. আলোচনা এবং তথ্যসূত্র

\ সম্পূরক উপাদান

  1. আর্কিটেকচারের বিস্তারিত

  2. ইমেজ ম্যাটিং

    ৮.১. ডেটাসেট তৈরি এবং প্রস্তুতি

    ৮.২. ট্রেনিং বিস্তারিত

    ৮.৩. পরিমাণগত বিস্তারিত

    ৮.৪. প্রাকৃতিক ছবিতে আরো গুণগত ফলাফল

  3. ভিডিও ম্যাটিং

    ৯.১. ডেটাসেট তৈরি

    ৯.২. ট্রেনিং বিস্তারিত

    ৯.৩. পরিমাণগত বিস্তারিত

    ৯.৪. আরো গুণগত ফলাফল

৮.৪. প্রাকৃতিক ছবিতে আরো গুণগত ফলাফল

চিত্র ১৩ চ্যালেঞ্জিং পরিস্থিতিতে আমাদের মডেলের কর্মক্ষমতা প্রদর্শন করে, বিশেষত চুলের অঞ্চলগুলি সঠিকভাবে রেন্ডার করায়। আমাদের ফ্রেমওয়ার্ক ধারাবাহিকভাবে বিস্তারিত সংরক্ষণে MGM⋆ কে ছাড়িয়ে যায়, বিশেষত জটিল ইনস্ট্যান্স ইন্টারঅ্যাকশনে। InstMatt এর সাথে তুলনায়, আমাদের মডেল অস্পষ্ট অঞ্চলে উন্নত ইনস্ট্যান্স বিচ্ছেদ এবং বিস্তারিত নির্ভুলতা প্রদর্শন করে।

\ চিত্র ১৪ এবং চিত্র ১৫ একাধিক ইনস্ট্যান্স জড়িত চরম ক্ষেত্রে আমাদের মডেল এবং পূর্ববর্তী কাজের কর্মক্ষমতা চিত্রিত করে। যদিও MGM⋆ ঘন ইনস্ট্যান্স পরিস্থিতিতে শব্দ এবং নির্ভুলতার সাথে লড়াই করে, আমাদের মডেল উচ্চ নির্ভুলতা বজায় রাখে। InstMatt, অতিরিক্ত ট্রেনিং ডেটা ছাড়াই, এই জটিল সেটিংসে সীমাবদ্ধতা দেখায়।

\ আমাদের মাস্ক-গাইডেড পদ্ধতির দৃঢ়তা চিত্র ১৬ তে আরও প্রদর্শিত হয়েছে। এখানে, আমরা MGM ভ্যারিয়েন্ট এবং SparseMat মাস্ক ইনপুটে অনুপস্থিত অংশগুলি পূর্বাভাসে যে চ্যালেঞ্জগুলির সম্মুখীন হয় তা তুলে ধরি, যা আমাদের মডেল সমাধান করে। তবে, এটি লক্ষ করা গুরুত্বপূর্ণ যে আমাদের মডেল একটি হিউম্যান ইনস্ট্যান্স সেগমেন্টেশন নেটওয়ার্ক হিসাবে ডিজাইন করা হয়নি। চিত্র ১৭ তে দেখানো হয়েছে, আমাদের ফ্রেমওয়ার্ক ইনপুট গাইডেন্স মেনে চলে, একই মাস্কে একাধিক ইনস্ট্যান্স থাকলেও সুনির্দিষ্ট আলফা ম্যাট পূর্বাভাস নিশ্চিত করে।

\ পরিশেষে, চিত্র ১২ এবং চিত্র ১১ আমাদের মডেলের সাধারণীকরণ ক্ষমতার উপর জোর দেয়। মডেলটি পটভূমি থেকে মানব বিষয় এবং অন্যান্য বস্তু উভয়ই সঠিকভাবে নিষ্কাশন করে, বিভিন্ন পরিস্থিতি এবং অবজেক্ট টাইপ জুড়ে এর বহুমুখিতা প্রদর্শন করে।

\ সমস্ত উদাহরণ হল ইন্টারনেট ছবি গ্রাউন্ড-ট্রুথ ছাড়া এবং r101fpn400e থেকে মাস্ক গাইডেন্স হিসাবে ব্যবহার করা হয়েছে।

\ চিত্র ১৩. আমাদের মডেল প্রাকৃতিক ছবিতে অত্যন্ত বিস্তারিত আলফা ম্যাট তৈরি করে। আমাদের ফলাফল দেখায় যে এটি ব্যয়বহুল কম্পিউটেশনাল খরচ ছাড়াই পূর্ববর্তী ইনস্ট্যান্স-অজ্ঞেয়বাদী এবং ইনস্ট্যান্স-সচেতনতা পদ্ধতিগুলির সাথে সঠিক এবং তুলনীয়। লাল বর্গ প্রতিটি ইনস্ট্যান্সের জন্য বিস্তারিত অঞ্চলগুলি জুম করে। (রঙিন এবং ডিজিটাল জুমে সর্বোত্তম দেখা যায়)।

\ চিত্র ১৪. আমাদের ফ্রেমওয়ার্ক অনেক ইনস্ট্যান্স সহ চরম ক্ষেত্রে সুনির্দিষ্টভাবে ইনস্ট্যান্সগুলি আলাদা করে। যদিও MGM প্রায়ই ইনস্ট্যান্সগুলির মধ্যে ওভারল্যাপিং ঘটায় এবং MGM⋆ শব্দ ধারণ করে, আমাদের বাহ্যিক ডেটাসেটে প্রশিক্ষিত InstMatt এর সাথে সমান ফলাফল তৈরি করে। লাল তীর ত্রুটি নির্দেশ করে। (রঙিন এবং ডিজিটাল জুমে সর্বোত্তম দেখা যায়)।

\ চিত্র ১৫. আমাদের ফ্রেমওয়ার্ক একক পাসে সুনির্দিষ্টভাবে ইনস্ট্যান্সগুলি আলাদা করে। প্রস্তাবিত সমাধান পূর্বাভাস/পরিমার্জন পাঁচবার চালানো ছাড়াই InstMatt এবং MGM এর সাথে তুলনীয় ফলাফল দেখায়। লাল তীর ত্রুটি নির্দেশ করে। (রঙিন এবং ডিজিটাল জুমে সর্বোত্তম দেখা যায়)।

\ চিত্র ১৬. MGM এবং SparseMat থেকে ভিন্ন, আমাদের মডেল ইনপুট গাইডেন্স মাস্কে দৃঢ়। অ্যাটেনশন হেড সহ, আমাদের মডেল InstMatt এর মতো ইনস্ট্যান্সগুলির মধ্যে জটিল পরিমার্জন ছাড়াই মাস্ক ইনপুটগুলিতে আরও স্থিতিশীল ফলাফল তৈরি করে। লাল তীর ত্রুটি নির্দেশ করে। (রঙিন এবং ডিজিটাল জুমে সর্বোত্তম দেখা যায়)।

\ চিত্র ১৭. আমাদের সমাধান মাল্টি-ইনস্ট্যান্স মাস্ক গাইডেন্সের সাথে সঠিকভাবে কাজ করে। যখন একটি গাইডেন্স মাস্কে একাধিক ইনস্ট্যান্স বিদ্যমান থাকে, আমরা এখনও সেই ইনস্ট্যান্সগুলির জন্য সঠিক ইউনিয়ন আলফা ম্যাট তৈরি করি। লাল তীর ত্রুটি বা লাল বক্সে জুম-ইন অঞ্চল নির্দেশ করে। (রঙিন এবং ডিজিটাল জুমে সর্বোত্তম দেখা যায়)।

\ সারণি ১২. HIM2K+M-HIM2K এ পরিমাণগত ফলাফলের বিস্তারিত (সারণি ৫ এর সম্প্রসারণ)। ধূসর পুনরায় প্রশিক্ষণ ছাড়াই পাবলিক ওয়েট নির্দেশ করে।

\ সারণি ১২. HIM2K+M-HIM2K এ পরিমাণগত ফলাফলের বিস্তারিত (সারণি ৫ এর সম্প্রসারণ)। ধূসর পুনরায় প্রশিক্ষণ ছাড়াই পাবলিক ওয়েট নির্দেশ করে। (অব্যাহত)

\ সারণি ১২. HIM2K+M-HIM2K এ পরিমাণগত ফলাফলের বিস্তারিত (সারণি ৫ এর সম্প্রসারণ)। ধূসর পুনরায় প্রশিক্ষণ ছাড়াই পাবলিক ওয়েট নির্দেশ করে। (অব্যাহত)

\ সারণি ১২. HIM2K+M-HIM2K এ পরিমাণগত ফলাফলের বিস্তারিত (সারণি ৫ এর সম্প্রসারণ)। ধূসর পুনরায় প্রশিক্ষণ ছাড়াই পাবলিক ওয়েট নির্দেশ করে। (অব্যাহত)

\ সারণি ১৩. V-HIM60 এ প্রস্তাবিত টেম্পোরাল কনসিস্টেন্সি মডিউলের কার্যকারিতা (সারণি ৬ এর সম্প্রসারণ)। দ্বি-দিকীয় Conv-GRU এবং ফরওয়ার্ড-ব্যাকওয়ার্ড ফিউশনের সংমিশ্রণ তিনটি টেস্ট সেটে সর্বোত্তম সামগ্রিক কর্মক্ষমতা অর্জন করে। বোল্ড প্রতিটি স্তরের জন্য সেরা হাইলাইট করে।

\

:::info লেখকগণ:

(১) চুয়ং হুইন, ইউনিভার্সিটি অফ মেরিল্যান্ড, কলেজ পার্ক ([email protected]);

(২) সেউং উগ ও, অ্যাডোব রিসার্চ (seoh,[email protected]);

(৩) অভিনব শ্রীবাস্তব, ইউনিভার্সিটি অফ মেরিল্যান্ড, কলেজ পার্ক ([email protected]);

(৪) জুন-ইয়াং লি, অ্যাডোব রিসার্চ ([email protected])।

:::


:::info এই গবেষণাপত্রটি CC by 4.0 Deed (Attribution 4.0 International) লাইসেন্সের অধীনে arxiv এ উপলব্ধ

:::

\

ডিসক্লেইমার: এই সাইটে পুনঃপ্রকাশিত নিবন্ধগুলো সর্বসাধারণের জন্য উন্মুক্ত প্ল্যাটফর্ম থেকে সংগ্রহ করা হয়েছে এবং শুধুমাত্র তথ্যের উদ্দেশ্যে প্রদান করা হয়েছে। এগুলো আবশ্যিকভাবে MEXC-এর মতামতকে প্রতিফলিত করে না। সমস্ত অধিকার মূল লেখকদের কাছে সংরক্ষিত রয়েছে। আপনি যদি মনে করেন কোনো কনটেন্ট তৃতীয় পক্ষের অধিকার লঙ্ঘন করেছে, তাহলে অনুগ্রহ করে অপসারণের জন্য [email protected] এ যোগাযোগ করুন। MEXC কনটেন্টের সঠিকতা, সম্পূর্ণতা বা সময়োপযোগিতা সম্পর্কে কোনো গ্যারান্টি দেয় না এবং প্রদত্ত তথ্যের ভিত্তিতে নেওয়া কোনো পদক্ষেপের জন্য দায়ী নয়। এই কনটেন্ট কোনো আর্থিক, আইনগত বা অন্যান্য পেশাদার পরামর্শ নয় এবং এটি MEXC-এর সুপারিশ বা সমর্থন হিসেবে গণ্য করা উচিত নয়।

আপনি আরও পছন্দ করতে পারেন

নতুন ক্রিপ্টো Mutuum Finance ২০২৫ সাল থেকে ৮৫০M MUTM টোকেন বিক্রয় এবং ১৯K হোল্ডারের রিপোর্ট করেছে

নতুন ক্রিপ্টো Mutuum Finance ২০২৫ সাল থেকে ৮৫০M MUTM টোকেন বিক্রয় এবং ১৯K হোল্ডারের রিপোর্ট করেছে

এখন কেনার জন্য সেরা ক্রিপ্টো খোঁজা ক্রমবর্ধমানভাবে প্রাথমিক পর্যায়ের প্রকল্পগুলির দিকে স্থানান্তরিত হচ্ছে যা মূলধারায় আসার আগে প্রকৃত আকর্ষণ দেখায়। ২০২৬ সালে, বিনিয়োগকারীরা
শেয়ার করুন
Techbullion2026/04/05 19:50
কীভাবে ৮০M USR দ্রুত মিন্ট করা হয়েছিল

কীভাবে ৮০M USR দ্রুত মিন্ট করা হয়েছিল

পোস্ট How 80M USR Was Minted Fast BitcoinEthereumNews.com-এ প্রকাশিত হয়েছে। Resolv জানিয়েছে যে আক্রমণকারীরা 80M USR মিন্ট করেছে এবং সেবা বন্ধ হওয়ার আগে প্রায় $25M ETH উত্তোলন করেছে
শেয়ার করুন
BitcoinEthereumNews2026/04/05 20:14
ড্রিফট প্রোটোকলের $২৮৫ মিলিয়ন ডলার হেইস্ট শুরু হয়েছিল একটি হ্যান্ডশেক এবং ৬ মাসের বিশ্বাস দিয়ে

ড্রিফট প্রোটোকলের $২৮৫ মিলিয়ন ডলার হেইস্ট শুরু হয়েছিল একটি হ্যান্ডশেক এবং ৬ মাসের বিশ্বাস দিয়ে

ড্রিফট প্রোটোকলের $285 মিলিয়ন হিস্ট একটি হ্যান্ডশেক এবং 6 মাসের বিশ্বাস দিয়ে শুরু হয়েছিল পোস্টটি BitcoinEthereumNews.com-এ প্রকাশিত হয়েছে। Drift Protocol (DRIFT) প্রকাশ করেছে
শেয়ার করুন
BitcoinEthereumNews2026/04/05 20:15

24/7 লাইভ নিউজ

আরও

$30,000 in PRL + 15,000 USDT

$30,000 in PRL + 15,000 USDT$30,000 in PRL + 15,000 USDT

Deposit & trade PRL to boost your rewards!