সমললৈ যাওক

ইমেজেন (টেক্সট-টু-ইমেজ মডেল)

অসমীয়া ৱিকিপিডিয়াৰ পৰা
ইমেজেন

সূৰ্যাস্তৰ সময়ত জিলিকি থকা নদীৰ পাৰত মেখেলা চাদৰ পৰিধান কৰা অসমীয়া লোককথাৰ নায়িকা তেজীমলা, কৃত্ৰিম বুদ্ধিমত্তাৰ দ্বাৰা নিৰ্মিত।
বিকাশক গুগল ডিপমাইণ্ড
প্ৰথম মুক্তি মে' ২০২২; ৩ বছৰ  আগতে (2022-05)
স্থিৰ মুক্তি ইমেজেন ৪ / ২০ মে' ২০২৫; ১০ মাহ আগত (2025-05-20)
প্ৰকাৰ টেক্সট-টু-ইমেজ মডেল
ৱেবছাইট ইমেজেন ৱেবছাইট

ইমেজেন হৈছে গুগল ডিপমাইণ্ডদ্বাৰা বিকশিত টেক্সট-টু-ইমেজ মডেলসমূহৰ এটা শৃংখল। ২০২৩ এপ্ৰিলত ডিপমাইণ্ডৰ সৈতে একত্ৰীকৰণ হোৱাৰ আগলৈকে ইয়াক গুগল ব্ৰেইনৰদ্বাৰা বিকশিত কৰা হৈছিল।[1] ইমেজেনৰ প্ৰধান ব্যৱহাৰ হৈছে টেক্সট প্ৰম্প্টৰপৰা ছবি সৃষ্টি কৰা, যি Stability AI-ৰ ষ্টেবল ডিফিউজন, OpenAI-ৰ DALL-E, বা মিডজাৰ্নিৰ দৰে। এই মডেলটোৰ মূল সংস্কৰণ প্ৰথমে ২০২২ চনৰ মে’ মাহত প্ৰকাশিত এখন বৈজ্ঞানিক প্ৰবন্ধত আলোচনা কৰা হৈছিল।[2] এই সঁজুলিয়ে উচ্চ-মানৰ ছবি সৃষ্টি কৰে আৰু গুগল একাউণ্ট থকা সকলো ব্যৱহাৰকাৰীৰ বাবে জিমিনি (চাটবট), ImageFX, আৰু Vertex AI-ৰ জৰিয়তে উপলব্ধ হয়।[3]

ইমেজেনৰ প্ৰথম সংস্কৰণ ২০২২ চনৰ মে’ মাহত প্ৰকাশিত এটা প্ৰবন্ধত পেশ কৰা হৈছিল। ইয়াত প্ৰাকৃতিক ভাষাৰপৰা উচ্চ-মানৰ ছবি সৃষ্টি কৰাৰ ক্ষমতা আছিল।[2] দ্বিতীয় সংস্কৰণ ইমেজেন ২ ২০২৩ চনৰ ডিচেম্বৰত মুক্তি পায়।[4] ইয়াৰ বিশেষ বৈশিষ্ট্য আছিল টেক্সট আৰু লোগো সৃষ্টি।[5] ইমেজেন ৩ ২০২৪ চনৰ আগষ্টত মুক্তি পায়।[6] গুগলে দাবী কৰিছিল যে নতুন সংস্কৰণত ছবিৰ বিস্তাৰিত আৰু আলোকৰ মান উন্নত কৰা হৈছে।[7] ২০২৫ চনৰ ২০ মে’ তাৰিখে Google I/O 2025-ত ইমেজেন ৪ মুক্তি পায়।[8]

প্ৰযুক্তি

[সম্পাদনা কৰক]

ইমেজেনে দুটা মুখ্য প্ৰযুক্তি ব্যৱহাৰ কৰে। প্ৰথমটো হৈছে ট্ৰান্সফৰ্মাৰ-ভিত্তিক বৃহৎ ভাষা মডেল, বিশেষকৈ T5, যাৰদ্বাৰা টেক্সট বুজি লয় আৰু ইমেজ সংশ্লেষণৰ বাবে এনক’ড কৰে। দ্বিতীয়টো হৈছে স্তৰভিত্তিক ডিফিউজন মডেল, যাৰদ্বাৰা উচ্চ-মানৰ ছবি সৃষ্টি হয়। ই তিনিটা পৰ্যায়ত ছবি সৃষ্টি কৰে: প্ৰথমে 64x64, তাৰপাছত 256x256 আৰু শেষত 1024x1024লৈ আপস্কেল কৰা হয়।[2]

ইমেজেনে টেক্সট প্ৰম্প্টৰপৰা ফটো-বাস্তৱ ছবি সৃষ্টি কৰিব পাৰে।[3] ই বিভিন্ন ধৰণৰ শৈলী সৃষ্টি কৰিব পাৰে, যেনে সিনেমাটিক, 35mm ফিল্ম, ইলাষ্ট্ৰেচন, আৰু সুৰ্ৰিয়েল। আন টেক্সট-টু-ইমেজ মডেলৰ দৰে য়ো মানুহৰ আঙুলি, লিখনী, এম্বিগ্ৰাম আৰু টাইপোগ্ৰাফীৰ ক্ষেত্ৰত অসুবিধা ভোগে।

মডেলটোৱে পাঁচটা অনুপাতত ছবি সৃষ্টি কৰিব পাৰে: 9:16, 3:4, 1:1, 4:3, আৰু 16:9। লগতে, ই আগতে সৃষ্টি কৰা ছবিসমূহ প্ৰম্প্ট সম্পাদনা কৰি পুনৰ উন্নত কৰিবও পাৰে।[7]

তথ্যসূত্ৰ

[সম্পাদনা কৰক]
  1. Roth, Emma; Peters, Jay (April 20, 2023). "Google's big AI push will combine Brain and DeepMind into one team". The Verge. https://www.theverge.com/2023/4/20/23691468/google-ai-deepmind-brain-merger। আহৰণ কৰা হৈছে: March 18, 2025. 
  2. 2.0 2.1 2.2 Saharia, Chitwan; Chan, William; Saxena, Saurabh; Li, Lala; Whang, Jay; Denton, Emily; Seyed Kamyar Seyed Ghasemipour; Burcu Karagol Ayan; Sara Mahdavi, S.; Rapha Gontijo Lopes; Salimans, Tim; Ho, Jonathan; David J Fleet; Norouzi, Mohammad (2022). "Photorealistic Text-to-Image Diffusion Models with Deep Language Understanding". arXiv:2205.11487Freely accessible [cs.CV]. 
  3. 3.0 3.1 Peterson, Jake (2024-08-16). "Anyone With a Google Account Can Try Google's Latest AI Image Generator Right Now" (en ভাষাত). Lifehacker. https://lifehacker.com/tech/you-can-try-googles-latest-ai-image-generator-right-now। আহৰণ কৰা হৈছে: 2025-03-18. 
  4. "Imagen 2 - our most advanced text-to-image technology" (en ভাষাত). Google DeepMind. 2025-03-12. https://deepmind.google/technologies/imagen-2/। আহৰণ কৰা হৈছে: 2025-03-18. 
  5. Wiggers, Kyle (2023-12-13). "Google debuts Imagen 2 with text and logo generation" (en-US ভাষাত). TechCrunch. https://techcrunch.com/2023/12/13/google-debuts-imagen-2-with-text-and-logo-generation/। আহৰণ কৰা হৈছে: 2025-03-18. 
  6. Schoon, Ben (2024-08-16). "Google opens access to Imagen 3, its latest model for AI image generation" (en-US ভাষাত). 9to5Google. https://9to5google.com/2024/08/16/google-imagen-3-launch/. 
  7. 7.0 7.1 "Some of the most realistic AI images you'll see were created with this free tool" (en ভাষাত). TechRadar. 2025-02-26. https://www.techradar.com/computing/artificial-intelligence/what-is-imagen-3-everything-you-need-to-know-about-googles-text-to-image-model। আহৰণ কৰা হৈছে: 2025-03-18. 
  8. "Imagen 4 is Google’s newest AI image generator" (en ভাষাত). techcrunch.com. 2025-05-20. https://techcrunch.com/2025/05/20/imagen-4-is-googles-newest-ai-image-generator/। আহৰণ কৰা হৈছে: 2025-03-18. 

বাহ্যিক সংযোগ

[সম্পাদনা কৰক]